Nev
02.02.2004, 12:53
Hi @ll
Ich habe wieder mal eine kleine Denkaufgabe:
Intelligenter DatenImport von CSV bzw. XML
Was ich drunter verstehe:
Der User hat einen Offline-Datenbestand und will diesen mit dem Online-Datenbestand abgleichen.
Er lädt es als Datei hinauf, wobei er die Art (XML/ CSV) angibt, da es 2 verschiedene Paar Schuhe sind ;-)
Das hab ich mir dazu überlegt:
Die erste Zeile der CSV wird ausgelesen.
Die Felder werden untereinander ausgegeben, daneben sind die Felder aus der DB jeweils in einer Select-Box
Das hat den Sinn das man die Felder Zuweisen kann, kann ja sein, das die Daten-Köpfe nicht gleich sind.
Nun erfolgt ein Zwischenschritt: Es wird überprüft ob kein DB-Feld doppelt vorkommt, ansonsten zurück an den Start.
Nun kommt das Hauptproblem -> der eigendliche Abgleich
Da ja bestehende Daten vorhanden sind, sollten diese auch weiter bestehn beleiben, aber Änderungen der Datensätze trotzdem vorgenommen werden.
Ich habe mir überlegt ob man das nicht mit Regeln bewerkstelligen könnte?
d.h.: Der User gibt an, wer von den 2 Datenbeständen stärker ist.
Aber trotzdem bleibt das Problem mit Änderungen in einem Datensatz bestehn.
* Wie erkenne ich einen bestehenden Datensatz?
* Wie könnte man die SQL-Anzahl minimieren.
* Genereller Ansatz
PS: Es geht da nicht nur um ein Paar Datensätze, sondern um so 5.000++
Es sind Personen Daten!
Für Ideen bzw Ansätze habe ich immer ein offenes Ohr.
Ich habe wieder mal eine kleine Denkaufgabe:
Intelligenter DatenImport von CSV bzw. XML
Was ich drunter verstehe:
Der User hat einen Offline-Datenbestand und will diesen mit dem Online-Datenbestand abgleichen.
Er lädt es als Datei hinauf, wobei er die Art (XML/ CSV) angibt, da es 2 verschiedene Paar Schuhe sind ;-)
Das hab ich mir dazu überlegt:
Die erste Zeile der CSV wird ausgelesen.
Die Felder werden untereinander ausgegeben, daneben sind die Felder aus der DB jeweils in einer Select-Box
Das hat den Sinn das man die Felder Zuweisen kann, kann ja sein, das die Daten-Köpfe nicht gleich sind.
Nun erfolgt ein Zwischenschritt: Es wird überprüft ob kein DB-Feld doppelt vorkommt, ansonsten zurück an den Start.
Nun kommt das Hauptproblem -> der eigendliche Abgleich
Da ja bestehende Daten vorhanden sind, sollten diese auch weiter bestehn beleiben, aber Änderungen der Datensätze trotzdem vorgenommen werden.
Ich habe mir überlegt ob man das nicht mit Regeln bewerkstelligen könnte?
d.h.: Der User gibt an, wer von den 2 Datenbeständen stärker ist.
Aber trotzdem bleibt das Problem mit Änderungen in einem Datensatz bestehn.
* Wie erkenne ich einen bestehenden Datensatz?
* Wie könnte man die SQL-Anzahl minimieren.
* Genereller Ansatz
PS: Es geht da nicht nur um ein Paar Datensätze, sondern um so 5.000++
Es sind Personen Daten!
Für Ideen bzw Ansätze habe ich immer ein offenes Ohr.