ich habe eine Frage zur Umsetzbarkeit des folgenden Projektes.
Ausgangspunkt sind zwei Excel Dateien:
Datei 1 - 65.000 Zeilen x 6 Spalten.
Datei 2 - 245.000 Zeilen x 7 Spalten
In Datei 1 befinden sich die Überschriften I.Nr., Name, Straße, PLZ, Ort, Umsatz
In Datei 2 befinden sich die Überschriften Kd.Nr., Name, Name1, Land, PLZ, Ort, Straße + Hausnummer
Nun sollen die Daten aus Datei 2 mit I.Nr. und Umsatz aus Datei 1 vervollständigt werden,
allerdings sind nicht alle Namen (Kunden) aus Datei 1 in Datei 2 vorhanden (diese sollen dann auch nicht gepflegt werden), des Weiteren ist die Schreibweise und die Aufteilung der Namen in den Dateien oft unterscheidlich, sprich:
(Beispiel)
Datei 1: Name: "Test AG -Maschinenbau"
Datei 2: Name: "TEST AG" Name1: "MASCHINENBAU"
Es kommt aber auch vor das in Datei 2 das Feld Name1 leer ist und alles in Name steht.
Auch die Felder PLZ, Ort und Straße sind nicht immer gepflegt.
--------------
Soweit zur Ausgangssituation, nun bin ich am überlegen wie ich es am besten umsetze, bzw. ob es überhaupt machbar ist? (Speicher aufgrund der großen Datenmenge etc.)
Ich hatte mir überlegt Name und Name1 aus Datei 2 in einen String zu packen.
Dann laufe ich mit einer Schleife über jede Zeile und vergleiche die Werte "Name, PLZ, und Straße" aus Datei 1 mit "NameNeu (Name + Name1), PLZ, Straße aus Datei 2 auf prozentuale Übereinstimmung!?
Hier schon die erste Frage ob das Umsetzbar ist. Habe schon überlegt die Strings mit Split() zu zerlegen und in Arrays zu packen und dann jeden Wert aus Array1 mit dem aus Array2 zu vergleichen, wenn true dann x(Int) + 0,2 oder so. Wenn Dann am Ende der Überprüfung eine Übereinstimmung der Strings größer als 75% raus kommt, kopiere ich die gewünschten Werte (I.Nr. und Umsatz) aus Datei 1 in Datei 2.
Hat wer eine Idee wie es gehen könnte? Gibt es alternativen der Umsetzung mit Access, Java, VB.Net?
Vielen Dank und frohes Schaffen
LG Patrick