mögliche Dubletten identifizieren
05.11.2021 14:59:33
DanHel
first time here, so be nice :-)
Ich habe das Problem, dass ich sehr viele Fälle (30.000+) habe, die auf Dubletten durchsucht werden müssen. Leider ist die Datenqualität mitunter schlecht, bzw. die Eingabe sehr unterschiedlich, da die Fälle aus unterschiedlichen Datenquellen stammen. Daher ist ein Kontextabgleich im Einzelfall nötig.
Meine Daten sind wie in der Beispieldatei strukturiert (ein paar mehr Variablen sind es noch, aber die für den Abgleich wichtigsten sind angeführt). Meine Idee ist, dass Excel mögliche Duplikate identifiziert, indem es bspw. nach der Kombination Erster Vorname+Nachname+Geburtsjahr sucht und mir dann in einer Msg-Box vorschlägt, dass "Michael Schröder 1900 SPD" und "Michael Schröder 1900 SPD" eine Dopplung sein könnten. Wenn ich dann "ja" anklicke, erhalten beide Fälle dieselbe Lfd-Nr. Bei "nein" bleiben die Lfd-Nummern separiert.
Könnt ihr mir da helfen?
https://www.herber.de/bbs/user/148965.xlsx