Adressen zusammenführen/Dubletten kennzeichnen

Bild

Betrifft: Adressen zusammenführen/Dubletten kennzeichnen
von: Peter
Geschrieben am: 11.08.2015 15:43:30

Hallo und guten Tag
Ich habe hier ein Problem, welches ich nicht genau weiss, wie es am Besten zu lösen ist.
Ich habe eine Adressliste mit gegen 80'000 Adressen darin. In diese Liste sollen neu weitere 250 Adressen
integriert werden. Ich habe diese Probleme:
In den 80'000 Adressen hat es bereits Dubletten drin.
Damit die neuen Adressen von den alten unterschieden werden können, sollten die bestehenden Dubletten anders
gekennzeichnet werden, als die neuen.
Die neuen Dubletten sollten in einer neuen Spalte den Vermerk doppelt haben, um danach filtern zu können (Angabe,
welche der neuen Adressen bereits eine Debitornummer haben.
In der kleineren Liste (neu) sollen die auch gekennzeichnet werden.
Ich kann die Dubletten nicht einfach löschen, weil sie bearbeitet werden müssen.
Das grösste Problem ist, dass der Inhalt der Firmennamenspalte nicht eindeutig ist: A. Bischofsberger <--> Bischofsberger.
Ich habe eine Musterliste einmal angehängt in der Hoffnung, eine Idee zu erhalten, wie ich das angehen kann.
Ich bin eher ungeübt im Excel - als verzeiht mir die unbeholfene Fragestellung :-)
Peter
https://www.herber.de/bbs/user/99493.xlsx

Bild

Betrifft: AW: Adressen zusammenführen/Dubletten kennzeichnen
von: Herbert Grom
Geschrieben am: 12.08.2015 17:19:40
Hallo Peter,
verstehe ich das richtig: Du bekommst neue Datensätze in der Tab "Neu". Diese sollen dann in die Tab "Bestehend" eingebaut werden und dann die neuen Dubletten rot markiert werden. Ist das so?
Servus

Bild

Betrifft: AW: Adressen zusammenführen/Dubletten kennzeichnen
von: Peter
Geschrieben am: 13.08.2015 10:15:13
Hallo "Servus"(?)
Ooops, ich habe mich wohl unklar ausgedrückt. Nicht integrieren sondern anzeigen.
In "neu" kommen neue Firmen, welche in "bestehend" angezeigt (markiert) werden sollen. Das Problem liegt darin, dass in der Tabelle "bestehend" bereits Dubletten vorhanden sind. Diese Dubletten sollten von den "neuen Dubletten" unterschieden werden können.
Dummerweise ist er Firmenname nicht immer eindeutig (Schreibfehler, Abkürzungen).
Am Schönsten wäre indes, wenn die Dubletten von "neu" in der Liste "bestehend" nicht nur markiert würden, sondern auch die Daten der Dublette aus Tabellenblatt "neu" (Spalte E) beim markierten Datensatz "bestehend" daneben in die Spalten "G" und "H" eingetragen werden würden.
Ich lade das Muster nochmals hoch.
Vielen Dank.
https://www.herber.de/bbs/user/99529.xlsx

Bild

Betrifft: AW: Adressen zusammenführen/Dubletten kennzeichnen
von: Herbert Grom
Geschrieben am: 14.08.2015 09:29:08
Hallo Peter,
leider verstehe ich einfach nicht, was Du willst. Deine Beschreibung der Aufgabe kann ich nicht in eine verständliche Aufgabe umsetzen. Ich verstehe es einfach nicht. Und im Allgemeinen sagt man mir keine Begriffsstutzigkeit nach!
Also, entweder kannst Du mir exakt beschreiben, was getan werden soll oder ich muss passen!
Außerdem, Du siehst ja, dass sich außer mir niemand Anderes für diese Aufgabe gemeldet hat. Auch das ist ein Indiz dafür, dass es nicht nur mir an Verständnis dafür mangelt.
Servus

Bild

Betrifft: AW: Adressen zusammenführen/Dubletten kennzeichnen
von: Peter
Geschrieben am: 14.08.2015 15:07:15
Vielen Dank für Deinen Versuch.
OK. Ich versuche es verständlicher zu formulieren.
Hintergrund:
Abgleich von neuen Adressen mit einem vorhandenen Bestand.
Tabellenblatt neu:
Tabelle mit etwa 300 Zeilen, welche eine Adressherkunft (Spalte E) besitzen.
Tabellenblatt bestehend:
Tabelle mit etwa 80000 Zeilen mit Herkunftszeichen "CRM" (Spalte E) und Inhalte "Debitor-Nr. SAP" (Spalte F).
Tabellenblatt bestehend enthält bereits doppelte Einträge
Wunsch:
1. Schritt:
Im Tabellenblatt "bestehend" sollen die vorhandenden Dubletten gelb markiert werden. Das Problem bei diesen Dubletten ist vor allem
die unterschiedlichen Schreibweisen im Namen.
2. Schritt:
Die Daten aus dem Tabellenblatt "neu" sollen ins Tabellenblatt "bestehend" übertragen werden.
Einschränkung: Ist der Datensatz bereits in "bestehend" vorhanden,
sollen die nur die Werte aus der Spalte K des betreffenden Datensatzes von "neu" nach der Spalte G ("bestehend") übertragen werden.
Sollte einer der zu übertragenden Datensätze auf eine Dublette stossen, soll der obere Datensatz um die den Eintrag in Spalte G
ergänzt werden.
Ich hoffe, das ist jetzt ein bisschen verständlicher - habe selber gemerkt, dass es sehr verwirrend formuliert war.
Wie würde man einen solchen Namensabgleich machen, wenn die Schreibweisen unterschiedlich sind? Gar nicht auf den Namen,
sondern auf Postleitzahl und Strassen prüfen?
Herzlichen Dank.
Peter
https://www.herber.de/bbs/user/99572.xlsx

Bild

Betrifft: AW: Adressen zusammenführen/Dubletten kennzeichnen
von: Herbert Grom
Geschrieben am: 16.08.2015 17:48:54
Hallo Peter,
Du schreibst:
"Ist der Datensatz bereits in "bestehend" vorhanden, sollen die nur die Werte aus der Spalte K des betreffenden Datensatzes von "neu" nach der Spalte G ("bestehend") übertragen werden."
Und im nächsten Satz schreibst Du:
"Sollte einer der zu übertragenden Datensätze auf eine Dublette stoßen, soll der obere Datensatz um den Eintrag in Spalte G ergänzt werden."
Wenn man bei der Prüfung auf eine "Dublette" stößt, dann ist das ja auch gleichzeitig ein schon vorhandener Datensatz. Also, über prüfe noch einmal dies beiden Sätze auf Logik!
Servus

Bild

Betrifft: AW: Adressen zusammenführen/Dubletten kennzeichnen
von: Herbert Grom
Geschrieben am: 16.08.2015 18:01:52
Noch eine Frage:
Herkunft in "Bestehend" ist "CRM", Herkunft in "Neu" ist entweder "Swissfeu-K" oder "Swissfeu-L".
Gilt das für alle Datensätze, oder wie wird das sein?

Bild

Betrifft: AW: Adressen zusammenführen/Dubletten kennzeichnen
von: Peter
Geschrieben am: 17.08.2015 10:51:50
Ich hoffe, die Grafik veranschaulicht das jetzt ein bisschen besser. Es ist so, dass in "bestehend" eben bereits Dubletten drin sind. Und wenn jetzt aus "neu" ein Datensatz kommt, welcher auf eine in "bestehend" Dublette trifft, sollte der Wert dem ersten der beiden Dublettensätze hinzugefügt werden.
Ja, die Herkunft bestehend ist "CRM". Die Herkunft neu ist entweder "Swissfeu-K" oder "Swissfeu-L"
Das gilt für alle Datensätze, die behalten ihre Herkunft. Ausser bei denjenigen, welche bereits in
bestehend drin sind. Da soll die Herkunft in die Spalte G.
Sofern das geht überhaupt.
Ich danke Dir für Deine Geduld.
Userbild

Bild

Betrifft: AW: Adressen zusammenführen/Dubletten kennzeichnen
von: Herbert Grom
Geschrieben am: 17.08.2015 12:02:33
Hallo Peter,
jetzt habe ich schon mehrere Stunden daran gearbeitet und habe immer noch weitere Fragen, da es immer noch Unklarheiten gibt. Doch ist das Ganze nun für eine kostenlose Forenhilfe zu groß geworden. Wenn ich Dir hierfür eine Lösung erstellen soll, kann und will ich das nicht mehr umsonst machen, denn schließlich ist die Entwicklung von Excel-Tools mein Brotwerwerb. Nichts desto trotz helfe ich immer wieder gerne hier im Forum, wie Du ja auch schon gesehen hast, doch irgendwann wird es einfach zu groß, für eine kostenlose Forenhilfe.
Falls Du an einer Hilfe gegen Kosten interessiert bist, dann gib mir bitte kurz Bescheid, ich erstelle Dir dann ein Angebot. Allerdings arbeite ich, Internet-like, nur gegen Vorkasse. Ich musste einmal eine Zahlung gerichtlich eintreiben, dazu habe ich keine Lust mehr. Das ist kein Misstrauen Dir gegenüber, sondern eine generelle Entscheidung von mir.
Hier meine eMail-Adr.: hagrom at gmail.com
Servus

 Bild

Beiträge aus den Excel-Beispielen zum Thema "Adressen zusammenführen/Dubletten kennzeichnen"