doppelte Datensätze isolieren

Bild

Betrifft: doppelte Datensätze isolieren
von: Michael
Geschrieben am: 26.06.2015 12:48:27

Guten Tag Zusammen,
es gibt in Excel ja die schöne Funktion "Duplikate entfernen".
Ich benötige in meiner Datenbankliste [7 Spalten und ca. 3000.000 Zeilen] jedoch eine Möglichkeit, nur die doppelten Datensätze in eine separate Liste zu überführen.
Gibt es dafür eine Möglichkeit?! Die Datenbankliste besteht aus Zahlen und Zahlen.
Vielen Dank
Michael

Bild

Betrifft: AW: doppelte Datensätze isolieren
von: Daniel
Geschrieben am: 26.06.2015 13:16:15
Hi
bei der Datenmenge solltest du die Liste so sortieren, dass die Duplikate direkt untereinander stehen.
dann kannst du über einen einfachen Vergleich von benachbarten Zellen in der/den ID-Spalte(n) die Duplikate markieren, um sie dann mit dem Autofilter zu selektieren und in die neue Tabelle zu kopieren.
Gruß Daniel

Bild

Betrifft: geht leider nicht
von: Michael
Geschrieben am: 26.06.2015 13:39:58
Hallo Daniel,
vielen Dank für Deinen Vorschlag. Leider geht Deine Methode nicht, da es keine eindeutige ID gibt. Vielmehr kommen jeden Monat für eine ID immer neue Werte hinzu.
Eine Zeile (Datensatz) ist dann doppelt, wenn alle Werte in den 7 Spalten identisch sind.
Ich würde die doppelten gerne in eine extra Liste überführen, um sie eindeutig zu bestimmen zu können.
Über die Funktion Duplikate entfernen, kann ich lediglich erkennen, dass doppelte Werte vorhanden sind. Da sich die Liste jeden Monat verändert, wäre ein automatisierter Vorgang natürlich sehr schön.
Gruß
Michael

Bild

Betrifft: AW: geht leider nicht
von: Rudi Maintaire
Geschrieben am: 26.06.2015 13:45:26
hallo,
verkette die 7 Spalten und setz ZÄHLENWENN() drauf an.
Gruß
Rudi

Bild

Betrifft: leider zu langsam
von: Michael
Geschrieben am: 26.06.2015 14:19:46
Hallo Rudi,
Deine Lösung würde ein Ergebnis bringen, das dauert jedoch aufgrund der hohen Anzahl von Datensätzen [ca.300.000] einfach zu lange. [ich habe nach 5 Minuten abgebrochen]
Gibt es eine schnellerer Lösung?
Gruß
Michael

Bild

Betrifft: AW: geht leider nicht
von: Daniel
Geschrieben am: 26.06.2015 13:56:20
Hi
natürlich geht das.
1. sortiere nach den 7 Spalten.
dann stehen alle doppelten direkt untereinander
2. deine Datenzeile ist ein Duplikat, wenn sie in allen 7 Spalten mit der darüber oder darunter liegenden Zeile übereinstimmt.
das kannst du mit folgender Formel prüfen (Formel für H2)

=Wenn(Oder(Summenprodukt(1*(A1:G1=A2:G2))=7;Summenprodukt(1*(A2:G2=A3:G3))=7);"Duplikat"; "Einzelwert") 

die von Rudi vorgeschlagene Methode mit ZählenWenn solltest du nur verwenden, wenn du einen sehr schnellen Rechner hast.
bei ZählenWenn muss jede Datenzeile mit allen anderen Datenzeilen verglichen werden (300.000 x 300.000 Vergleiche)
sortierst du vorher, musst jede Datentzeile nur mit ihren beiden Nachbardatenzeilen verglichen werden, um herauszufinden, ob sie ein Duplikat ist. (2 x 300.0000 Vergleiche)
Da Excel im Sortieren sehr schnell ist, lohnt sich das bei grösseren Datenmengen.
Gruß Daniel

Bild

Betrifft: SUPER!
von: Michael
Geschrieben am: 26.06.2015 14:29:57
Hallo Daniel,
natürlich funktioniert Deine Lösung. Sie liefert nicht nur das gewünschte Ergebnis, es ist auch sehr schnell (4 Sekunden)
Vielen Dank für Deine Hilfe.
Gruß
Michael

 Bild

Beiträge aus den Excel-Beispielen zum Thema "doppelte Datensätze isolieren"