Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
1432to1436
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

doppelte Datensätze isolieren

doppelte Datensätze isolieren
26.06.2015 12:48:27
Michael
Guten Tag Zusammen,
es gibt in Excel ja die schöne Funktion "Duplikate entfernen".
Ich benötige in meiner Datenbankliste [7 Spalten und ca. 3000.000 Zeilen] jedoch eine Möglichkeit, nur die doppelten Datensätze in eine separate Liste zu überführen.
Gibt es dafür eine Möglichkeit?! Die Datenbankliste besteht aus Zahlen und Zahlen.
Vielen Dank
Michael

6
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: doppelte Datensätze isolieren
26.06.2015 13:16:15
Daniel
Hi
bei der Datenmenge solltest du die Liste so sortieren, dass die Duplikate direkt untereinander stehen.
dann kannst du über einen einfachen Vergleich von benachbarten Zellen in der/den ID-Spalte(n) die Duplikate markieren, um sie dann mit dem Autofilter zu selektieren und in die neue Tabelle zu kopieren.
Gruß Daniel

geht leider nicht
26.06.2015 13:39:58
Michael
Hallo Daniel,
vielen Dank für Deinen Vorschlag. Leider geht Deine Methode nicht, da es keine eindeutige ID gibt. Vielmehr kommen jeden Monat für eine ID immer neue Werte hinzu.
Eine Zeile (Datensatz) ist dann doppelt, wenn alle Werte in den 7 Spalten identisch sind.
Ich würde die doppelten gerne in eine extra Liste überführen, um sie eindeutig zu bestimmen zu können.
Über die Funktion Duplikate entfernen, kann ich lediglich erkennen, dass doppelte Werte vorhanden sind. Da sich die Liste jeden Monat verändert, wäre ein automatisierter Vorgang natürlich sehr schön.
Gruß
Michael

Anzeige
AW: geht leider nicht
26.06.2015 13:45:26
Rudi
hallo,
verkette die 7 Spalten und setz ZÄHLENWENN() drauf an.
Gruß
Rudi

leider zu langsam
26.06.2015 14:19:46
Michael
Hallo Rudi,
Deine Lösung würde ein Ergebnis bringen, das dauert jedoch aufgrund der hohen Anzahl von Datensätzen [ca.300.000] einfach zu lange. [ich habe nach 5 Minuten abgebrochen]
Gibt es eine schnellerer Lösung?
Gruß
Michael

AW: geht leider nicht
26.06.2015 13:56:20
Daniel
Hi
natürlich geht das.
1. sortiere nach den 7 Spalten.
dann stehen alle doppelten direkt untereinander
2. deine Datenzeile ist ein Duplikat, wenn sie in allen 7 Spalten mit der darüber oder darunter liegenden Zeile übereinstimmt.
das kannst du mit folgender Formel prüfen (Formel für H2)
=Wenn(Oder(Summenprodukt(1*(A1:G1=A2:G2))=7;Summenprodukt(1*(A2:G2=A3:G3))=7);"Duplikat"; "Einzelwert") 

die von Rudi vorgeschlagene Methode mit ZählenWenn solltest du nur verwenden, wenn du einen sehr schnellen Rechner hast.
bei ZählenWenn muss jede Datenzeile mit allen anderen Datenzeilen verglichen werden (300.000 x 300.000 Vergleiche)
sortierst du vorher, musst jede Datentzeile nur mit ihren beiden Nachbardatenzeilen verglichen werden, um herauszufinden, ob sie ein Duplikat ist. (2 x 300.0000 Vergleiche)
Da Excel im Sortieren sehr schnell ist, lohnt sich das bei grösseren Datenmengen.
Gruß Daniel

Anzeige
SUPER!
26.06.2015 14:29:57
Michael
Hallo Daniel,
natürlich funktioniert Deine Lösung. Sie liefert nicht nur das gewünschte Ergebnis, es ist auch sehr schnell (4 Sekunden)
Vielen Dank für Deine Hilfe.
Gruß
Michael

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige