Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
1304to1308
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

Vergleicher

Vergleicher
30.03.2013 13:45:54
Carsten
Hallo, ich habe ein Problem mit einer Datei, hatte diese Anfrage auch schon mal in ein SQL Forum Gestezt, wenn ich das aber auch in Excel Lösen könnte wäre es genau so gut. Bitte um Info ob jemande hierfür eine Lösung in Excel hat. Kann eine Datei gerne Zusenden
Tabelle enthält Artikel die Nummern haben. Problem ist, das es die gleichen Artikel in der Tabelle gibt, die verschieden Schreibweisen haben und verschieden Nummernkreise. Die Hauptnummern sind Fünfstellig und die Nebennummer haben das Format 01.01.01, also immer zwei Zaheln mit je ienem Punkt getrennt.
Sinn und Zweck ist es, die Dupletten zu finden unter allen Artikel ( 140 TSd) mit so wenig wie möglicher Handarbeit. Das Script sollte Nachschauen wieviiel gleiche Keywords es hat und dies als Ergebniss ausgeben. Habe die Keywords mal Fett Markiert und das Ergebniss auch Fett unter jedes Beispiel geschrieben
Hier ein paar Beispiele:
Beispiel 1:
Artikelnummer Hauptstamm:
10310
Text:
PVC Mantelleitung NYM-J 3x2,5
nach DIN VDE 0250 in Leerrohr,
Installationskanal oder Kabelträger
einziehen
Artikelnummer Nebenstamm:
01.01.13
Text:
PVC-Mantelleitung DIN VDE 0250in
Teillängen liefern und auf vorhandene
Pritschen und Wannen verlegen, in
Elektroinstallationskanäle einlegen oder
in Leerrohre einziehen als:
NYM-J 3x2,5 qmm Cu 72
Ergebniss:
Nebennummer: 01.01.13
Keywords: Treffer PVC, Mantelleitung, NYM-J, 3x2,5,DIN,VDE,0250,einziehen,Installations,Leerrohr
Treffernummer: 10310

Hierbei können aber auch mehrer Treffernummern aufgeschlüsselt werden
Beispiel 2:
Artikelnummer:
26851
Text:
Universalschalter für Unterputzmontage
mit Standardwippe, Kombi- oder Einzel-
abdeckung
, Fabrikat: "Gira Standard
System 55" (reinweiß), ohne uP-Dose,
liefern und montieren
Nummer Nebenstamm:
04.01.06
UP- Schalt- und Steckgeräte für Einzel-
oder Kombiabdeckung liefern und
montieren
als:
UP-Universalschalter, weiß/reinweiß
Ergebniss:
Nebennummer: 04.01.06
Keywords Treffer: Universalschalter,Einzel,Abdeckung,reinweiß,liefern,und,montieren
Treffernummer: 26851

Beispiel 3:
Artikelnummer:
22272
Text:
Flexibles Kunststoffpanzerrohr M 20
hitzebeständig bis 60°C, für alle
Installationen Auf-, Im- oder Unterputz
und im Beton, für mittlere Druckbean-
spruchung, Unterputz mit Mauerschlitz,
liefern und montieren
Nummer Nebenstamm:
02.02.53
Text:
Elektroinstallationsrohr nach VDE 0605
DIN EN50086-1, DIN EN50086-2-2,
Klassifizierung 3341, Maße nach DIN EN
60423 bestehend aus:
PVC-U/ mit Mantel aus PVC-P flammwidrig,
selbstverlöschend Dauergebrauch und
Installationstemperatur min.-25 max.+
60ø C,
Farbe grau RAL 7035
mittlere Druckfestigkeit 720 N/5 cm
mittlere Schlagfestigkeit für alle AP-
und UP-Installationen, für die
Verwendung im Rüttel-, Schütt- u.
Stampfbeton sowie auf Rohfußboden od.
Estrich
Montagehöhe bis 3 mtr.
gleichw. Fränk. Rohrwerke/Hegler liefern
und verlegen als:
biegsames Kunststoffrohr AP- mit
Doppelschellen
Typ FFKuS-EM-F/ESPM, Größe: EN20
Ergebniss:
Nebennummer: 02.02.53
Keywords Treffer: Kunststoff,Rohr, 20
Treffernummer: 22272

Die Sache ist echt verzwickt und ich weiss nicht ob man das über ein Script lösen kann. Wenn als Ergebniss es so Angezeigt wird wie im Beispiel wäre das Genial aber ich habe keine Ahnung ob es geht. Klasse wäre wenn man die Texte der Ergebnissnummern auch noch Anzeigen würde. Ergebniss wäre: ca. 1 Jahr Arbeit per Hand gespart
Bin mal Gespannt ob jemand ein Lösung weiß
Danke schon mal

14
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: Vergleicher
30.03.2013 15:27:46
Oberschlumpf
Hi Carsten
Kann eine Datei gerne Zusenden
Als ich das las. dachte ich: "Wieso hat der denn nicht gleich ne Bsp-Datei mit ausreichend vielen Bsp-Daten mitgeschickt?"
Hmm, du hast ne Menge Text geschrieben - bis zu den Beispielen hab ich gelesen, dann abgebrochen.
Wie sollen wir dir so helfen?
Es ist meiner Meinung nach nicht möglich, anhand deiner Beshcreibungen eine Testdatei nachzubasteln.
Wobei es auch gar nicht erforderlich ist - DU hast die Datei doch schon.
Also zeig sie uns bitte.
Aber bitte nicht mit 140 Tsd Testdaten ;-)
Ciao
Thorsten

Anzeige
AW: Vergleicher
30.03.2013 16:01:30
Carsten
Hi, wie Erwähnt hatte ich das vorher in einem SQL Forum. Ich habe eine Zip Datei hoch Geladen:
https://www.herber.de/bbs/user/84623.zip
Die Artikelnummern stehen in Spalte C und die zu Texte die Gefiltert werden sollen in Spalte H
Hoffe das jemand ne Lösung hat

AW: Vergleicher
30.03.2013 19:27:48
Oberschlumpf
Hi Uwe
Erst mal danke für die 1 Bsp-Datei.
Aber - in der Datei sind sehhhr viele Daten, was an sich erst mal gut ist.
Nicht so gut ist, dass du nur EINE Datei geschickt hast, ich vermute, es ist die von dir benannte Masterliste.
Weiterhin nicht gut ist - du schreibst rein GAR NICHTS dazu, um welche Daten/Zeilen/Spalten es sich handelt, die du aus dieser Masterliste benötigst.
Ach ja - und absolut gar nicht gut ist - dass ich dich um ZWEI Dateien bat, du aber nur 1 gesendet hast.
Wo ist denn die Displiste?
Wenn die deswegen fehlt, weil die eben mit SAP generiert wird, du aber gerad nicht dran kommst, weil SAP nur am Arbeitsplatz verfügbar ist, dann hättest du das wenigstens erwähnen müssen.
Entschuldige bitte, aber wer eine qualifizierte Antwort erhofft, muss erst mal eine qualifizierte Frage stellen.
Zumindest ich kann dir so leider nicht weiterhelfen.
Ciao
Thorsten

Anzeige
AW: Vergleicher
30.03.2013 20:20:34
Carsten
Hallo Thorsten, Sorry, habe ich vorhin nicht so verstanden das es zwei Dateien sein sollen aber habe es jetzt gemacht.
Nochmals die Problemstellung: In Spalte H stehen in beiden Dateien Texte die bei den passenden Artikelnummern in Spalte C eigentlich genau das gleiche Bedeuten. Leider ist das "gleiche" jeweils in einer anderen Form beschrieben. Jetzt bräuchte ich ein Funktion ( Makro, Script, Formel) die die meisten Übereinstimmungen in den Texten in Splate H findet.
Es sollte dabei eine Zeile in der Hauptdatei gewählt werden und dann in der Nebendatei die Zeile gesucht werden mit den meisten Übereinstimmungen. Übereinstimmungen beduetet ganze Worte, Buchstabenkombinationen oder einfach Worte die sich in einem Wort befinden. Das Wort Rohr befindet sich z. B auch in dem Wort Installationsrohr. Als Ergebniss sollte dabei die Artikelnummern in Spalte C heraus kommen aus beiden Dateien damit ich sehe welche Spalten die meisten Übereinstimmungen haben
Danke
Nebendatei
https://www.herber.de/bbs/user/84628.xlsx
Hauptdatei
https://www.herber.de/bbs/user/84629.xlsx

Anzeige
AW: Vergleicher
02.04.2013 16:03:14
fcs
Hallo Carsten,
ich hab mir deine Dateien mal angesehen und auch schon einen 1. Ansatz hinbekommen.
Allerdings wird das nicht ganz einfach werden.
Ich hab es so gemacht, dass die durch Leerzeichen getrennten Wörter in der Bezeichnung in der Hauptdatei in allen Bezeichnungen in der Nebendatei gesucht werden.
Damit dann der Vergleich einigermaßen funktioniert ist aber so einiges an Zusatzmaßnahmen nötig.
1. einige Bindewörter, wie: in, um, etc. und die Artikel (der, die, das, ein etc.) müssen vom Zählen ausgeschlossen werden.
2. In den Bezeichnungen der Hauptdatei gibt es Worttrennungen ("- "). Diese müssen beim Vergleichen beseitigt werden.
3. In der Nebendatei gibt es Inhalte, die den Vergleich erschweren
  • bei AdernzahlxQuerschnitt ist häufig ein Leerzeichen enthalten (4x 1,5 statt 4x1,5) in der Hauptdatei hab ich nur die Schreibweise ohne Leerzeichen gefunden.

  • ist gelegentlich ein Leerzeichen im Kabeltyp

  • gibt es manchmal eine durchgängig andere Schreibweise z.B.: NHXMH versus (N)HXMH

  • wird ein anderes Wort für die gleiche Eigenschaft verwendet, z.B.: "Halogenfreie" versus "Schadstofffreie"

  • Verwendung von Singular/Plural, z.B.: kanal versus kanäle

  • Verwendung von abkürzenden Schreibweisen, z.B: "Nagel- oder Iso-Doppelschellen", hier wird "Nagelschelle" beim Vergleich nicht gefunden

  • Ich hab versucht das durch eine Ersetzungsliste zu bereinigen.
    Aber wie das bei ca. 140000 Bezeichnungen wird im Vergleich zu ca. 3000 in der Beispieldatei?
    Wenn vorhanden/gefunden, dann wird die Kabelabmessung (Adernzahl x Querschnitt) als Basiskriterium verwendet. Danach dann die Anzahl der Treffer.
    Insgesamt wird Excel bzw. der PC dabei aber durch die große zu verarbeitende Datenmenge erschlagen.
    Ich hab auf meinem nicht unbedingt superschnellen Notebook in der Nebendatei mal ca. 100000 Datenzeilen eingefügt.
    Pro Zeile in der Hauptdatei beträgt dann die Verarbeitungszeit 20 bis 30 Sekunden.
    Leider führt die Trefferauswertung nicht immer zum korrekten Ergebnis oder die max. Trefferanzahl kommt mehrfach vor. Somit muss eigentlich die Entscheidung manuell gefällt werden, welche Ergebniszeile übernommen werden soll.
    In der hochgeladen ZIP-Datei findest du die Datei zur Makro-Seuerung und deine beiden Beispieldatei auf wenige Zeilen reduziert mit Anpassungen (Zeile mit SpaltenTiteln, zusätzliche Spalten) für die Ergebnisausgabe.
    https://www.herber.de/bbs/user/84677.zip
    Gruß
    Franz
    PS.: für Rückfragen bin ich nur noch bis morgen verfügbar, dann verschwinde ich für 2 bis 3 Wochen nach Osteuropa.

    Anzeige
    AW: Vergleicher
    02.04.2013 18:23:53
    Carsten
    Hallo Franz, erst mal großes großes Danke für Dein Bemühen, echt Genial ! Mir ist klar das es da Nacharbeit bedarf aber besser so als Monate alles von Hand raus zu Suchen.
    jetzt aber noch ein paar Fragen zur Bedienbarkeit:
    Eigentlich muss ich doch nur die Dateien Auswählen, öffnen, eventuel Sagen wo der vergleich Starten oder Enden soll und los geht es oder ? Könnte dann noch das Zwischenergebniss Anzeigen lassen oder die manuelle Auswahl bestätigen oder ?
    Wenn ich den vergleich Starte kommt die Meldung der Startzeit und der Endzeit ( 1 Sekunde) und es heißt 1 Detei wurde gespeichert. Verstehe ich da was in der Bedineung Falsch ?
    Ich sehe aber, das in der Hauptdatei die Treffer in der Zeile angezeigt werden und in der Nebendatei auch das jeweilige Ergebniss in die "Getroffene Zeile" geschrieben wird.
    Genial, echt, genau das Richjtige aber Bediene ich es falsch ?
    Danke schon mal
    Carsten

    Anzeige
    AW: Vergleicher
    02.04.2013 18:34:35
    Carsten
    Noch eine Frage dazu: Die Spalten werden vom Makro Automatisch eimgefügt und der Dateiaufbau ist genau so wie die Beispieldateien oder muss ich noch Spalten einfügen ?

    AW: Vergleicher
    02.04.2013 20:44:40
    fcs
    Hallo Carsten,
    das Makro schreibt die zusätzlichen Information in die leeren Spalten rechts neben den vorhandenen Daten.
    Wenn du meine Testdateien benutzt hast, dann ist die Laufzeit natürlich kurz, da die Querverweise zwischen den Dateien schon eingetragen sind. Da Makro lädt nur die Daten aus der Nebendatei. Dann werden die beiden Dateien am Ende des Makros wieder gespeichert.
    In deinen Ursprungs-Dateien solltest du falls nicht vorhanden als 1. Zeile eine Zeile mit den Spaltentiteln einfügen.
    Wenn du mit deinen Ursprungsdateien (ca. 140000 Zeilen) arbeitest, dann solltest du die Laufzeit erst einmal mit 10 Zeilen testen. Wenn dein PC nicht wesentlich schneller ist als meiner, dann taucht er also ca. 5 Minuten ab. Danach kannst du dann ja mal deinen Rechner eine Nachtschicht mit 500 bis 1000 Zeilen einlegen lassen, um zu testen, wie schnell der Fortschritt möglich ist.
    Wenn ich mit meiner Zeitschätzung richtig liege, dann wird dein PC etliche Nächte und Wochenenden beschäftigt sein.
    Eigentlich solltest du als erstes deine beiden Basisdateien bereinigen.
    Da waren in den Beispieldateien etliche Code-Nummern doppelt und teilweise verschiedene Code-Nummern mit sehr ähnlichen Beschreibungen.
    Gruß
    Franz

    Anzeige
    AW: Vergleicher
    02.04.2013 22:10:59
    Carsten
    Franz, ganz ganz großes Lob und nochmals Danke. Läuft Genial, habe jetzt für 5600 Zeilen ca. 1,5 Stunden gebraucht ( sehr sehr schneller Rechner). Ich schmeiß das Ding heute Nacht an und lass Ihn Arbeiten.
    DANKE !!!!

    AW: Vergleicher
    03.04.2013 11:00:36
    Carsten
    Hallo Franz, habe gestern Abend meinen test laufen lassen mit den Beispieldateien, war alles OK. jetzt habe ich die echten großen Dateien erzeugt aber irgendwie läuft es nicht. Habe die Dateien hier auch mal Hoch geladen in kleiner Form. Hast Du ne Idee woarn es liegt ?
    Hauptdatei:
    https://www.herber.de/bbs/user/84685.zip
    Nebendatei:
    https://www.herber.de/bbs/user/84686.zip
    Danke

    Anzeige
    AW: Vergleicher
    04.04.2013 21:58:17
    fcs
    Hallo Carsten,
    bei mir funktioniert es auch mit den Testdateien. Ich hab sie aber in der 2010er Format (xlsx) konvertiert und auch nochmals auf 190000 Zeilen in der Nebendatei aufgebläht.
    Ich hab das Makro nochmals etwas angepasst, dámit die Fehlerbehandlung spezifischer reagiert und eine Meldung anzeigt wenn das Makro in einen Fehler läuft.
    Mache ggf. die Zeile
    On Error Resum Fehler
    vorübergehend zu einem Kommentar, wenn du die Zeile herausfinden willst, in welcher Zeile ein gemeldeter Fehler auftritt. Verwende beim Testen nicht die Option "Ja" bei der Option ´"Ergebniszeile auswählen", da "Abbreche" in der Inputbox automatisch zu einem Abbruch führt.
    Gruß
    Franz
    https://www.herber.de/bbs/user/84724.xlsm

    Anzeige
    AW: sorry, ich verstehs nich - wer anders bitte
    31.03.2013 11:01:53
    Carsten
    Habe die Anforderung auf ein ander Antwort von Dir geändert, vielleicht Hilft es Dir jetzt weiter

    uih uih uih EIN GANZ GROSSES SORRY!!
    02.04.2013 08:31:41
    Oberschlumpf
    Hallo Carsten!
    Vergiss meine letzten Einträge!
    Die waren nicht für dich, sondern für einen Uwe, wie man ja auch an der Anrede feststellen kann.
    Das ist mir nicht aufgefallen; dir aber auch nicht.
    Ich hatte mich im Thread geirrt - tut mir leid!
    Nun hab ich mir deine Datei angeschaut + deine Erklärungen - werde aber trotzdem nicht schlau draus.
    Nenn mir bitte mal anhand einer Bsp-Zeile aus der von dir gezeigten Datei, wie oft sich genau dieses Material wiederholt, und nenn die Zeilen, in denen sich die Wiederholen befinden.
    z Bsp:
    Eintrag in Zeile 5 wiederholt sich 3 mal in den Zeilen...
    12
    147
    212
    Vielleicht werde ich dann ja schlauer.
    Ciao
    Thorsten
    Anzeige

    Links zu Excel-Dialogen

    Beliebteste Forumthreads (12 Monate)

    Anzeige

    Beliebteste Forumthreads (12 Monate)

    Anzeige
    Anzeige
    Anzeige