Daten aus einer shtml Datei extrahieren
23.11.2006 13:20:30
Christian
Habe mich bereits ein paar Stunden im Forum "rumgetrieben".
Leider bisher ohne Erfolg - Ansätze habe ich gefunden - aber leider Mangels weiterer Kenntnisse keine passable Lösung für mein Problem:
Aus einer shtml-Datei, die immer nach dem selben Schema aufgebaut ist müssen bestimmte Elemente extrahiert werden.
Nach dem eigentlichen html-Body beginnt der für mich intersante Teil immer mit
aP[1]
Dieser Teil umfasst dann jeweils hinter der Zeile mehrere Daten - dazu später!
Der interessante Teil endet immer mit aP[16] - auch hier folgen aber noch Daten die ich benötige.
Die erste Zeichenfolge die ich nicht mehr benötige ist dann immer TH='http://skins. (diese Zeichenfolge kommt nur einmal vor, ebenso wie das anfangs beschriebene aP[1].
Als erstes müsste also der Teil vor aP[1] sowie ab TH='http://skins. eliminiert werden.
Das, so denke ich sollte für einen Excel-Kenner noch "einfach" lösbar sein ;-)
Aus dieser nun in einer Zeile befindlichen Textsuppe müssen nun 16 Zeilen, jeweils beginnend mit aP[1] - aP[16] in einzelne Zeilen kopiert werden (Denk ich zumindestens)
Im nächsten Schritt geht es dann weiter:
Die dann übrig gebliebenen Zeilen können wie folgt aussehen:
aP[16]=newArray(76,16,'D.b.D.',7700,4190,5245,7700,0,'Cvenus88',80,15844,16113,'','Cvenus88','ZEISS',0);
Wichtig für mich sind in diesem Beispiel die folgenden Teile:
Cvenus88
D.b.D.
die im Idealfall in jeweils eine Spalte geschrieben werden.
Ein weiteres Beispiel für eine Zeile wäre das folgende:
aP[1] = new Array(0,0,'',0,102,'',101,0,'',0,'',1,0,0,'',0)
Hierbei sollten einfach nur 2 leere Felder ausgegeben werden.
Zusammengefasst sieht es also so aus das innerhalb der einzelnen Ausdrücke jeweils 5 mal ' ' stehen von denen jeweils die Daten in den ersten und zweiten ' ' wichtig sind.
Für Eure Tipps und Hilfe bin ich Euch schon im Vorfeld sehr dankbar.
Und bitte bei Lösungsvorschlägen beachten: Ich bin Excel-Laie ;-)
Vielen Dank also .... Christian