Microsoft Excel

Herbers Excel/VBA-Archiv

Informationen und Beispiele zum Thema Werkzeug
BildScreenshot zu Werkzeug Werkzeug-Seite mit Beispielarbeitsmappe aufrufen

Regex für Filterung von Daten in html-seiten


Betrifft: Regex für Filterung von Daten in html-seiten von: Ingo
Geschrieben am: 11.09.2019 22:04:14

hallo,

ich hoffe dass mir hier auch jmd helfen kann.
Bei der jobsuche kam ich auf die Idee webseiten von jobportal über EXcel vba zu filtern und betimmte Tag-Inhalte in exceltabellen zu schreiben.

Ich habe mal bei der agentur für ein simples beipiel ohne zu viele Grafiken rausgesucht. Da hier die Links nicht mormal für spätere Aufrufe gespeichert werden konnten war auch hier die Idee gebohren. Da ich nicht weiß ob ich do eine seite hochladen kann, habe ich hier einen Link gpostet, falls diese Anzeige weg ist, bitte eine ähnliche seite nehmen.

 
 https://jobboerse.arbeitsagentur.de/vamJB/stellenangeboteFinden.html?execution=e4s1&bencs=wqwGsXJo14M8iJ9bcj7VHPZ%2F0oeNs8%2F4WMQ%2FYofuZbcHVj4Ohcqv3AUi1mlR4Xrq&bencs=dt%2Fy%2Fnm7Tu8C1AF%2FgIHh1VrWkP%2BnCboffzc6k9hyfnvf3rjRJBmp%2FHArbEZ3ZwZ%2BjI3DAdQFrIZqDYUJ9HdD5w%3D%3D&bencs=0mDu4bkHdNj7Zla62XOI6reQtwKTvZS%2BBdUxuZhiCkUzaCLlRmuRa5cezZ03QgiG02uvOb6hGn7l8F3yu6uOsL2ZUzMCaTBiNq5zUQ0NowhwiM9vJozIHTsoubjmLu3m&bencs=pWR5MtK0ZiHe7ykQFgDHGmR7F%2B2WnUx5fvl9krNsJBou7H988Gh4FrUQuPEf99YE


Ich habe mal einige Interessante Tags in Fett markiert, also wenn mir jmd. mal vlt. 1 oder zwei konkrete Beipiele nennen und bei den anderen vlt. vielleicht Ansätze für gegen rege-ansätze.

Bin derzeit noch blutiger Anfänger in RegEx, wurde das zwar auch ohne RegEx hinbekommen.
Ich würde mich aber sehr freuen, wenn mir jmd. hier etwas konkrete starthilfe in RegEx geben kann da.
Überblick über das Stellenangebot
 Referenznummer
 Titel des Stellenangebots 
 
 Stellenbeschreibung 
 Arbeitsorte
 Beginn der Tätigkeit 
 
 Konditionen des Stellenangebots
 Arbeitszeit
 Vergütung und Zusatzleistungen
 Befristung
 
 
 Kontaktdaten
 Rückfragen und Bewerbungen an 
 Telekommunikation 
 E-Mail
 Gewünschte Bewerbungsarten
 Internetadresse
 Angaben zur Bewerbung
und zusätzlich die URL ,die aus dem verstecken Inhalt herausgefiltert werden muß.
         <input type="hidden" name="aufrufendeSeite" value="/vamJB/stellenangeboteFinden. _
 html?execution=e4s1&bencs=wqwGsXJo14M8iJ9bcj7VHPZ%2F0oeNs8%2F4WMQ%2FYofuZbcHVj4Ohcqv3AUi1mlR4Xrq&bencs=dt%2Fy%2Fnm7Tu8C1AF%2FgIHh1VrWkP%2BnCboffzc6k9hyfnvf3rjRJBmp%2FHArbEZ3ZwZ%2BjI3DAdQFrIZqDYUJ9HdD5w%3D%3D&bencs=0mDu4bkHdNj7Zla62XOI6reQtwKTvZS%2BBdUxuZhiCkUzaCLlRmuRa5cezZ03QgiG02uvOb6hGn7l8F3yu6uOsL2ZUzMCaTBiNq5zUQ0NowhwiM9vJozIHTsoubjmLu3m&bencs=pWR5MtK0ZiHe7ykQFgDHGmR7F%2B2WnUx5fvl9krNsJBou7H988Gh4FrUQuPEf99YE" />
 
 

So und nun hoffe ich dass sich jmd. melden.

Und vielen Dank für alle, die hierfür Zeit investieren.
  

Betrifft: AW: Regex für Filterung von Daten in html-seiten von: 1712665.html
Geschrieben am: 12.09.2019 12:47:47

Hallo Ingo,

zu Regex kann ich Dir zu Deinem Vorhaben nix weiter sagen, halte das aber auch für das falsche Werkzeug für die Aufgabe. Daten aus Internetseiten kann man aus Excel heraus wohl recht einfach mit PowerQuery ziehen, wenn es sich um Tabellen handelt. Dafür gibt es aber andere Experten in den Foren.

Das was Du willst sieht für mich auf den ersten Blick aus, wie eine klassische Aufgabe, die man über das DOM (Document Object Model) löst. Ich habe im Moment keine Zeit mich mit der Seite zu beschäftigen, aber da sie ein Jobangebot für einen Softwareentwickler ausweist, nehme ich an Du bist mit der Materie "Programmieren" ansich vertraut. Deshalb von meiner Seite der folgende Link auf ein Projekt, in dem die erste Suchseite von Ebay über das DOM ausgelesen wird. Im Makro der Mappe, die Du am Ende des ersten Beitrags runterladen kannst, sind viele Kommentare dazu, wie man an die Werte kommt. Damit solltest Du eigentlich etwas anfangen können:
https://www.herber.de/forum/cgi-bin/callthread.pl?index=1678466

Viele Grüße,

Zwenn

Beiträge aus dem Excel-Forum zum Thema "Regex für Filterung von Daten in html-seiten"