Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
1496to1500
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

Website auslesen und ohne Tags in Variable/Zelle

Website auslesen und ohne Tags in Variable/Zelle
09.06.2016 12:16:29
mpb
Hallo,
diesen Code-Schnipsel habe ich mir aus dem Forum beschafft, um den Inhalt einer Website auszulesen:
With CreateObject("MSXML2.XMLHTTP")
.Open "GET", url, False
.send
Beschreibung = .Responsetext
End With
URL ist eine Variable, in der die URL der Website abgelegt ist.
Das funktioniert auch soweit, nur wird in die Variable "Beschreibung" der Quelltext mit allen Tags abgespeichert. Was ich benötige, ist jedoch sozusagen der "Klartext" ohne Tags, also so, wie er im Browser dargestellt wird (Formatierungen sind überflüssig). Was kann ich tun?
Gruß
Martin

5
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: Website auslesen und ohne Tags in Variable/Zelle
09.06.2016 12:26:25
Zwenn
Hallo mpb,
falls Beschreibung dein HTML-Dokument enthält, kommst Du mit strNurText = Beschreibung.InnerText an den reinen Text ohne HTML-Tags. Dabei ist strNurText natürlich eine String Variable, die Du vorher definieren musst.
Gruß,
Zwenn

AW: Website auslesen und ohne Tags in Variable/Zelle
09.06.2016 13:09:25
mpb
Hallo Zwenn,
Danke für den Vorschlag, ich konnte ihn aber noch nicht erfolgreich umsetzen. Vielleicht habe ich mein Problem noch mit präzise genug geschildert. In der String-Variable "Beschreibung" wird mit".responsetext" der Quelltext einer Website abgespeichert. Da ich den hier nicht posten kann, habe ich ihn in der angehängten Exceldatei in Zelle A1 abgelegt.
https://www.herber.de/bbs/user/106117.xlsx
Ich benötige nun nur diesen Teil aus dem Body ohne "störende" Tags:
500 IN 28/11 : In dem Insolvenzverfahren über das Vermögen des Mehmet Armutcu, geb. am 08.11.1967, 1 Satanita Close Beckton, E163TJ London, ENGLAND, geschäftsansässig: Alter Postweg 289, 28207 Bremen, werden die nachträglich angemeldeten Forderungen im schriftlichen Verfahren am 28.07.2016 geprüft. Widersprüche sind schriftlich zu erheben und müssen dem Insolvenzgericht spätestens einen Tag vor diesem besonderen Prüfungstermin vorliegen.
Amtsgericht Bremen, 07.06.2016
Es geht dabei um das (genauer: ein beliebiges) Ergebnis einer Suchabfrage auf https://www.insolvenzbekanntmachungen.de/cgi-bin/bl_suche.pl
Danke für jede weitere Hilfe.
Gruß
Martin

Anzeige
AW: Website auslesen und ohne Tags in Variable/Zelle
09.06.2016 14:41:51
Zwenn
Hallo mpb,
magst Du mal Dein ganzes Makro posten oder als .xlsm Mappe hochladen und den Link posten? Mit Deinem Codeschnipsel kann ich so wenig anfangen, da ich Internetseiten nicht über "MSXML2.XMLHTTP" auslese, sondern direkt über den Internet Explorer.
Aber auch bei Deiner Methode muss es ein Dokument Objekt geben. Aus dem kannst Du mit

Beschreibung = Document.getElementsByTagName("body")(0).innertext
den Text des Body direkt ohne HTML-Tags rausholen.
Gruß,
Zwenn

AW: Website auslesen und ohne Tags in Variable/Zelle
09.06.2016 17:38:59
mpb
Hallo Zwenn,
so hat's geklappt:
Set htm = CreateObject("HTMLfile")
With CreateObject("MSXML2.XMLHTTP")
.Open "GET", url, False
.send
htm.body.innerhtml = .Responsetext
End With
Beschreibung = htm.getElementsByTagName("body")(0).innertext
Vielen Dank!
Gruß
Martin

Anzeige
AW: Website auslesen und ohne Tags in Variable/Zelle
09.06.2016 13:46:50
Fennek
Hallo,
in meiner Code-Sammlung habe ich diese beiden Beispiele gefunden:
htmlOut = .Document.body.innerhtml
htmlIn = .Document.body.outerhtml
Vielleicht hilft es.
mfg

300 Forumthreads zu ähnlichen Themen

Anzeige
Anzeige
Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige