Live-Forum - Die aktuellen Beiträge
Anzeige
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender

Forumthread: Bild und Text von (HTML-) Webseite auslesen

Bild und Text von (HTML-) Webseite auslesen
04.09.2013 11:07:29
(HTML-)
Hallo zusammen!
Vielen Dank erst einmal ins Forum, ich habe schon so viele gute Tipps von euch bekommen, ohne oft direkt nach irgendetwas fragen zu müssen, da all meine offenen Probleme schon gelöst wurden.
Ich möchte jetzt jedoch etwas spezielles machen, wozu ich auch im Forum keine Lösung gefunden habe, welche ich umsetzen konnte.
Es gibt auf der Webseite www.ifm.com Produktdatenblätter. Diese möchte ich auslesen und für Prüfempfehlungen in unserem Unternehmen verwenden.
Als Beispiel dieses Datenblatt:
http://www.ifm.com/products/de/ds/OID201.htm
Von diesem Gerät brauche ich das Bild an einer bestimmten Position in meiner Excel Datei, die Schutzklasse (hier III) und die Betriebsspannung (hier 10-30V AC).
Die URL des Bildes (hier http://www.ifm.com/tedo/foto/200_0077.gif)
ist zwar immer gleich ausgeführt, hat aber leider keinen logischen Bezug auf den Produktnamen, da das Bild z.B. auch beim Artikel OID200 verwendet wird. Daher muss die URL zum Bild wohl "irgendwie" aus dem HTML - Code gezogen werden.
Ist so etwas umsetzbar? Das würde mir viel copy & paste Arbeit sparen. :)
Danke für eure Tipps!
Alex

Anzeige

2
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: Bild und Text von (HTML-) Webseite auslesen
04.09.2013 11:32:49
(HTML-)
Hallo Alex,
ja das ist möglich. Du findest hier im Forum zahlreiche Beispiele wie der Quelltext von Websites ausgelesen werden kann. Suche mal nach CreateObject("InternetExplorer.Application") oder document.outerHTML.
Das Herunterladen einer Grafik ist ebenfalls im Forum zu finden:
https://www.herber.de/forum/archiv/808to812/809124_Grafik_aus_Hyperlink_einbetten.html
Leider habe ich jetzt nicht die Zeit dein den VBA-Code für dein Vorhaben zu schreiben, aber im Prinzip muss der Quellcode der Website nach der Grafikadresse gefiltert werden. Danach kann die Grafik aus dem Internet heruntergeladen und in deine Excel-Datei eingebunden werden.
Viele Grüße
Martin

Anzeige
AW: Bild und Text von (HTML-) Webseite auslesen
04.09.2013 11:52:24
(HTML-)
Hallo Martin.
Danke für die erste Antwort. Ich glaub', dass ich bald mal nen VHS Kurs für VBA Skripts besuchen soll. :D
Aktuell versuche ich es mal mit deinem verlinkten Thema, das hatte ich bisher noch nicht gefunden.
Gruß
Alex
;

Forumthreads zu verwandten Themen

Anzeige
Anzeige
Anzeige
Entdecke relevante Threads

Schau dir verwandte Threads basierend auf dem aktuellen Thema an

Alle relevanten Threads mit Inhaltsvorschau entdecken
Anzeige
Anzeige

Infobox / Tutorial

Bild und Text von HTML-Webseite auslesen


Schritt-für-Schritt-Anleitung

Um Bilder und Texte von einer HTML-Webseite in Excel auszulesen, kannst Du VBA (Visual Basic for Applications) verwenden. Hier ist eine einfache Anleitung:

  1. VBA-Editor öffnen: Drücke ALT + F11, um den VBA-Editor zu öffnen.

  2. Neues Modul erstellen: Klicke mit der rechten Maustaste auf "VBAProject (DeineArbeitsmappe)", wähle "Einfügen" und dann "Modul".

  3. Code einfügen: Füge den folgenden Code in das Modul ein:

    Sub BildUndTextAuslesen()
       Dim ie As Object
       Dim doc As Object
       Dim bildURL As String
       Dim text As String
    
       ' Internet Explorer öffnen
       Set ie = CreateObject("InternetExplorer.Application")
       ie.Visible = False
       ie.Navigate "http://www.ifm.com/products/de/ds/OID201.htm"
    
       ' Warten, bis die Seite geladen ist
       Do While ie.Busy Or ie.ReadyState <> 4
           DoEvents
       Loop
    
       ' HTML-Dokument speichern
       Set doc = ie.document
    
       ' Bild und Text auslesen
       bildURL = doc.getElementsByTagName("img")(0).src
       text = doc.getElementById("someElementId").innerText ' Ändere "someElementId" nach Bedarf
    
       ' Bild in Excel einfügen
       ActiveSheet.Pictures.Insert(bildURL).Select
       Selection.ShapeRange.LockAspectRatio = msoFalse
       Selection.Width = 100 ' Breite anpassen
       Selection.Height = 100 ' Höhe anpassen
    
       ' Text in Zelle einfügen
       Range("A1").Value = text
    
       ' Internet Explorer schließen
       ie.Quit
       Set ie = Nothing
    End Sub
  4. Code anpassen: Stelle sicher, dass Du die someElementId durch die entsprechende ID des HTML-Elements ersetzt, aus dem Du den Text auslesen möchtest.

  5. Makro ausführen: Schließe den VBA-Editor und führe das Makro über ALT + F8 aus.


Häufige Fehler und Lösungen

  • Fehler: "Das Objekt unterstützt diese Eigenschaft oder Methode nicht"

    • Lösung: Überprüfe, ob die ID des HTML-Elements korrekt ist. Die Struktur der Webseite kann sich ändern.
  • Fehler: Bild wird nicht angezeigt

    • Lösung: Stelle sicher, dass die Bild-URL korrekt ausgelesen wird. Du kannst das Bild auch manuell in den Browser eingeben, um sicherzustellen, dass es erreichbar ist.
  • Fehler: Internet Explorer öffnet sich nicht

    • Lösung: Stelle sicher, dass Du Internet Explorer installiert und als Standardbrowser konfiguriert hast.

Alternative Methoden

  1. Power Query: Nutze Power Query in Excel, um Daten von Webseiten zu importieren. Dies ist eine benutzerfreundliche Methode, um HTML-Tabellen auszulesen.

  2. Web-Scraping-Tools: Verwende Tools wie "Octoparse" oder "ParseHub", um komplexe Webseiten zu scrapen und die Daten in Excel zu exportieren.

  3. Online-Dienste: Es gibt verschiedene Online-Dienste, die das Auslesen von Webseiten ermöglichen und die Daten in Excel-Format exportieren.


Praktische Beispiele

  • Beispiel 1: Um alle Bilder von einer Webseite auszulesen, kannst Du eine Schleife verwenden, die durch alle <img>-Tags iteriert und die src-Attribute speichert.

  • Beispiel 2: Das Auslesen von Text aus einer Grafik kann mit OCR-Tools (Optical Character Recognition) erfolgen. Nutze dafür spezialisierte Software oder Online-Dienste.


Tipps für Profis

  • HTML-Dokument analysieren: Nutze die Entwicklertools Deines Browsers (F12), um die Struktur der Webseite zu verstehen und die richtigen IDs oder Klassen für das Auslesen zu finden.

  • Regelmäßige Updates: Überprüfe regelmäßig, ob die Struktur der Webseite sich ändert, um sicherzustellen, dass Dein VBA-Skript weiterhin funktioniert.

  • Fehlerprotokollierung: Implementiere eine einfache Fehlerprotokollierung in Deinem VBA-Code, um Probleme einfacher zu identifizieren.


FAQ: Häufige Fragen

1. Wie kann ich den Text aus einem Bild auslesen?
Um Text aus einem Bild auszulesen, benötigst Du ein OCR-Tool. Es gibt viele kostenlose und kostenpflichtige Optionen, die Du verwenden kannst.

2. Kann ich Bilder als HTML-Code in Excel einfügen?
Ja, Du kannst Bilder in Excel über den VBA-Code einfügen, indem Du die Bild-URL verwendest. Excel ermöglicht es, Bilder direkt von einem Link einzufügen.

3. Welche Excel-Version benötige ich für diese Methoden?
Die oben beschriebenen Methoden funktionieren in Excel 2010 und späteren Versionen, die VBA unterstützen.

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Entdecke mehr
Finde genau, was du suchst

Die erweiterte Suchfunktion hilft dir, gezielt die besten Antworten zu finden

Suche nach den besten Antworten
Unsere beliebtesten Threads

Entdecke unsere meistgeklickten Beiträge in der Google Suche

Top 100 Threads jetzt ansehen
Anzeige