Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
1860to1864
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

Bestimmter Quellcode ab Internet abrufen

Bestimmter Quellcode ab Internet abrufen
05.01.2022 01:43:25
Markus
Hallo allerseits
Habe folgendes Anliegen.
In Spalte A habe ich verschiedene Internetadressen aufgelistet.
Jetzt möchte ich gerne, dass ein bestimmter Wert aus dem Quellcode der Website in Spalte B bei der entsprechenden Internetadresse angezeigt wird.
Ist dies überhaupt per VBA oder Formel machbar?
Vielen Dank für eure Hilfe
Freundliche Grüsse

7
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: Bestimmter Quellcode ab Internet abrufen
05.01.2022 14:54:35
Fennek
Hallo,
nach deinen Schlüsselworten habe ich nichts gefunden, aber als ich bei meinem Youtube-Besuch mit "Rechts-Klick"den Sourcecode angesehen habe, waren die Aufrufe bei:

"metadata":{"simpleText":"272 Aufrufe"}
Das Forum hat keine Suchfunktion mehr, also das Finden von Beiträgen ist (zu) schwierig.
mfg
AW: Bestimmter Quellcode ab Internet abrufen
05.01.2022 15:58:20
Zwenn
Hallo Markus
Ob das mit PQ (Power Query) geht kann ich nicht sagen. PQ ist ein sehr mächtiges Werkzeug, das Excel mitliefert und erspart einem das Programmieren solcher Aufgaben. Wenn es durch VBA gelöst werden soll, kann ich Dir erstmal leider nur etwas Kauderwelsch anbieten.
YouTube liefert eine HTML-Datei mit vielen Skripten an den Browser aus. Dieser baut die richtige HTML-Struktur sozusagen "on the fly" daraus auf. Die dazu benötigten Daten sind in der HTML-Datei als JSON in einem script-Tag eingebettet. Bei meinem Test war es das fünft-letzte. Ob das immer so ist muss man ausprobieren. Die von Dir gesuchte Zahl der Views steht 3x in dem JSON. Das Runterladen würde ich über xhr machen und auf keinen Fall mit dem IE, da dieser tot ist. Willst Du einen anderen Browser verwenden geht das nur über SeleniumBasic, z.B. Chrome und dem Chrome WebDriver. xhr liefert nur die statische Ausgangs-HTML-Datei, mit den ganzen Skripten, da es keine dynamischen Inhalte verarbeiten kann.
Das JSON lässt sich aus der HTML-Datei extrahieren und es gibt von Tim Hall auf GitHub ein VBA Modul, welches in das eigene Projekt eingebunden werden kann, um JSONs in eine Struktur aus Dictionaries und Collections "umzuschreiben". Auf diese Struktur kann über einen Pfad auf die gewünschten Werte zugegriffen werden. Eine weitere Möglichkeit wäre das Extrahieren des Wertes durch String-Methoden. In diesem Fall könnte das einfacher sein, weil Du nur einen Wert haben möchtest und man sich das Extraheren des JSON dann sparen kann.
Das Problem dürfte sein, dass Du vermutlich kaum etwas von dem verstehen kannst, was ich geschrieben habe. (Deshalb schrieb ich oben Kauderwelsch.) Du bräuchtest also jemanden, der das für Dich umsetzt oder Du musst Dich in das Lernen der Materie verbeißen.
Ich bin auch nicht sicher, ob YT nicht einen Mechanismus eingebaut hat, um automatisierte Aufrufe abzufangen. Dann bräuchtest Du einen "Gegen-Mechanismus", um das auszuhebeln, was nicht so leicht ist. YT gehört zu Google und die Suchmaschine sperrt nach 30 automatisierten Zugriffen. Sie schaltet dann Capchas vor die Ausgabe der Suchergebnisse. Die Google-Patent Bibliothek hingegen kann man abfragen wie man will. Wie es bei YT ist weiß ich wie gesagt nicht.
Viele Grüße,
Zwenn
Anzeige
AW: Bestimmter Quellcode ab Internet abrufen
05.01.2022 17:50:26
Markus
Hallo zusammen
Vielen Dank für eure Antworten
Hier im Forum habe ich verschiedene Beiträge gefunden, dort ist jedoch die zudurchsuchende URL im VBA eingetragen.
Beispiel:
https://www.herber.de/forum/archiv/1452to1456/1452618_Bestimmten_String_aus_Webseite_auslesen.html
https://www.herber.de/forum/archiv/1736to1740/1736691_URLs_aus_HTML_Quellcode_auslesen.html
Es sollte doch machbar sein, im Modul einzubauen, dass nicht exlizit in einer festegelegten URL sondern die URL in Spalte A durchsucht werden muss.
Freundliche Grüsse
Anzeige
@Zwenn: Javascript?
05.01.2022 19:53:27
Fennek
Hallo Zwenn,
kann man mit JavaScript ein neues Fenster mit der URL von Youtube öffnen UND dann den Source-Code auslesen?
mfg
(In den letzten Tagen habe ich etwas Javascript gelernt, aber "Cross-Domain", also ein anderes Tab in Firefox auszulesen, hat nicht geklappt)
AW: @Zwenn: Javascript?
07.01.2022 10:02:02
Zwenn
Hallo Fennek
Mit xhr kann kein JS verarbeitet werden und da gibts auch keine neuen Seiten, die aufgemacht werden können. Das sind alles individuelle Zugriffe, die evtl. mit entsprechenden Parametern für den Zustand an den WebServer übergeben werden müssen. Z.B. Credentials für LogIns oder Cookies, die vorher abgefragt wurden.
Arbeitet man mit einem Browser, ist es nicht notwendig eigene Handstände mit JS zu machen, weil der Browser das alles automatisch sowieso erledigt. Manchmal ist es notwendig ein JS auf einer Seite manuell auszulösen. Das geht mit exec(). Crosssite Scripting wird inzwischen von den meisten Seiten unterbunden und ist nach meinem Wissen für WebScraping auch nicht notwendig.
Viele Grüße,
Zwenn
Anzeige
AW: Bestimmter Quellcode ab Internet abrufen
07.01.2022 09:56:28
Zwenn
Hallo Markus
Um auf URLs in Spalte A einer Tabelle zuzugreifen, brauchst Du nur eine Schleife. Darin weist Du jeden Durchlauf den Inhält der nächsten Zelle an die Variable für die URL und arbeitest vor dem nächsten Schleifendurchlauf damit alles ab, was Du machen willst. Ich glaube aber nicht, dass die Schleife das Problem ist, sondern der Zugriff auf die Seiten und das Extrahieren gewünschter Werte.
Viele Grüße,
Zwenn

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige