Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
1824to1828
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

Web-Datenimport-Problem mit PQ ...

Web-Datenimport-Problem mit PQ ...
15.04.2021 08:53:34
neopa
Hallo an die PQ-Profis,
... im thread: https://www.herber.de/forum/archiv/1824to1828/t1825794.htm hatte Peter die Frage aufgeworfen, warum aus der von ihm angegeben Site: https://marktdaten.fuw.ch/detail/indices?ID_NOTATION=7911158 nur 200 Datensatze der Tabelle (3) ausgelesen werden.
Mit dem VBA-Code von Anton und Zwenn können jedoch 214 ausgelesen werden. In meiner Home und Business 2016 Version kann ich mit PQ aber auch nur 200 Datensätze auslesen wie Peter mit seiner Office 365 privat - Version. Gibt es da in PQ mit unseren Versionen eine Beschränkung oder haben ich etwas übersehen bzw. nicht beachtet?
Gruß Werner
.. , - ...

14
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: das hilft mir leider nicht ...
15.04.2021 10:35:28
neopa
Hallo Luschi,
... zunächst kann ich in meiner 2016er-Version das im Link dargestellte überhaupt nicht nachvollziehen. Da erhalte ich mit PQ keine Daten.
Aus dem von Peter angegebenen Link kann ich dagegen wenigstens die Daten dessen ersten Seite übernehmen. Die Daten dessen 2. Seite haben jedoch keine andere URL so dass ich das in dem Link, welcher von Dir eingestellt wurde, angegebene hier auch nicht nachvollziehen kann.
Gruß Werner
.. , - ...
Anzeige
AW: Abfrage Query ergibt bei mir Fehlermeldung ...
15.04.2021 11:26:27
neopa
Hallo Charly,
... sicherlich weil die URL in GetData noch fehlt. Diese von Dir angegebene ergibt _ Fehlermeldung

Geben Sie einen Number-Wert an 
womit ich nichts anfangen kann.
Gruß Werner
.. , - ...
Anzeige
Klasse Link Luschi owT
15.04.2021 11:09:41
Charly
.
AW: kannst Du das da angegebene nachvollziehen?...
15.04.2021 11:17:22
neopa
Hallo Charly,
... und wenn ja mit welcher Excelversion?
Gruß Werner
.. , - ...
AW: kannst Du das da angegebene nachvollziehen?...
15.04.2021 11:55:24
EtoPHG
Hallo Werner,
Dein Problem kann ich nachvollziehen.
Die angebotenen Links/Lösungen werden dir bei dieser Web-Quelle nicht weiterhelfen, weil es eine dynamische Seite ist. In Table 3 (die eigentliche Datenquelle in PQ) werden pro Seite max. 200 Zeilen angezeigt und diese wechseln nur bei Klick auf die Seitenbuttons.
Die angebotenen Lösungen beruhen aber auf einem Paging (Seitenwechsel), das über die Parameter in der URL ( z.B. ?pageNr=N) erfolgen und sind daher für PQ nicht geeignet. Eine Lösung über PQ habe ich im Moment auch nicht. Man müsste eine Möglichkeit finden den Seitentbutton für die Nächste Seite auszulösen und dann wiederum die Table 3 auszulesen und dann die Inhalte zusammenzuführen.
Das Problem ist aber IMHO nicht von der XL-Version abhängig, sondern vom Aufbau/Verhalten der Web-Quelle. U.a. sind das auch Mechanismen, welche die Anbieter bewusst einbauen, damit das Absaugen von Daten mit Automatismen (wie PQ) erschwert oder verunmöglicht wird.
Gruess Hansueli
Anzeige
AW: Deine Ausführungen sind verständlich ...
15.04.2021 12:01:09
neopa
Hallo Hansueli,
... und für mich auch nachvollziehbar. Ich hab mir schon fast so etwas ähnliches gedacht.
Ich danke Dir für Deine Zeit und wünsche Dir eine angenehme Zeit und vor allem Gesundheit.
Gruß Werner
.. , - ...
Ähnliches gibt es auch bei Finanzseiten
15.04.2021 13:22:54
lupo1
Eine feste Webabfrage könnte man z.B. auf eine Seite der 30 DAX-Titel bei onvista.de anlegen (wollen).
Das funktioniert einmal oder mehrmals für ein paar Tage, aber dann wird die Quelle ebenfalls meist geändert.
Zum Glück gibt es aber =GOOGLEFINANCE() und =BÖRSENHISTORIE(). Google begreift sich per se als Informationsanbieter, und Microsoft gibt diese Funktion halt testweise wieder frei (nach einer längeren Lücke ohne MS Money). Sollten jedoch zuviele Professionelle sie (unentgeltlich) nutzen, kann sie jederzeit wieder reglementiert werden. Vielleicht rechnet MS zumindest für die Abo-Inhaber mit einem Anteil, die weiter an die Börsen gehen. Oder MS kauft die Info selbst für einen größeren Betrag an und darf dann die meisten Daten mit 15-20-minütiger Verzögerung weiterreichen.
Wer ist eigentlich ursprünglicher Rechteinhaber von Börsenkursen? Vermutlich die jeweilige Börse selbst. Dort fallen also nicht nur Handelsentgelte an (die eigentliche Einnahme), sondern auch die Informationen über die Handelsdaten, die man ebenfalls verkaufen kann. Je frischer (realtime), desto teurer.
Anzeige
AW: dies erklärt aber nur zum Teil ...
15.04.2021 14:33:56
neopa
Hallo lupo,
... denn warum kann man z.B. mit VBA die Daten relativ komplett und zeitnah abgreifen und sei es auch nur zeitweise so.
Bei einer Abfrage mit PQ bemerke ich, dass die Abfrage der Site schon vergleichsweise verzögert startet. Für mich stellt sich dass jedenfalls so dar, als ob MS in Office dafür möglicherweise bewusst eine "Bremse" und eine Limit eingebaut hat(te), aus welchem Grund auch immer.
Gruß Werner
.. , - ...
Erklärungsversuch ohne konkrete Lösung
15.04.2021 16:27:58
ChrisL
Hi Werner
Vorweg, ich kann mittels PQ überhaupt nicht auf die Webseite zugreifen. Es kommt ein Fehler betr. Anmeldeinformationen, entsprechend kann ich auch nicht an einer Lösung tüfteln.
Als potentieller Lösungsweg hätte ich folgendes probiert:
https://datachant.com/2017/03/30/web-scraping-power-bi-excel-power-query/
https://exceleratorbi.com.au/scraping-data-from-javascript-web-sites-with-power-query/
Hauptsächlich die Variante im Link 1, wo man sich manuell durch die Dokumentenstruktur hangelt, erachte ich als vielversprechend. Die Web Query zu "trainieren" wie im zweiten Link, habe ich noch nie gemacht.
Die eigentliche Problemursache glaube ich gut nachvollziehen zu können. Wenn du den Seitenquelltext studierst stellst du fest, dass sämtlich 214 Einträge geladen wurden, jedoch werden nur 200 aufs mal angezeigt. Die Daten sind also vorhanden, weshalb sie von einem VBA-Code, welcher auf den Quellcode zugreift, gelesen werden können. Power-Query geht jedoch primär auf die Ansicht.
Das folgende Beispiel ist vielleicht ein wenig banal. Aber würde man die Nachrichten lesen, dann hätte man pro Ladevorgang immer nur eine Anzeige. Liest man hingegen den VBA Code, bekommt man die vollständigen Daten:

Public i As Integer
Sub Main()
i = i + 1
Select Case i
Case 1: MsgBox "A"
Case 2: MsgBox "B"
Case 3: MsgBox "C"
End Select
End Sub

HTML-Webseiten sind grundsätzlich statisch. Die vorliegende Webseite ist mit Java-Script gespickt, um die Anzeige dynamisch zu gestalten. Das Script wird durch den Webbrowser interpretiert.
Alternativ erreicht man Dynamik z.B. mittels PHP. Die PHP-Datei wird auf dem Server gelesen/interpretiert. Dabei wird aber nur das HTML-File mittels PHP (oder alternativer Sprache) dynamisch erzeugt, die Anzeige für den User ist trotzdem wieder statisch. Oft wird in solchen Fällen mit Parametern (?page=1, ?page=2...) gearbeitet, womit PHP anhand vom URL erkennt, welcher Datenausschnitt aufbereitet werden soll. Diesen Parameter kann man auch für PQ verwenden.
Anders ausgedrückt. Die Problemursache liegt im verwendeten Java-Script. Moderne Webseiten verwenden immer häufiger JS, was das Web-Scraping schwierig macht, hingegen die Benutzerfreundlichkeit erhöht (kein zusätzlicher Ladevorgang beim Seitenwechsel). Die Technik ist nicht zu verwechseln mit dem üblichen "Multipage" Thema, was sich mittels Parameter lösen lässt.
Fazit: Nein, es gibt keine bewusste Bremse oder Limite seitens MS, sondern es liegt an der verwendeten Technik der Webseite. Die Daten sind vorhanden, man muss nur einen Weg finden, diese mittels PQ zu lesen.
cu
Chris
Anzeige
AW: Danke für Deine Erklärungen ...
16.04.2021 10:55:11
neopa
Hallo Chris,
... und auch wenn Du mir keine konkreten Lösungsweg aufzeigen konntest, weiß ich zu würdigen, dass Du Dir für Deine Ausführungen viel Zeit genommen hast. Danke! Denn meine Erfahrung ist, dass man (zumindest ich) meist gerade für Erklärungen mehr Zeit benötigt, als wenn man eine Lösung ohne eine solche aufzeigen kann.
Meine Fragestellung ergab sich einfach aus Neugier, weil ich selbst keine plausible Erklärung gefunden hatte, für das was Peter zuvor in seinem von mir verlinkten thread schon festgestellt hatte und ich mich mittlerweile auch etwas für die PQ-Lösungsmöglichkeiten - die man interaktiv aufstellen kann - interessiere. Aber persönlich brauch ich momentan und wahrscheinlich auch künftig derartige Webabfragen nicht.
Meine gegenüber lupo getroffenen Aussagen waren aber offensichtlich unzutreffend und führten somit zu Recht zu Deinem Fazit.
Wobei ich allerdings nach wie vor feststelle, dass mit PQ das Ergebnis der mit "Standard-PQ" möglich Datenermittlung im Vergleich zu der von Anton und Zwenn bereitgestellten VBA-CAD schon wesentlich langsamer geschieht. Da könnte/sollte möglicherweise die PQ-Entwickler noch etwas verbessern. Und dass ich in meinem XL2016 ich die Abfragen von Charly nicht nachvollziehen kann, ist wahrscheinlich meiner älteren XL-Version geschuldet.
Wünsche Dir nun noch einen angenehmen Freitag und dann ein schönes WE
Gruß Werner
.. , - ...
Anzeige
AW: Danke für Deine Erklärungen ...
16.04.2021 12:58:08
ChrisL
Hi Werner
Danke für die Rückmeldung.
Zur Antwortzeit habe ich folgende Vermutung. PQ interpretiert den Quellcode und erstellt eine Art von Ansicht, so wie es der Webbrowser auch tut, während VBA ohne vorgängige Interpretation direkt den Quellcode abgreift.
cu
Chris
AW: danke, das ist nachvollziehbar owT
16.04.2021 14:24:03
neopa
Gruß Werner
.. , - ...

Links zu Excel-Dialogen

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige