Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
1872to1876
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

micpat1971

micpat1971
16.03.2022 07:25:19
Michael
Guten Morgen!
ich bin mal wieder am verzweifeln. Ich importiere eine HTML-Seite
die sich täglich ändert und die fest vorgegeben ist. Diese wird nun
über PowerQuery importiert. Das Problem was ich habe, sind die Umlaute.
Diese werden nur so � als Quatrat mit Fragezeichen angezeigt da kein UTF-8. Ich könnte ja fast
damit leben wenn nicht der März genau so einen Umlaut trägt und damit nicht
als Datumsformat erkannt wird.
In PowerQuery habe ich schon versucht und versucht und versucht auf UTF-8 umzustellen
bekomme es aber nicht hin.
Dann hatte ich die Hoffnung mit suchen und ersetzen aber da übernimmt er nicht den korrekten Text.
Jetzt hoffe ich über VBA Zellen diese Zeichen zu ersetzen.
Die große Frage ist WIE?
Könnt Ihr mir helfen?
Grüße
von Michael

10
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: (D)eine (Beispiel)datei wäre hilfreich ...
16.03.2022 09:51:26
neopa
Hallo Michael,
... stell doch zumindest mal einen kleinen Auszug Deiner Datei als Datei hier ein, wie sich die Daten nach Import mit PQ zeigen.
Gruß Werner
.. , - ...
AW: micpat1971
16.03.2022 11:42:42
ChrisL
Hi Michael
Ohne konkrete Lösung, mal etwas rumgestochert...
- Enthält die Webseite einen Meta-Text, welcher das Character-Set angibt? ( z.B. meta charset="utf-8" )
- Wenn ja, welches Character-Set?
- Und welches Char-Set wäre als Ziel zu definieren?
- Handelt es sich um eine echte HTML Seite oder vielleicht ein anderes Format wie CSV o.ä., welches einfach als HTML benannt wurde?
Evtl. lässt sich etwas mit den verschiedenen TextEncoding Funktionen machen z.B. UTF-8:
https://docs.microsoft.com/en-us/powerquery-m/textencoding-utf8
cu
Chris
Anzeige
AW: micpat1971
17.03.2022 08:34:55
Michael
Hallo Werner,
das macht Sinn die Datei hochzuladen. Ich mal ein Auszug der Datei hochgeladen, da sonst zu groß
https://www.herber.de/bbs/user/151816.html
Aus meiner Sicht geht nur beim Import das einzustellen,
da ja alle Umlaute so ausgegeben werden �
Danke für die Unterstützung
Gruß Michael
AW: Deine HTML-Datei (Dein Auszug daraus) ...
17.03.2022 10:24:32
neopa
Hallo Michael,
...kann in meiner XL2016er Version nicht in PQ importiert werden. Man kann sie aber direkt in XL öffnen. Dann wird der Datenwert "März" mit einem Umlaut als ein Datumswert erkannt und als solcher als 1.3.22 übernommen.
Gruß Werner
.. , - ...
Anzeige
AW: micpat1971
17.03.2022 14:02:32
ChrisL
@ Werner: Problem lässt sich rekonstruieren, wenn man die HTML-Datei auf den Desktop speichert und danach eine Webabfrage mit URL file:///C:/Users/Me/Desktop/151816.html erstellt.
@ Michael: Öffnet man die Datei im Standard Editor (Notepad), dann sieht man rechts unten, dass die Datei als ANSI codiert wurde. Speichert man die gleiche Datei neu mit Encoding UTF-8 ab, funktioniert alles korrekt. Im Meta-Text ist das Character-Set als windows-1252 definiert.
Fehlgeschlagener Lösungsversuch:
=Text.FromBinary(Text.ToBinary([Column1],1252), TextEncoding.Utf8)
Als Lösungsmöglichkeit sehe ich im Moment nur:
- Das Coding der HTML-Datei zu ändern
- Oder mittels "Werte ersetzen" (M�rz durch März) auszukorrigieren
Ich muss aber zugeben, dass ich mich mit den ganzen Zeichentabellen und Encodings bisher nur oberflächlich auseinander gesetzt habe. Mir macht es dein Eindruck, dass das Kernproblem in einem falschen Coding der HTML-Datei liegt, aber sicher bin ich mir nicht, weil der Browser mit dem Format offensichtlich umgehen kann.
cu
Chris
Anzeige
AW: mit direktem Einlesen der HTML-Datei ...
17.03.2022 14:55:32
neopa
Hallo Chris,
... erhalte ich nicht nur die Daten der HTML-Datei sondern auch deren Formatierungen. Mit der WEB-Abfrage lediglich die Daten.
Mit beiden Methoden wird der in der HTML-Datei vorhandene Datenwert: "März 2022" korrekt als Datumswert eingelesen. Einen weiteren Textwert mit Umlauten hat Michael nicht in seiner Datei, insofern kann ich Michaels Problem auch nicht nachvollziehen.
Gruß Werner
.. , - ...
AW: mit direktem Einlesen der HTML-Datei ...
17.03.2022 15:28:03
ChrisL
Hi Werner
Bei mir werden bei einer simulierten Webabfrage (simuliert, weil die Datei nicht im Web ist) die Sonderzeichen inkorrekt dargestellt. Haben wir die gleiche Ausgangslage?

let
Quelle = Web.Page(File.Contents("file:///C:/Users/Me/Desktop/151816.html")),
Data0 = Quelle{0}[Data]
in
Data0
Wenn die Datei ohne Web-Query direkt in Excel geöffnet wird, dann ist alles korrekt.
cu
Chris
Anzeige
AW: nachvollziehbar ...
17.03.2022 19:40:17
neopa
Hallo Chris,
... ich hatte die Datei anders eingelesen. Zum einen direkt über Datei öffnen und zum anderen über Datei über Daten, Externe Daten abrufen, Aus dem Web eingelesen. Letzteres aber nicht über gleich benannte Funktionalität in PQ.
Danke für Deinen Hinweis.
Michael würde ich nun raten, seine HTML-Datei zunächst direkt in Excel einzulesen und danach diese bei Notwendigkeit mit PQ zu "manipulieren".
Gruß Werner
.. , - ...
AW: nachvollziehbar ...
18.03.2022 09:06:17
Michael
Hallo und besten Dank für Eure Bemühungen.
Ich werde nun die HTML nicht importieren sondern öffnen.
Damit sind die Zmlaute gewährleistet und ich brauch nicht
jedesmal die html -Seite verändern.
Besten Dank und viele Grüße
Michael
Anzeige
AW: bitteschön owT
18.03.2022 12:41:53
neopa
Gruß Werner
.. , - ...

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige