Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
1740to1744
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

Webseite als Webarchiv (mht) speichern

Webseite als Webarchiv (mht) speichern
25.02.2020 16:11:05
Volker
Hallo zusammen,
habe bei meiner Suche hier im Forum bisher nichts gefunden, deshalb meine Bitte um "Nachhilfe":
Ein Teil meines Makros soll per VBA eine Webseite aufrufen und diese als mht-Datei (komplettes Webarchiv als einzelne Datei) speichern.
Wer kann helfen?
Dank vorab &
viele Grüße
Volker

15
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: Webseite als Webarchiv (mht) speichern
25.02.2020 17:31:57
Zwenn
Hallo Volker,
ich habe keine Ahnung wie das geht. Aber mal als Hinweis aus dem Wikipedia Artikel zu Deinem geplanten Format:
https://de.wikipedia.org/wiki/MIME_Encapsulation_of_Aggregate_HTML_Documents
Um einzelne Webseiten in einer möglichst originalgetreuen Form zu archivieren, ist MHTML ein geeignetes Mittel. Inhalte ganzer Websites hingegen können so nicht effizient archiviert werden; für solche Anlässe bietet sich z. B. wget an.
Schau Dir doch wget mal an. Vielleicht ist das wirklich besser geeignet für Dein vorhaben.
https://de.wikipedia.org/wiki/Wget
Viele Grüße,
Zwenn
Anzeige
AW: Webseite als Webarchiv (mht) speichern
25.02.2020 18:47:36
Volker
Danke Zwenn,
aber ich möchte doch noch abwarten, ob jemand eine Lösung hat.
Die Möglichkeit eine Webseite als mht-Datei (komplettes Webarchiv als einzelne Datei) abzuspeichern, bietet der Internet-Explorer. Weil damit die Webseite tatsächlich zu fast 100% offline verfügbar ist und der IE ja auch in WIN10 enthalten ist, wäre eine Lösung toll.
Der Weg müsste sein: Webseite per Internet-Explorer aufrufen und über diesen als mht-Datei abspeichern. Kriege ich aber nicht hin :-(
Gruss
Volker
AW: Webseite als Webarchiv (mht) speichern
25.02.2020 19:16:02
ChrisL
Hi Volker
Einen direkten Weg gibt es gemäss meiner kurzen Recherche nicht. Hier die SendKeys Variante, wovon ich jedoch abraten würde (unzuverlässig resp. fehleranfällig).
http://www.office-loesung.de/ftopic284955_0_0_asc.php
Alternativvorschläge:
https://stackoverflow.com/questions/37775482/select-to-open-a-html-file-from-local-hard-drive-to-save-as-mht-file-then-import
https://www.utteraccess.com/forum/index.php?showtopic=2046213
https://stackoverflow.com/questions/27419804/VBA-excel-download-webpage-complete
Es bleibt die Frage offen, worum es dir eigentlich geht. Allfällige Scripts sind mit mht sowieso weg. Bilder?
cu
Chris
Anzeige
AW: Webseite als Webarchiv (mht) speichern
25.02.2020 19:47:38
Volker
Hallo Chris,
vielen Dank, die Links werde ich mal alle durchkauen!
Meine Absicht war die Frage möglichst kurz zu halten, aber gerne mal ausführlich:
Es geht um "Discogs". Dort kann man u.a. seine Tonträgersammlung erfassen und diese als csv-Datei downloaden, um sie anschließend in Excel einzulesen. In dieser csv-Datei stehen aber relativ wenig Daten. Was u.a. geliefert wird, ist die sogenannte "Release-ID", die eindeutig ist. Nun möchte ich z.B. www.discogs.com/release/11586555 aufrufen und bekomme die CD mit allen Details angezeigt. Wenn ich diese Seite als mht-Datei speichere, einen Hyperlink zu dieser Datei in meiner Excel-Liste setze, habe ich offline alles verfügbar.
Gruss
Volker
Anzeige
AW: Webseite als Webarchiv (mht) speichern
26.02.2020 11:27:51
ChrisL
Hi Volker
Da könntest du wahrscheinlich einer der Alternativvorschläge verwenden, welcher dir die Seite als Text abspeichert.
cu
Chris
AW: Webseite als Webarchiv (mht) speichern
26.02.2020 19:11:51
ChrisL
Hi nochmal
Nachdem wir die Theorie (ob machbar) geklärt hätten, würde ich dir empfehlen noch einmal einen Schritt zurück zu machen.
Für das mht Format spricht m.E. einzig, die darin eingebetteten Bilder (= 1 Datei). Aber wie ich verstehe geht es dir eigentlich um die Daten, weshalb ich ein klassisches Datenbankformat anstreben würde (vereinfacht u.a. die Suche nach einzelnen Titeln und Musikern). Im Idealfall eine relationale Datenbank (Album -> CD -> Track -> Interpret usw.).
cu
Chris
Anzeige
AW: Webseite als Webarchiv (mht) speichern
26.02.2020 11:31:03
Zwenn
Hallo Volker,
ich habe deinen Link jetzt mal unter dem IE im mht-Format gespeichert. Wenn man das Archiv dann aufruft ist die Seite "gedimmt" und alle Links sind inaktiv. Soll das so sein?
Ich habe die Links von Chris aus Zeitmangel noch nicht sichten können. Ich nutze den IE unter anderem aber auch, um Internetseiten automatisch über den Standarddrucker als PDFs zu speichern. Da muss ich mal nachsehen, ob es auch einen Parameter gibt "Speichern unter" mit der gewünschten Formatübergabe ".mht". Da komme ich aber erst in den nächsten Tagen zu. Vielleicht findest Du ja vorer schon eine Lösung :-)
Viele Grüße,
Zwenn
Anzeige
AW: Webseite als Webarchiv (mht) speichern
26.02.2020 12:46:27
Zwenn
So,
ich war etwas neugierig. Mit dem IE direkt geht das wohl nicht. Es gibt aber andere Tools, die Du über die Komandozeile steuern kannst (also shell). Ich habe es mit dem hier ausprobiert:
https://download.cnet.com/Command-Line-URL-To-MHT-Converter/3000-10247_4-10623400.html
Das funktioniert mit Deinem Beispiellink. Allerdings dauert das Schreiben der Datei etwas und das Öffnen dauerte bei mir noch länger. Ob es Parameter gibt habe ich nicht untersucht. Die beiliegenden BAT Dateien sind selbsterklärend (ist jeweils eine Zeile, die man auch in der shell verwenden kann).
Damit würde ich mal rumexperimentieren und ggf nach einem anderen (neueren) Tool suchen.
Viele Grüße,
Zwenn
Anzeige
AW: Webseite als Webarchiv (mht) speichern
27.02.2020 12:11:37
Volker
Hallo Zwenn,
vielen, vielen Dank!
Aufgefallen ist mir, dass die mht-Datei, die "Command-Line-URL-To-MHT-Converter" erzeugt, beim Beispiellink dreimal so gross ist, wie die direkt aus dem IE (ca. 2,2 MB statt ca. 700 KB).
Werde noch weiter rumprobieren, brauche aber noch etwas Zeit.
Setze die Frage nochmal auf "offen"; vielleicht hat noch jemand eine Idee.
Gruss
Volker
AW: Webseite als Webarchiv (mht) speichern
27.02.2020 14:33:31
Zwenn
Hallo Volker,
das Tool ist von 2007 soweit ich gesehen habe. Ich habe da nicht bis ins letzte Recherchiert, sondern nur das erst Beste ausprobiert, um grundsätzlich eine Aussage für diesen Weg treffen zu können. Die 2,2 MB sind mir auch aufgefallen. Ich gehe davon aus, dass es modernere Tools gibt, mit denen man arbeiten kann.
Das nur als Info. Frage bleibt offen, wie von Dir gewünscht :-)
Viele Grüße,
Zwenn
Anzeige
Webseite als Webarchiv (mht) speichern
27.02.2020 16:19:45
Anton
Hallo Volker,
suchst du sowas, wie das hier?
mfg Anton
Link in einem eigenen Tab öffnen oT
27.02.2020 16:21:04
Anton
AW: Webseite als Webarchiv (mht) speichern
27.02.2020 18:05:44
Zwenn
Hallo zusammen,
sehr gute Lösung, die Du da verlinkt hast Anton :-) Habs gerade ausprobiert. Geht schnell, sind nur ein paar Zeilen und es kommt genau das raus, was Du willst Volker.
Viele Grüße,
Zwenn
AW: Webseite als Webarchiv (mht) speichern
28.02.2020 20:06:34
Volker
Hallo Anton,
hallo Zwenn,
zunächst mal vielen Dank!
Ja, es wäre die Top-Lösung, wenn das Ergebnis genauso wäre, wie beim manuellen Speichern im IE. Aber hier ist die Dateigröße teilweise 5(!)mal so groß. Bei vielen abzuspeichernden Datei spielt dies schon eine Rolle. Und deshalb dauert dann auch das Öffnen viel länger und ist außerdem mit folgenden Meldungen verbunden:
Aktualisieren Sie Ihren Browser. Installieren Sie die aktuellste Version von Firefox, Chrome oder dem Internet Explorer.
Bitte aktivieren Sie Javascript, um von allen Inhalten unserer Seite zu profitieren.
Das Ausführen von Scripts bzw. AktiveX-Steuerelementen wurde für diese Webseite eingeschränkt

Diese Meldungen kommen bei manuell abgespeicherten Dateien nicht.
Habe heute viel ausprobiert, bin aber noch zu keiner anderen Lösung gekommen.
Grübelnde Grüße
Volker
Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige