Anzeige
Archiv - Navigation
1656to1660
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

Epub Dateien auslesen

Epub Dateien auslesen
18.11.2018 21:20:02
Oisse
Hallo zusammen,
kann man mit vba Dateien aus epubs auslesen? Wenn ja, wie funktioniert sowas?
Ich weiß, das ist eine ziemlich allgemeine Frage. Ich habe bisher aber im I-net nichts gefunden. Was immer kommt sind pdfs. Wenn man da darin gezielt suchen könnte wäre auch in Ordnung. Aber was gescheites habe ich bisher auch hier nicht gefunden.
Bestimmt weiß jemand von euch, ob - und wenn ja - , wie sowas geht.
Danke für eure Hilfe
Gruß Oisse

10
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
Ganz ehrlich: Was soll die Frage?
19.11.2018 07:17:37
lupo1
Wikipedia zeigt, dass .epub ein Containerformat ist, wie .XLSX eben auch.
LibreOffice (Writer, nicht Calc!) exportiert in .epub den Beispieltext: Dies ist ein EPUB. Das habe ich als Datei angehängt; .epub-Version 3.0:
https://www.herber.de/bbs/user/125474.zip (2,17 KB) lädst Du runter und benennst es zurück in 125474.epub
(.zip habe ich es nur genannt, damit es bei Herber überhaupt hochgeladen werden kann).
Nun musst Du herausfinden, wie/womit Du den Container öffnest, und welche Datei (nämlich: "inhalt.xhtml") die Textdaten enthält.
Übrigens habe ich zu epub in txt oder epub to txt viele Links gefunden. Es sind halt alles Online-Übersetzer, denen ich mich (bei sensiblen Informationen oder bei etwa beabsichtigten Copyright-Verletzungen) nicht anvertrauen würde.
Eine naheliegende Überlegung wäre folgende: So, wie man eine Druckausgabe in eine .prn-Datei umlenken kann, müsste man eine .epub-Ausgabe in eine .txt-Datei umlenken können. Das aber scheint eine Hardware-Verdrahtung der Reader zu sein. Trotzdem: Das Wissen müsste ja auch irgendwo verfügbar sein.
Anzeige
404-Fehler bei der Datei
19.11.2018 07:32:46
lupo1
... vollziehe das ganze selbst mit LibreOffice nach
AW: Ganz ehrlich: Was soll die Frage?
19.11.2018 08:12:44
Oisse
Guten Morgen,
und danke für die Nachricht. Du schreibst, dass das Wissen irgendwo verfügbar sein soll. Stellt sich natürlich die Frage: Wo? Ich habe mir gedacht, dass das sicher kein Problem ist, das sich mir erst stellt, sondern dass es dazu bereits etwas geben müsste, weil das bestimmt schon mehrere gebraucht haben oder hätten (z.B. diverse Codeschnipsel, oder Beispieldateien oder ähnliches). Und weil hier in diesem Forum so viele fitte Leute sind...
Mit Containerdatei usw. kenn ich mich nicht aus. Auch wie man sowas anspricht ist für mich Neuland. Aber genau das wäre eben das interessante. Das mit Text auslesen per Libre Office oder ähnlichem werde ich mal versuchen.
Gruß Oisse
Anzeige
Was sind das denn bei Dir für .epub s?
19.11.2018 08:30:51
lupo1
Handelt es sich um Inhalte, die dem Urheberrecht unterliegen?
Das ist ja auch ein Neben-Grund dafür, epub überhaupt zu verwenden (neben der speziellen Eignung für Reader).
Übrigens öffnet Win10 .epub's ...
19.11.2018 08:40:18
lupo1
... und Du kannst sogar (wie in .pdf's auch) Textpassagen markieren, kopieren und anderswo einfügen.
Allerdings ist Strg-A wohlweislich unterbunden.
AW: Übrigens öffnet Win10 .epub's ...
19.11.2018 09:32:31
Oisse
Danke für die Antworten.
Ja, wenn ich die Datei aufmache, wir sie mir in Edge aufgemacht. Über Entwicklertools kann man auch den Quellcode einsehen. Aber auch hier würde sich die Frage stellen, wie kann ich darin "navigieren". Gibt´s hierfür deutsche Literatur oder I-seiten, die zeigen, wie man sowas per vba machen kann? Wenn das ganze zu kompliziert ist, dann muss es eben manuell gehen. Per vba wäre eleganter und vor allem interessanter.
Gruß Oisse
Anzeige
Das ist eine neue Anforderung ...
19.11.2018 11:30:28
lupo1
... zuerst wolltest Du den Text-Extrakt.
Dass man sich Texte dann noch zurechtlegen muss, ist Dir sicherlich klar.
Navigieren kann man schließlich auch im .epub-Reader
Ja und nein...
19.11.2018 13:38:35
Oisse
denn mein Ziel ist es ja, an den Text zu kommen. Und wenn du schreibst, "Navigieren kann man schließlich auch im .epub-Reader" stellt sich ja genau für mich die Frage: Wie?
Genau das will ich ja wissen. Wie komme ich mit VBA da hin? Muss ich andere Programme dazu benutzen? Wenn ja, wie öffne ich die? Dabei ist es mir einerlei, ob das mit Word geht, mit LibreOffice Writer oder eben mit Edge. Wie komme ich an die Daten mit vba? Wie muss der Code aussehen? Das ist die zentrale Frage.
Und - ich finde es super, dass du dich meiner Frage annimmst. Danke dafür.
Wenn es aber über Gebühr beansprucht und das Ganze zu aufwändig ist, dann muss es eben "händisch" gehen.
Anzeige
Den EPUB-Container kannst...
19.11.2018 08:42:27
Case
Hallo, :-)
... Du einfach mit 7Zip entpacken und dann die darin enthaltenen XHTML-Dateien durchsuchen/auslesen.
Hier ein Beispiel wie das mit einer XLSB-Datei geht - nach dem selben Prinzip dann auch für EPUB-Dateien.
Container auslesen...
Auf das Urheberrecht hat ja Lupo1 schon hingewiesen.
Servus
Case

Für Linux/MacOS gefunden
19.11.2018 08:53:30
lupo1
https://askubuntu.com/questions/102458/how-can-i-convert-epub-files-to-plain-text
Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige