Microsoft Excel

Herbers Excel/VBA-Archiv

Daten aus gescanntem PDF auslesen

Betrifft: Daten aus gescanntem PDF auslesen von: Dirk
Geschrieben am: 26.07.2014 12:52:21

Hallo zusammen,

ich hoffe, daß mir jemand bei meinem Problem helfen kann.
Ist es möglich aus einem eingescannten Fahrzeugschein im
PDF-Format die Daten auszulesen und in Textboxen zu
schreiben ?

Vielen Dank im Voraus

Gruß Dirk

  

Betrifft: ich weiß zwar nich alles, glaube aber... von: Oberschlumpf
Geschrieben am: 26.07.2014 17:10:08

...dass es NICHT möglich ist

Hi Dirk

Etwas, was du eingescannt hast, ist im Ergebnis IMMER eine Grafik.
Außer mit OTR-Software, ich kenn keine gute, hast du da wohl schlechte Karten.

Ciao
Thorsten


  

Betrifft: AW: ich weiß zwar nich alles, glaube aber... von: Nepumuk
Geschrieben am: 26.07.2014 17:36:18

Hallo Thorsten,

gehen tut alles. PDF öffnen - kein Problem. Die Bildschirmkoordinaten des Bildes rausbekommen - nicht sehr schwierig. Das Bild Pixel für Pixel auszulesen - nicht sehr schwierig. Die Pixel auswerten und in dem Muster einzelne Buchstaben zu erkennen - Hmmmmmmm sagen wir mal "hohe Kunst" aber machbar. Gib mir 3 Monate und es ist fertig. Zumindest für eine definierte Schriftart. Für die anderen Schriftarten brauche ich dann nochmal so 2-3 Jahre. Und wenn's auch noch Kyrillische oder Chinesische Zeichen erkennen soll, dann, ja dann bin ich schon in Rente und verfolge den Werdegang des Programms gemütlich vom Schaukelstuhl aus.

Dirk könnte aber auch eine OCR-Software benutzen, die sind meistens gar nicht so schlecht. Z.B.: Capture2Text

Gruß
Nepumuk


  

Betrifft: AW: ich weiß zwar nich alles, glaube aber... von: Oberschlumpf
Geschrieben am: 26.07.2014 17:40:55

oh ups...Hi

das heißt ja OCR, nich OTR...sry, mein Fehler.
Und Capture2Text kannte ich bis zu deinem Hinweis nicht, wieder was gelernt :-)

Aber deine Prognose, wie lange es dauern könnte mit unseren "Mitteln", etwas zu basteln....ich denk, ich setzt mich ab JETZT in den Schaukelstuhl :-)

Ciao
Thorsten


  

Betrifft: AW: ich weiß zwar nich alles, glaube aber... von: Michael
Geschrieben am: 26.07.2014 18:13:02

Hallo zusammen,

ich hab mit FreeOCR mal herumprobiert; kostet nix und hat mir getaugt (30 Jahre alter Text, mit der guten, alten Rheinmetall getippt).

Wenn ich so etwas mit Kfz-Scheinen versuchen würde, würde ich so etwas wie eine Schablone basteln, die ich auf den Schein lege, so daß nur die Werte gescannt werden, die ich hinterher auch benötige: beschleunigt sicher das Scannen (Quatsch) bzw. OCRen, führt aber auch dazu, daß weniger "Krakel" in der Ausgabe vorhanden sind.

Ich seh grad, daß mein Brother Control Center (das liefern die seit Jahren mit) AUCH geOCRt als .txt abspeichern kann. Soll heißen, warum nicht als PDF UND als txt abspeichern, wenn Du Dein Gerät anwirfst?

Sagen wir mal so: wegen 5 Scheinen brauchst Du gar nix programmieren, wegen 500 lohnt sich die Anschaffung eines Geräts mit OCR-Funktion.

Deine Daten aus einer .txt auszulesen, ist unter Excel machbar.

Schöne Grüße, und ab in die Schaukelstühle,

Michael


  

Betrifft: AW: ich weiß zwar nich alles, glaube aber... von: Spenski
Geschrieben am: 26.07.2014 19:36:21



hi dirk

magst du eventuell mal eine eingescante pdf von dir hochladen und sagen was du davon haben willst in der textbox?


gruss


 

Beiträge aus den Excel-Beispielen zum Thema "Daten aus gescanntem PDF auslesen"