OCR und Übersetzungssoftware gesucht

Helveticus

Member
Themenstarter
Registriert
29 Feb. 2008
Beiträge
744
Hallo

Ich habe ein Skript über meine Familiengeschichte erhalten. Es enthält 150 Seiten bestehend v.a. aus Kopien aus Büchern, welche aber gut lesbar sind. Ich habe nun alle Seiten eingescannt (schwarz / weiss). Nun möchte ich dies alles in ein schöneres Buchformat setzen (in LaTeX) und zudem noch ins Deutsche übersetzen (ist in Englisch).

Kann ich die eingscannten Seiten (150 Scans) irgendwie in Text umwandeln, also mittels OCR bzw. welche Software oder Website nimmt man da? Bestenfalls sogar in LaTeX Format. Das würde natürlich viel schneller gehen als alles abzuschreiben. Auf den Seiten sind teilweise auch Grafiken und Bilder vorhanden, diese sollten dann einfach so beibehalten werden.

Gibt es zudem eine Übersetzungssoftware, welche alles in Deutsche übersetzt? Ich bin zwar sehr gut im Englischen und könnte dann manuell noch Korrekturen machen, allerdings würde ich so natürlich viel Zeit sparen.

Edit: Ich verwende Windows 10.
 
Zuletzt bearbeitet:
Kann ich die eingscannten Seiten (150 Scans) irgendwie in Text umwandeln
Na klaro, irgendwie geht das immer :-)

also mittels OCR bzw. welche Software nimmt man da?
Adobe Acrobat kann das oder z.B. Abby Finereader (Ist häufig bei Scannern in einer OEM Version mit dabei).

Wenn es kostenlos sein soll, gibt es wohl FreeOCR. Keine Ahnung wi egut das funzt.

Allerdings ob eines der Programme Latex spricht ? Ich glaube eher nicht. Da wird in den meisten Fällen sowas wie Word oder PDF herauskommen.
 
Abby Finereader hat gute Bewertungen. Habe noch Google Docs OCR gefunden, das wäre dann online und soll auch gut sein.
 
Dann kannste das bei der Gelegenheit auch direkt durch den Google-Übersetzer jagen (wenn der soviel Text schafft und das ganze nicht allzu speziell ist). Richtig tolle Übersetzungsergebnisse darfst du von einer Maschinenübersetzung eh nicht erwarten. Das schaufelt dir vllt. die Masse durch, aber der Nacharbeitsaufwand ist trotzdem nicht zu unterschätzen (je nach angepeiltem Verwendungszweck).

Viele Grüße,
Matt
 
Kann Matt nur zustimmen.

Je nachdem wie fit man in der Ausgangssprache bzw. im Übersetzen ist, kann eine - leider nach wie vor nur leidlich gut funktionierende - maschinelle Übersetzung die Sache eher noch verkomplizieren. Im Zweifelsfall würde ich mir da lieber gleich den zunächst vermeintlich größeren Aufwand machen und komplett manuell übersetzen. Spätestens wenn man bei der Nachbearbeitung feststellt, dass manche Stellen überhaupt keinen Sinn ergeben, weil die maschinelle Übersetzung nicht verstanden hat, worum es geht, und man dann doch wieder im Original-Text nachschauen muss, braucht man die zuvor eingesparte Zeit oftmals dann doch wieder... Ganz davon abgesehen, dass selbst wenn die Informationen an sich durchkommen, Stil, Textfluss und Lesbarkeit bei einer maschinellen Übersetzung oft furchtbar sind.

Bei sowas wie der Familiengeschichte könnte sich evtl. ja aber auch eine "professionelle" Übersetzung lohnen? Da gibt es einige Freelancer (z.B. auch Studenten mit sprachlichen Studiengängen) die sowas zu angemessenen Preisen in guter Qualität machen.
 
Abby Fine Reader ist sehr zu empfehlen. Ich kenne einen Übersetzungsdienstleister der bei der Auszählung von Geburtsurkunden etc. darauf vertraut. Das funktioniert ziemlich gut.

Wenn ich mich recht entsinne, gibt es die Möglichkeit im Scan festzulegen, was Text, was Grafik und was eine Tabelle ist (mit Rahmen in unterschiedlichen Farben). Dann übernimmt das Pogramm das genau so und erstellt dir eine Word-Datei.

Hier mal ein Link zu einer 15 Tage Demo:

http://www.chip.de/downloads/Abbyy-FineReader-Pro_13002563.html
 
Zuletzt bearbeitet:
Vielen Dank für die Tipps. Ich werde wohl manuell übersetzen.

Aviator, weisst du gerade ob die Demo vom Abby Finereader voll funktionisfähig ist? Ich bräuchte es ja nur 1x.
 
Ich hab den fine Reader vor längerer Zeit mal getestet. Di Demo hatte ne Seitengrenze, was deinem Projekt Grenzen setzt.
An Unis gibt's häufig OCR Stationen. Vielleicht hast du da Zugang zu.....
 
Ich nutze Adobe Acrobat. Mache das selten genug um mich jedesmal zu wundern. Manchmal liefert er überraschend gute Ergebnisse und manchmal scheitert er total.

Gut finde ich zumindest bei Visitenkarten die eigebaute Funktion von Samsung Galaxy S5. Selbst mit recht unglücklichen Fotos kommt er gut zurecht. Lässt sich das für OCR "missbrauchen"?
 
Wenn es eine kostenlose und für diesen Zweck etwas rudimentäre Anwendung sein darf, könnte man eventuell auch darüber nachdenken, die entsprechenden Dokumente mit dem "Send to OneNote"-Druckertreiber in OneNote auszudrucken und den Text anschließend mit der OneNote-OCR-Funktion zu erfassen. Bei meinen Tests funktionierte das überraschend gut.
 
Vielen Dank für die Tipps.

Ich habe noch ein weiteres Problem. Und zwar habe ich eine A3 Seite, welche nicht mit OCR bearbeitet werden muss, brauche nur das Bild. Mein Scanner unterstützt allerdings nur A4. Ich könnte natürlich das A3 als 2x A4 scannen und dann zusammensetzen. Gibt es da ein Tool, mit dem das geht?

Oder ich könnte z.B. mit dem Samsung Smartphone ein Photo machen, allerdings sieht das Ergebnis dann anders aus als die Scans. Gibts da vielleicht auch ein Nachbearbeitungstool?

Bei sowas wie der Familiengeschichte könnte sich evtl. ja aber auch eine "professionelle" Übersetzung lohnen? Da gibt es einige Freelancer (z.B. auch Studenten mit sprachlichen Studiengängen) die sowas zu angemessenen Preisen in guter Qualität machen.

Wo findet man denn solche Freelancer?
 
  • ok1.de
  • IT Refresh - IT Teile & mehr
  • thinkstore24.de
  • Preiswerte-IT - Gebrauchte Lenovo Notebooks kaufen

Werbung

Zurück
Oben