Moin!
Ich möchte über ein paar pdfs eine Texterkennung laufen lassen. Ich habe gocr. gocr will aber Bilder haben und keine pdf-Datei.
Gibt es eine Möglichkeit, die pdf-Dateien seitenweise zu jpeg zu extrahieren (unter Windows ging das mit dem Acrobat)? Nach dem ocr sollten die Bilder (oder was gocr so produziert) natürlich wieder zu pdfs zu machen sein.
Oder gibt es noch eine andere Lösung/ein besseres Programm?
Lesezeichen