PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : PDF to (La)Tex Konverter???



KKO
22-01-2007, 17:11
Hi,

gibts eigentlich auch Programe die den umgekehrten Weg gehen können, d.h. noicht aus LaTeX heraus PDFs zu erzeugen, sondern aus PDFs TeX-Dokumente???

würde mir sehr viel weiterhelfen.....

danke schonmal (in der hoffnung auf positive antworten ;) )

grüße
kko

Christoph
23-01-2007, 09:56
Da gibt es anscheinend kommerzeille Software, die PDF in bearbeitbare Dokumentformate umwandeln kann: http://www.verypdf.com/.

Und bei xpdf ist ein freies Porgramm pdftotext dabei.

Lilliane
23-01-2007, 11:01
Hallo Christoph, hallo kko,

das Thema interessiert mich auch, weil eine Umwandlung den Klauschutz stark aufweichen würde. Ich mein jetzt nicht den Text als solchen (der geht relativ einfach zu extrahieren), sondern den Text-Satz in Latex inkl. mathematischer Formeln. Gibt es ein Tool, das das kann?

Viele Grüße

Lilliane

cookie170
23-01-2007, 15:57
Hallo,

das Thema wurde auf dctt gerade ausführlich diskutiert, hilft Dir dieser Link weiter?

http://groups.google.de/group/de.comp.text.tex/browse_frm/thread/84300b53671e41f8/0afba32aee002e77?tvc=1&q=tex4ht&hl=de#0afba32aee002e77

Gruß,
Alexander

KKO
23-01-2007, 16:42
Hi.
danke erstma für die reaktionen. aber leider hilft es mir nicht weiter.
in dem link von alexander wird ja auch der umgekehrte weg diskutiert, nämlich irgendwie aus tex ein *.doc hinzukriegen.

mir geht es aber darum in irgendeiner art und weise ein vorhandenes pdf-dokument in (la)tex umzuwandeln...wie gesagt ich habe keinen blassen schimmer ob überhaupt so etwas in dieser richtung existiert, aber da es in die andere richtung (sinnvollerweise ;) ) geht, könnte ich mir vorstellen, dass es auch so rum machbar sein muss....

beste Grüße

lupus68
23-01-2007, 18:12
Hallo KKO,

diese Frage habe ich doch erst vorgestern beantworten KWord kann PDFs mehr oder weniger gut öffnen, theoretisch sogar nach LateX exportieren aber wirklich nur theoretisch. Qualität des Exportes ungefähr in folgender Reihenfolge

LaTeX \dots \hfill \cleardoubelpage\hfill \dots Lyx \dots \newpage\dots OOo-Writer \dots \hfill \dots \kword
;-)

aber du hast erstmal den Text und die meisten Bilder samt einer zumindesten rudimentären Formatierung in einem freien Format.

juergen

KKO
23-01-2007, 18:34
besten dank jürgen....
hatte gerade noch eine andere idee:
aus dem pdf bekomme ich ja problemlos ein postScript, und aus ner ps-datei wirds doch wohl auch nen weg zu (La)TeX geben oder?

bin immer offen für interessante hinweise...

Tschö

lupus68
23-01-2007, 20:15
Hallo KKO,


aus dem pdf bekomme ich ja problemlos ein postScript, und aus ner ps-datei wirds doch wohl auch nen weg zu (La)TeX geben oder?


Ich glaube du hast das Prinzip von LaTeX nicht verstanden. Vielleicht ist es besser du nimmst dir erstmal eine gute Einsteigerlektüre.
Was ist LaTeX (http://www.mrunix.de/forums/showthread.php?t=18466) scheint mir schon mal ein guter Anfang zu sein;-)

juergen

KKO
23-01-2007, 20:31
...
das Prinzip ist mir schon klar, dennoch wäre es schön wenn die Problematik lösbar wäre....
an Einsteigerliteratur mangelt es mir nicht ;-)
trotzdem besten Dank für die Unterstützung!

Grüße

lupus68
23-01-2007, 20:45
...
an Einsteigerliteratur mangelt es mir nicht ;-)

Das Problem an der Magersucht ist doch das die leute trotz vollem Kühlschrank langsam verhungern ;-)

juergen

KKO
23-01-2007, 20:49
*blub*
ist ja gut jetzt...

pospiech
24-01-2007, 08:11
ner ps-datei wirds doch wohl auch nen weg zu (La)TeX geben oder?

Und aus eine Brot gewinnst du die Eier, den Zucker, das Mehl, ...

Der Vergleich sollte dir zeigen, das dein Wunsch niemals machbar ist!

Matthias

Christoph
24-01-2007, 08:25
Und aus einem Brot gewinnst du die Eier, den Zucker, das Mehl, ...

Der Vergleich sollte dir zeigen, das dein Wunsch niemals machbar ist!

Naja, die Aussage würde ich jetzt so nicht wagen! Allerdings ist diese Aufgabe nicht trivial, da ja alle Informationen der Latex-Semantik bei der PDF-Formatierung verloren gehen, so dass man für die Erzeugung von Latex aus PDF oder PS irgendwelche Annahmen machen muss.

Dass das prinzipiell geht, zeigt z.B. citeseer. Hier wird aus PDF-Dateien die Refernezliste extrahiert (basierend auf bestimmten Annahmen, so dass natürlich ein Dokument, das sich nicht daran hält, nicht ausgewertet werden kann), und das klappt recht gut.

bischi
24-01-2007, 13:44
Und aus eine Brot gewinnst du die Eier, den Zucker, das Mehl, ...

Der Vergleich sollte dir zeigen, das dein Wunsch niemals machbar ist!

Da merkt man eben, dass du Physiker bist :D (Für Ingenööre gibts "geht nicht" nicht ;) )

LaTeX-Code alleine dürfte nicht das Problem sein, schöner LaTeX-Code hingegen schon eher (sonst hast du dann einfach ein \hspace{-2.2mm}\vspace{+1.2mm}...)


MfG Bischi

pospiech
24-01-2007, 21:41
Da merkt man eben, dass du Physiker bist :D (Für Ingenööre gibts "geht nicht" nicht ;) )

Ich meinte natürlich, das ein LaTeX Dokument mit einer sinnvollen Struktur nicht möglich ist. Aber das hast du und den Vorredner ja auch schon klar gemacht.

Matthias