PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Gesucht : "tex2txt" --- Latex-Code extrahieren



snoweye
21-03-2006, 19:15
Hallo,

ich suche eine Möglichkeit, aus .tex Dateien .txt Dateien zu erstellen, indem einfach der Latex-Code entfernt wird. Es gibt zwar das Kommando 'untex', steht mir jedoch nicht zur Verfügung. Eine Suche im Netz nach einem script, sinnvollerweise bezeichent als 'tex2txt' hat keinen Erfolg gebracht.

Hintergrund : Zwar ist mit

ispell -t -Tlatin1 -d deutsch <tex-file>

eine deutsche Rechtschreibprüfung gut möglich, ich möchte allerdings zusätzlich mit WINWORD prüfen lassen. Prinzipiell könnte man ja auch aus PDF-Files den text manuell extrahieren, bei Umlauten streikt mein Reader allerdings.

Kennt jemand ein solches .tex -> .txt scirpt ?

Danke :)

edico
21-03-2006, 20:07
#!/usr/bin/perl
# Kalvis M. Jansons $Date: 2002/09/28 15:22:14 $
# This script is called ``txt2tex''.
....
google mal - vielleicht gibt's eine neuere Version
edico

snoweye
22-03-2006, 09:27
danke, aber 'txt2tex' läuft glaub genau anders rum, erzeugt ein latex-doc aus einem txt-file

rais
22-03-2006, 14:27
Na,
dann google doch nach "tex2txt", alternativ "latex2txt" - letztere hat zwar ne Homepage, damit kann ich aber nix anfangen, da auf japanisch...
MfG,

edico
23-03-2006, 08:44
ups, man muss lesen können ;-)
Ich kenne keinen 'direkten' Konverter. Liegt die Lösung also hier:
FAQ:
11.3.5 Konvertierungsprogramme von (La)TeX in einfaches Textformat? (*)
Das mache ich dann so:
latex2html -split 0 -no_navigation test.tex && w3m -dump test/test.html > test.txt
Der output ist recht ansprechend ...
Eine ebenso ordentliche Alternative ist der pdftotext Konverter (aus dem xpdf-programm).
edico

snoweye
23-03-2006, 20:35
ups, man muss lesen können ;-)

Ok, stimmt natürlich, habs nicht gelesen :( ... Dachte nur, es gäbe was direktes, ohne Umweg.

Scheint allerdings nichts (brauchbares) zu geben ... hab (selbstverständlich) google gefragt, 'tex2txt' und 'latex2txt' brauchten beide keine brauchbaren Ergebnisse.

Werds jetzt mit dem Umweg über PS mit anschließendem ps2ascii machen ...

Thread kann geschlossen werden, Danke @all :)