PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Problem NACH UTF8 Konvertierung



BTFYA
30-09-2009, 02:00
Hallo,

ich habe ein seltsammes Problem nach einer Ansi > UTF8 konvertierung.

Also alles hat schön funktioniert mit Ansi. Dann musste ich text zusammenfügen, also war ein umstieg notwendig. Dazu habe ich mit Notepad++ konvertiert. Es kommt nun ein sehr seltsammer Fehler, den ich im Anhang gepostet habe. Ansi Datein kann ich nach wie vor kompilieren. Auf einen anderen Linux Rechner lassen sich diese von mir wirklich nur mit notpad++ konvertierten dateien auch nicht kompilieren.

Ich verstehe das Problem einfach nicht. UTF8-Package ist installiert, der text sieht normal aus aber es geht einfach nicht.

Vielen Dank für Hilfe!

Federstrich
30-09-2009, 02:15
Hallo BTFYA,

ich weiß, die Frage kommt ständig: Könntest du bitte ein Minimalbeispiel posten, womit dein Fehler reproduziert werden kann?
Dann müsste ich wissen, welchen Editor du für LaTeX benutzt. Es sieht ja so aus, als würdest du über die Eingabeaufforderung kompilieren...

Vielleicht steht auch noch was im log-file. Poste das doch bitte auch gleich mit.

Viele Grüße,
Federstrich

localghost
30-09-2009, 09:22
[...] Also alles hat schön funktioniert mit Ansi. Dann musste ich text zusammenfügen, also war ein umstieg notwendig. Dazu habe ich mit Notepad++ konvertiert. Es kommt nun ein sehr seltsammer Fehler, den ich im Anhang gepostet habe. Ansi Datein kann ich nach wie vor kompilieren. Auf einen anderen Linux Rechner lassen sich diese von mir wirklich nur mit notpad++ konvertierten dateien auch nicht kompilieren. [...]
Da scheint bei der Konvertierung etwas geringfügig falsch gelaufen zu sein. Kommst schon mal vor. Ist mir auch schon passiert. Der Fehler deutet aber eigentlich schon darauf hin. Dort, wo die Dokumentklasse festgelegt wird, hat sich ein unerlaubtes Zeichen eingeschlichen (erste Zeile, erste Spalte). Auch wenn man es nicht sieht. Um sicher zu gehen, lösche die Zeile mal komplett und tippe sie neu ein.

Ziemlich sicher ist die Konvertierung mit recode (http://linuxwiki.de/recode). Gehört zum Umfang jeder Linux-Distribution.


MfG
Thorsten¹

u_fischer
30-09-2009, 09:23
Notepad hat einen sog. BOM (Byte Order Mark) am Anfang der Datei einfügt. Der wirkt wie ein Buchstabe vor \documentclass. Speichere die Datei mit einem anderen utf8-Editor noch mal und entferne dabei den BOM.

BTFYA
30-09-2009, 10:54
Ein mimimalbeispiel ist doch eine möglichst einfache konfiguration die nicht funktioniert. Hier ist eine:

\documentclass{scratc1}

\begin{document}

\section{minimal}

\end{document}


Habe ich selber per hand geschrieben. Habe auch mal alle dateien in einen anderen ordner verschoben. Irgendwie glaube ich es liegt daran dass notepadd++ kein utf-8 "will" beim kompilieren.

u_fischer
30-09-2009, 11:29
Seufz. Warum glaubt mir keiner. Das Problem ist der BOM.

Und eine kurze Google-Suche nach notepad++ und BOM ergibt, dass man unter format "Encode in UTF-8 without BOM" einstellen kann.

localghost
30-09-2009, 11:40
Seufz. Warum glaubt mir keiner. Das Problem ist der BOM. [...]
Wenn es dich tröstet. Ich glaube dir.

BTFYA
30-09-2009, 12:03
Ich habe das ganze mit einen anderen editor gespeichert... dachte da wäre kein problem. Aber umstellen auf "utf8 ohne bom" hats getan. Es geht vielen Dank.

Nur warum tun die das?

BTFYA
30-09-2009, 12:14
Ah jetzt ist y und z beim tippen vertauscht. Aber nur in notepad++. Was kann man dagegen machen?
Hab schon versucht die Tasten rauszuziehen, aber die sind total fest. Sonst könnte ich einfach da wo y war z reinmachen... :-D

u_fischer
30-09-2009, 12:34
Nur warum tun die das?

Den BOM benötigen utf16 + utf32 kodierte Dateien, damit sie wissen, wo "vorne" ist. In utf8 wird er nicht benötigt, ist aber erlaubt, stört aber LaTeX (und andere Programme) und sollte eigentlich nicht benutzt werden.

http://de.wikipedia.org/wiki/Byte_Order_Mark


Ah jetzt ist y und z beim tippen vertauscht.

Du verwendest ein englische Tastaturlayout mit einer deutschen Tastatur (oder umgekehrt).