PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Problem bei Kodierung/Enkodierung



anhirsch
29-05-2007, 11:33
Hallo,

ich schreibe zur Zeit einen Artikel in der Fremdsprache Russisch, mit LaTex – russifizierung. Bisher hat alles einwandfrei funktioniert. Plötzlich ist das TEX abgestürzt, danach bekomme ich anstatt Text nur noch eine wirre Zeichenmischung angezeigt.

Folgende Zeichen bekomme ich nun angezeigt:

\section{\~{A}{\aa}\^{\i}\`{\i}{\aa}\`{o}ð\`{e}{\d iv}{\aa}\~{n}\^{e}\`{e}{\aa} \"{\i}ð{\aa}\^{\i}\'{a}ð\`{a}\c{c}\^{\i}\^{a}\`{a}\' {\i}\`{e}\"{y}}
\'{Y}\"{e}{\aa}\`{\i}{\aa}\'{\i}\`{o}\`{a}ð\'{\i}\`{a}\"{y}
\~{a}{\aa}\^{\i}\`{\i}{\aa}\`{o}ð\`{e}\"{y}
\^{\i}\"{\i}ð{\aa}\"{a}{\aa}\"{e}\"{y}{\aa}\`{o}\~{n}\"{y}
\"{\i}\^{\i} \`{e}\c{c}\^{a}{\aa}\~{n}\`{o}\'{\i}\^{\i}\'{e}
\'{Y}ð\"{e}\`{a}\'{\i}\~{a}{\aa}\'{\i}\~{n}\^{e}\^{\i}\'{e }
\"{\i}ð\^{\i}\~{a}ð\`{a}\`{\i}\`{\i}{\aa}
\^{O}.\^{E}\"{e}{\aa}\'{e}\'{\i}\`{a} \^{e}\`{a}\^{e}
\~{a}ð\'{o}\"{\i}\"{\i}\`{a}
\"{a}\^{a}\`{e}{\ae}{\aa}\'{\i}\`{e}\'{e}.
\"{A}\^{a}\`{e}{\ae}{\aa}\'{\i}\`{e}{\aa} ---
\"{\i}ð{\aa}\^{\i}\'{a}ð\`{a}\c{c}\^{\i}\^{a}\`{a}\' {\i}\`{e}{\aa},
\^{a} \^{e}\^{\i}\`{o}\^{\i}ð\^{\i}\`{\i}
\^{a}\^{u}\"{\i}\^{\i}\"{e}\'{\i}\"{y}þ\`{o}\~{n}\"{y}
\"{a}\^{a}\`{a} \'{o}\~{n}\"{e}\^{\i}\^{a}\`{e}\"{y}
\begin{enumerate}
\item \~{N}\^{\i}\~{o}ð\`{a}\'{\i}\"{y}{\aa}\`{o}\~{n}\"{y} ð\`{a}\~{n}\~{n}\`{o}\^{\i}\"{y}\'{\i}\`{e}{\aa} \`{\i}{\aa}{\ae}\"{a}\'{o} \`{o}\^{\i}{\div}\^{e}\`{a}\`{\i}\`{e}, $AB=A'B'$
\item \~{N}\^{\i}\~{o}ð\`{a}\'{\i}\"{y}{\aa}\`{o}\~{n}\"{y} \^{\i}ð\`{e}{\aa}\'{\i}\`{o}\`{a}\"{o}\`{e}\"{y} \^{o}\`{e}\~{a}\'{o}ð.
\end{enumerate}

\^{A}\~{n}\"{y}\^{e}\^{\i}{\aa}
\"{a}\^{a}\`{e}{\ae}{\aa}\'{\i}\`{e}{\aa} {\aa}\~{n}\`{o}\"{u}
\`{e}\"{e}\`{e} \^{a}ð\`{a}\`{u}{\aa}\'{\i}\`{e}{\aa}
\^{a}\^{\i}\^{e}ð\'{o}\~{a}
\'{\i}{\aa}\^{e}\^{\i}\`{o}\^{\i}ð\^{\i}\'{e}
\`{o}\^{\i}{\div}\^{e}\`{e} (\^{\i}\~{n}\`{e}), \`{e}\"{e}\`{e}
\"{\i}\`{a}ð\`{a}\"{e}\"{e}{\aa}\"{e}\"{u}\'{\i}\^{u}\'{e}
\"{\i}{\aa}ð{\aa}\'{\i}\^{\i}\~{n}.

Frage: Woran liegt es, dass auf einmal solche Zeichen erscheinen? Kann man aus diesen Zeichen wieder das alte TEX zurück bekommen?


Als Editor benutze ich WinEdit.

Falls jemand eine Idee hat, wäre ich sehr dankbar.

Viele Grüsse, Anton

cookie170
29-05-2007, 21:43
Hallo Anton,

falls Du hier keine Antwort erhälst, könntest Du Deine Frage vielleicht morgen auf der Mailingliste TEX-D-L stellen. Dort lesen eine Reihe von Leuten mit, die sich mit LaTeX bewaffnet an die seltsamsten lebenden, sterbenden und toten Sprachen heranwagen. Manche fast tote Sprache bäumt sich noch einmal auf und erhält dann ein ehrenvolles Begräbnis mit allen Sonderzeichen.

Aber bitte stelle Deine Frage viel detaillierter. Im Grunde sieht dieser Zeichensalat aus, als habest Du oder das dämliche Windows die Kodierung verstellt. Man müßte also wissen, welche Pakete Du verwendet hattest, wie die Datei kodiert war, etc.

Gruß,
Alexander

Salnic
30-05-2007, 01:36
Hi Anhirsch,

Es ist wohl eher ein Editor denn ein Latex-Problem. Welchen Editor benutzt Du. Hast Du (oder der Wind) zufällig die Spracheinstellung verändert? Bei WinEdt vielleicht statt TeX:RU jetzt TeX:DE oder TeX:UK oder default?

Wie bindest Du übrigens kyrillisch ein? Welches Packet nimmst?

Salnic


Dort lesen eine Reihe von Leuten mit, die sich mit LaTeX bewaffnet an die seltsamsten lebenden, sterbenden und toten Sprachen heranwagenNaja, nun steht zwar Russisch auf der roten Liste, aber nicht auf der Liste der vom Aussterben bedrohten Sprachen.

anhirsch
30-05-2007, 09:41
Hallo liebe Leute,

zuerst einmal besten dank für die Antworten. Ich benutze als Editor den 'WinEdt/MiKTex 2.5'. Was muss man hier einstellen (das ganze hat schon mal funktioniert), damit mit man in russischer Sprache arbeiten kann? Kann man die alten wirren Zeichen auch wieder zurückerstellen in das normale TeX?

Besten Dank, Gruß A n t o n

Salnic
30-05-2007, 12:21
Hi Anton,

Du schreibst leider nicht, wie Du Deine Kyrillen eingibst, direkt in WinEdit? Mit russischem Tastaturlayout? Oder über Zwischenablage? Naja, ist auch nicht ganz so wichtig.

Auf alle Fälle wandelt WinEdt kyrillische Buchstaben intern - genauso wie deutsche Umlaute - um. Das hat den Vorteil, das diese Art der Kodierung unabhängig vom System ist, weltweit mit Latex verarbeitet werden kann, unter Unix, Mac und IBM-PC. Dabei entstehen dann so mehr oder weniger lustige geschweifte Klammerausdr{\"u}cke, die man bei deutschen Umlauten noch lesen kann, beim Russischen aber nicht mehr. Deswegen zeigt WinEdit das auch nicht an, sondern Umlaute - oder Kyrillen.

Irgendwie hat sich Dein Editor verstellt. Beim Laden der Dateien wandelt WinEdt automatisch (oder ebend nicht) die Klammerausdrücke in Lesbares.

Leider habe ich nicht so viel Ahnung von WinEdt, aber wenn man unter Document --> Document Settings --> Document Mode Tex:RU
eingibt, wandelt WinEdt zumindestens die Klammern wieder in Kyrillen um. Beim Laden!!! Also Dokumenteinstellung ändern, WinEdt schließen, WinEdt wieder öffenen. Letzte offenen Dateien werden geladen (werden sie doch, oder?) und der Text ist lesbar. Bei mir allerdings nicht direkt kompilierbar. Daher bin ich an Deiner Präample interessiert.

Leider ist das kein UTF-8!!! Sondern irgend was anders, ich nehme an ANSI. Wenn ich das aber in UTF-8 wandle, kann ich zumindestens Deine geometrischen Transformationen (?) retten und kompilieren.

Wie speicherst Du Deine Dateien?
UTF-8, ISO8859-5, KOI8 oder oder

welches Eingabe-encoding hast Du eingestellt
\usepackage[UTF8]{inputenc}

welches "Ausgabe-encoding"?
\usepackage[OT2,OT1]{fontenc}

Welche zusätzlichen Sprach-Packete Du benutzt?

vielleicht kannst Du Deine Präamble veröffentlichen?

Salnic


\documentclass[a4paper, 12pt,russian]{article}
\usepackage[UTF8]{inputenc}
\usepackage[OT2]{fontenc}
\begin{document}
\tableofcontents
\section{Геометрические преобразования}
Элементарная геометрия определяется по известной Эрлангенскоё программе Ф. Клейна как группа движений. Движение ---
преобразование, в котором выполняются два условия
\begin{enumerate}
\item Сохраняется расстояние между точками, $AB=A'B'$
\item Сохраняется ориентация фигур.
\end{enumerate}

\end{document}

anhirsch
30-05-2007, 13:15
Hallo Salnic,

nochmals besten Dank für die Antwort.

Um die Kyrillen einzugeben schalte ich die Tastatur um auf RU (Alt + Shift). Ich habe mir eine russische Tastatur gebaut (Maske), die ich über die deutsche Tastatur lege.

Ich habe nun im WinEdt, wie beschrieben, Document −> Document Settings −> Document Mode −> Tex:RU eingetippt!! In der Liste Document Mode(wenn ich auf den Pfeil drücke) erscheint Tex:RU leider nicht.

Ich habe nun WinEdt geschlossen und noch mal neu gestartet und die Datei eingelesen, aber er hat es leider wieder nicht kompiliert, die alten wirren Zeichen sind noch da.

Hier ist die Präambel:

\documentclass[deutsch,vecarrow]{svmono}
%\usepackage{ngerman}
\usepackage{graphicx}
\usepackage{amsmath}
\usepackage{amssymb}
\usepackage{wasysym}
\usepackage{fancyhdr}
\usepackage{fancybox}
\usepackage{hyperref}
\usepackage[cp1251]{inputenc}
\usepackage[russian]{babel}
\newcommand{\rl}{\includegraphics{glnew}}
\newcommand{\rr}{\includegraphics{grnew}}
\renewcommand{\bfdefault}{b}
\usepackage[svgnames, table, hyprref]{xcolor}
\usepackage{array}


Wo findet man, wie man die Dateien abspeichert…. Eingabe-encoding….Ausgabe-encodin…?

Unter Document −> Document settings −> Format steht : File Format: ASCII und ANSI

Vielleicht kannst Du hiermit etwas anfangen,

Gruß Anton

Salnic
30-05-2007, 19:01
Hi Anton,

versuch mal folgendes, ob es funktioniert? Hoffen wir es.

Optionen|Settings|Translations
TeX_Read [x] enable for TeX
bei mir ist die Tabelle schon ausgefüllt
"{\""{E}}" -> "Ë"
"{\""{I}}" -> "Ï"
"{\""{O}}" -> "Ö"
"{\""{U}}" -> "Ü"
"{\""{\i}}" -> "ï"
"{\""{a}}" -> "ä"
"{\""{e}}" -> "ë"
"{\""{o}}" -> "ö"
"{\""{u}}" -> "ü"
"{\""{y}}" -> "ÿ"
"{\'{A}}" -> "Á"
"{\'{E}}" -> "É"
"{\'{I}}" -> "Í"
"{\'{O}}" -> "Ó"
"{\'{U}}" -> "Ú"
"{\'{Y}}" -> "Ý"
"{\'{\i}}" -> "í"
"{\'{a}}" -> "á"
"{\'{e}}" -> "é"
"{\'{o}}" -> "ó"
"{\'{u}}" -> "ú"
"{\'{y}}" -> "ý"
"{\^{A}}" -> "Â"
"{\^{E}}" -> "Ê"
"{\^{I}}" -> "Î"
"{\^{O}}" -> "Ô"
"{\^{U}}" -> "Û"
"{\^{\i}}" -> "î"
"{\^{a}}" -> "â"
"{\^{e}}" -> "ê"
"{\^{o}}" -> "ô"
"{\^{u}}" -> "û"
"{\`{A}}" -> "À"
"{\`{E}}" -> "È"
"{\`{I}}" -> "Ì"
"{\`{O}}" -> "Ò"
"{\`{U}}" -> "Ù"
"{\`{\i}}" -> "ì"
"{\`{a}}" -> "à"
"{\`{e}}" -> "è"
"{\`{o}}" -> "ò"
"{\`{u}}" -> "ù"
"{\c{C}}" -> "Ç"
"{\c{c}}" -> "ç"
"{\~{A}}" -> "Ã"
"{\~{N}}" -> "Ñ"
"{\~{O}}" -> "Õ"
"{\~{a}}" -> "ã"
"{\~{n}}" -> "ñ"
"{\~{o}}" -> "õ"
"{\""A}" -> "Ä"
"{\""E}" -> "Ë"
"{\""I}" -> "Ï"
"{\""O}" -> "Ö"
"{\""U}" -> "Ü"
"{\""\i}" -> "ï"
"{\""a}" -> "ä"
"{\""e}" -> "ë"
"{\""o}" -> "ö"
"{\""u}" -> "ü"
"{\""y}" -> "ÿ"
"{\'A}" -> "Á"
"{\'E}" -> "É"
"{\'I}" -> "Í"
"{\'O}" -> "Ó"
"{\'U}" -> "Ú"
"{\'Y}" -> "Ý"
"{\'\i}" -> "í"
"{\'a}" -> "á"
"{\'e}" -> "é"
"{\'o}" -> "ó"
"{\'u}" -> "ú"
"{\'y}" -> "ý"
"{\AA}" -> "Å"
"{\AE}" -> "Æ"
"{\OE}" -> "Œ"
"{\O}" -> "Ø"
"{\P}" -> "¶"
"{\S}" -> "§"
"{\^A}" -> "Â"
"{\^E}" -> "Ê"
"{\^I}" -> "Î"
"{\^O}" -> "Ô"
"{\^U}" -> "Û"
"{\^\i}" -> "î"
"{\^a}" -> "â"
"{\^e}" -> "ê"
"{\^o}" -> "ô"
"{\^u}" -> "û"
"{\`A}" -> "À"
"{\`E}" -> "È"
"{\`I}" -> "Ì"
"{\`O}" -> "Ò"
"{\`U}" -> "Ù"
"{\`\i}" -> "ì"
"{\`a}" -> "à"
"{\`e}" -> "è"
"{\`o}" -> "ò"
"{\`u}" -> "ù"
"{\c C}" -> "Ç"
"{\c c}" -> "ç"
"{\~A}" -> "Ã"
"{\~N}" -> "Ñ"
"{\~O}" -> "Õ"
"{\~a}" -> "ã"
"{\~n}" -> "ñ"
"{\~o}" -> "õ"

Tex_Write hier würde ich jetzt KEIN Häcken setzen. Dann schreibt WinEdt die Sonderzeichen so, wie Du sie eingibst und nicht als Klammerversion.

Tatsächlich konnte ich _nur_ so die Files kompilieren.

Was ich in #3 geschrieben habe, stimmt so nicht ganz. Winedt umschreibt die Kyrillen, weil er eben kein UTF-8 kann, sondern nur ANSI. Für ihn ist das Ж ein Æ und damit schreibt er {\AE}. Ich habe keine encoding-fontcoding-Variante gefunden, die diese Klammerausdrücke in Kyrillen im PDF umsetzt. :-( Allerdings habe ich nicht alle kyrillischen Fonts bei mir installiert. Vielleicht gibt es ja eine Variante.

Was mich am meisten stört, ist, dass man aus dem fertigen PDF nichts mehr rauskopieren kann. Man kann zwar, aber das kann man dann wieder nicht mehr lesen.



%warum kann Winedt nicht ordentlich UTF-8
\documentclass[russian]{article}
\usepackage[cp1251]{inputenc}
\usepackage[T1]{fontenc}
%\usepackage[OT2]{fontenc}
\usepackage[russian]{babel}
\begin{document}
\noindent
àáâãäåæçèéêëìíîïðñòóôõö÷øùüúþÿ \\ %Windows 1251
ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ×ØÙÜÚÞß \\ %Windows 1251
privet - ïðèâåò %Windows 1251

\noindent
абвгдежзийклмнопрстуфхцчшщьъюя \\ %UTF 8
АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЪЮЯ \\ %bzw. ISO 8859-1
privet - привет %UTF 8
\end{document}



Salnic



PS: ich weiß nicht, wie WinEdt die Kodierung rausbekommt. Das es bei mir mit tex:RU geklappt hat, war wohl eher Zufall und hat nicht nicht mit der Lösung des Problems zu tun.

anhirsch
01-06-2007, 08:49
Hallo Salnic,

leider hat Dein letzter Tipp auch nicht den erhofften Erfolg gebracht.

Ich habe noch einmal versucht, das ganze in LaTex zu übersetzten und bekomme dann folgende Fehlermeldung:


-----------------------------------------------------------------

Package hyperref Warning: Glyph not defined in PD1 encoding,
<hyperref> removing ‘\cyrya’ on input line 925

<glnew.eps> <grnew.eps>> [20] <Kapitel12.tex
{\Russian \CYRG \cyrl \cyra \cyrv \cyra } 2.

Package hyperref Warning: Token not allowed in a PDFDocEncoded string,
<hyperref> removing ‘\div’ on input line 9


Package hyperref Warning: Glyph not defined in PD1 encoding,
<hyperref> removing ‘\cyrr’ on input line 9

Package hyperref Warning: Glyph not defined in PD1 encoding,
<hyperref> removing ‘\cyrr’ on input line 9

! Missing $ inserted.
<inserted text>
$
1.9 …\”{e}\^{\i}\~{n}\^{e}\^{\i}\~{n}\’{o}\’{e}}
?

-----------------------------------------------------------------


Package hyperref Warning: Glyph not defined in PD1 encoding,
<hyperref> removing ‘\cyri’ on input line 2368

Package hyperref Warning: Glyph not defined in PD1 encoding,
<hyperref> removing ‘\cyrya’ on input line 2368

[104]> [105] <Kapitel5.tex [106]
{\Russian \CYRG \cyrl \cyra \cyrv \cyra } 5 .

Package hyperref Warning: Glyph not defined in PD1 encoding,
<hyperref> removing ‘\cyrr’ on input line 9

Package hyperref Warning: Glyph not defined in PD1 encoding,
<hyperref> removing ‘\cyrr’ on input line 9

! Missing $ inserted.
<inserted text>
$
1.12 … ‘{a}\’{\i}\’{e}\’{\i}{\aa}\’{o}-\’{e}{\div}……

----------------------------------------------------------------

Vielleicht kann man hiermit etwas anfangen?

Gruß Anton