PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Welche Unicode-Codierung?



dra
13-11-2005, 13:43
Hi,

ich habe mir zwar die gaengigen Unicode-Codierungen schonmal angeschaut, allerdings habe ich was die Implementation angeht noch keinerlei erfahrung.

Momentan bin ich dabei einen XML-Parser (und spaeter auch -Validator) zu schreiben, der natuerlich mit den gaengigen Codierungen umgehen koennen sollte... ;)

Nun stellt sich aber die Frage welche "interne" Codierung hier am sinnvollsten ist. Irgendwie muss ich ja mit allen Codierungen gleich umgehen koennen damit der Parser funktioniert. Was erfordert den kleinstmoeglichen Aufwand?

UTF-32 hat den Vorteil, dass es effizient zu bearbeiten ist und zudem alle Zeichen und Zeichenintervalle aus dem XML-Standard direkt angegeben werden koennen. UTF-8 wohl, dass es bei westlichem Zeichensatz schoen wenig Speicher frisst.

Hat einer von euch da Erfahrung?

Achja: Dient dem reinen Selbststudium, mein kleiner XML-Parser. Dass es solche Dinger schon zuhauf gibt, ist mir bewusst... ;)

Gruss,
dra