Liebe mrunix-Gemeinde,

nachdem ich hier schon so viel Hilfe zum Thema LaTeX bekommen habe, hier nun einmal zu einem ganz anderen Thema. Ich soll für meinen Arbeitgeber eine Reihe von RTF-Dokumenten in reine Textdateien umwandeln und dabei bestimmte RTF-Formatierungen auf logisches Markup abbilden. Hier ein Beispiel:
Code:
[Text in kleinerer Schrift[ → [#~~Text ohne Formatierung~~#[
Bezogen auf den RTF-Quelltext (RTF ist ja auch nur reiner Text), sähe die Umwandlung wie folgt aus:
Code:
\ltrch\loch\fs20\lang1031
reiner Text }{\cf1\rtlch → [#~~reiner Text~~#[
Meine Frage ist nun, ob ich mich zur Bewältigung dieser Aufgabe besser in Perl oder in Python einarbeiten soll. Folgende Aspekte scheinen mir relevant:

  1. Perl scheint mächtiger zu sein in puncto regulärer Ausdrücke und Stringverarbeitung
  2. Es gibt für Perl einen – allerdings nahezu undokumentierten – RTF-Parser (https://metacpan.org/pod/RTF::Control).
  3. Ich habe keinen genuinen informatischen Hintergrund, bin mittlerweile allerdings recht findig in der bash und bringe auch Emacs LISP meistens dorthin, wo ich es haben will.
  4. Zur Entwicklung werde ich auf jeden Fall Emacs verwenden (Mir scheinen allerdings beide Sprachen gut unterstützt zu werden.).
  5. Mein Stil ist (wahrscheinlich) mehr als dürftig und recht chaotisch. Vielleicht wäre hier Python eher ein Mittel, wenigstens Quelltext einmal anständig zu formatieren.


Grundsätzlich möchte ich sagen, dass ich den Auftrag auch deswegen angenommen habe, weil ich eine neue Sprache lernen will. Bisher hatte ich immer eher zu Python tendiert, bin allerdings angesichts der bevorstehenden Aufgabe unsicher geworden, ob nicht gerade hier Perl das Mittel der Wahl wäre. Auch Punkt 3 (Vorkenntnisse in der bash und LISP) scheint eher für Perl zu sprechen… was meint ihr?

Vielen Dank schonmal für jeglichen Input!

Phylax