Anzeige:
Ergebnis 1 bis 9 von 9

Thema: OpenOffice-Dokumente auslesen

  1. #1
    noise_
    Gast

    OpenOffice-Dokumente auslesen

    Hallo,
    wie wäre es am geschicktesten den Inhalt eines OpenOffice-Dokumentes auszulesen (in ein einem C-Programm)? Ein solches Dokument ist ja eine Sammlung von XML-Dateien (gezippt). Ich hab schon normalen Text rauslesen können (aus der content.xml mit hilfe der libxml2). Aber bei formatierten Texten, sprich Fett, Kursive, Absätze, Aufzählungspunkte, etc wird das eine Qual.
    Hab dann die libxslt entdeckt und auf der OO.org homepage XSL-Dateien für die konvertierung von OOo zu XHTML gefunden.
    Diese XLS-Dateien funktionieren jedoch nicht standalone... laut homepage ("The filter will NOT work stand-alone with the new default OpenDocument format, but are still working in OpenOffice.org 2.x").

    Also wie würde es sonst noch funktionieren (ggf. mit konvertierung zu html)?

  2. #2
    Registrierter Benutzer Avatar von bischi
    Registriert seit
    10.04.2003
    Beiträge
    4.828
    Das Zeuchs zuerst mittels OpenOffice in ein vernünftiges Format konvertieren (plain-text)?

    Ev kann das OOffice auch über Kommandozeile (mittels Option -server ?)

    MfG Bischi

    "There is an art, it says, or rather, a knack to flying. The knack lies in learning how to throw yourself at the ground and miss it" The hitchhiker's guide to the galaxy by Douglas Adams

    --> l2picfaq.pdf <-- www.n.ethz.ch/~dominikb/index.html LaTeX-Tutorial, LaTeX-Links, Java-Links,...

  3. #3
    noise_
    Gast
    Zitat Zitat von bischi
    Das Zeuchs zuerst mittels OpenOffice in ein vernünftiges Format konvertieren (plain-text)?

    Ev kann das OOffice auch über Kommandozeile (mittels Option -server ?)

    MfG Bischi
    Das würde auch nicht zum ziel führen... wir wollen ein selbständiges Programm zum auslesen solcher Dokumente schreiben.

  4. #4
    Registrierter Benutzer Avatar von bischi
    Registriert seit
    10.04.2003
    Beiträge
    4.828
    Die Idee ist ja schön und gut: Aber was nützt es ein Programm zu schreiben, wo doch OpenOffice problemlos nach HTML oder plaintext exportieren kann?

    MfG Bischi

    PS: Selbstverständlich könntest du natürlich den Parser aus dem OO-Quellcode nehmen...

    "There is an art, it says, or rather, a knack to flying. The knack lies in learning how to throw yourself at the ground and miss it" The hitchhiker's guide to the galaxy by Douglas Adams

    --> l2picfaq.pdf <-- www.n.ethz.ch/~dominikb/index.html LaTeX-Tutorial, LaTeX-Links, Java-Links,...

  5. #5
    noise_
    Gast
    Zitat Zitat von bischi
    Die Idee ist ja schön und gut: Aber was nützt es ein Programm zu schreiben, wo doch OpenOffice problemlos nach HTML oder plaintext exportieren kann?

    MfG Bischi

    PS: Selbstverständlich könntest du natürlich den Parser aus dem OO-Quellcode nehmen...
    Um OO-Dokumente ohne OO und ggf. ohne X auslesen zu können.

    Ich glaub der OO-Parser ist zu aufgebläht, und die implementation vlt ein wenig kompliziert. Aber ich werd mit den mal genauer anschauen...

  6. #6
    Registrierter Benutzer Avatar von undefined
    Registriert seit
    01.03.2004
    Beiträge
    1.255
    http://phpdocwriter.sourceforge.net/
    Allerdings weiss ich nicht wie es mit dem auslesen aussieht.
    mfg undefined
    --
    Undefined Behavior (undefiniertes Verhalten) bedeutet meistens etwas ungültiges.
    xhtml Debugger

  7. #7
    Administrator Avatar von anda_skoa
    Registriert seit
    17.11.2001
    Ort
    Graz, Österreich
    Beiträge
    5.477
    Zitat Zitat von noise_
    Ich glaub der OO-Parser ist zu aufgebläht, und die implementation vlt ein wenig kompliziert. Aber ich werd mit den mal genauer anschauen...
    Sonst vielleicht der KOffice OpenDocument Parser?

    Ciao,
    _
    Qt/KDE Entwickler
    Debian Benutzer

  8. #8
    Registrierter Benutzer
    Registriert seit
    25.12.2004
    Beiträge
    217
    Hi,

    mh dir könnte das hier helfen:
    http://www.mrunix.de/forums/showthre...954#post192883

    Sollte das machen was du brauchst, am Besten du guckst dir die Extension des CMS ez Publish mal an.

    http://ez.no/community/contribs/impo...ment_extension
    -> Download contribution

    *edit*
    Sorry, hab das mit dem C-Programm zu spät gelesen... aber vielleicht bringt dir die PHP Lösung dennoch was.

    Grüße,
    nEox
    Geändert von nEox (16-05-2006 um 22:45 Uhr)

  9. #9
    noise_
    Gast
    Zitat Zitat von anda_skoa
    Sonst vielleicht der KOffice OpenDocument Parser?

    Ciao,
    _
    hm, ja...
    das hier wäre interessant http://www.koffice.org/filters/1.5/kword/html.php
    nur wie komm ich an den code...

    edit: naja ist in c++ geschrieben
    Geändert von noise_ (27-05-2006 um 16:47 Uhr)

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •