Anmelden

Archiv verlassen und diese Seite im Standarddesign anzeigen : Textdaeteien mit Endung (.doc oder .rtf) unter c++/GTK lesen??



nitram
30-11-2002, 12:54
Textdaeteien mit Endung (.doc oder .rtf) unter c++/GTK lesen??

HI,

kann mir vielleicht ein paar tips zu diesem Problem geben.
Ich kriege das irgenndwie nicht hin.

Danke,
Mah

Boron
30-11-2002, 13:15
Ich nehme dir ja ungern den Wind aus den Segeln, ABER :

- Das Word DOC-Format ist irgendein wildes Binärgeschmiere. Einen Filter für dieses Dateiformat zu schreiben muss echt die Hölle sein. Daran beisen sich seit Jahren viele Leute die Zähne aus (sogar der Openoffice.org-Filter hat noch Probleme).

Wenn du nur Text rausfiltern will, ohne auf Formatierungen Rücksicht zu nehmen, scheint es Hoffnung für dich zu geben. Da könntest du dich ja von OOo-Filter inspirieren lassen.
Nur Text rauszuziehen scheint nicht die große Herausforderung zu sein.

- Das RTF-Format ist ist meinem Wissen nach ein "freies" Format.
Wenn du eine solche Datei mit einem einfachen Texteditor öffnest kannst du schon darin lesen
Dort wird nur mit Tags wie in Tex oder HTML gearbeitet. Beim parsen einer solchen Datei müsstest du halt diese Tags "überlesen".


So, das ist alles was ich in meiner jugendlichen Naivität weiß.

anda_skoa
30-11-2002, 13:15
Was bedeutet in diesem Zusammenhang "lesen"?

Was brauchst du aus den Dateien?

Ciao,
_

nitram
30-11-2002, 13:40
Danke schoen fuer die schnellen Antworten.
Wow, es scheint ziemlich schwierig zu sein doc-Dateien zu lesen.
Ich werde zuerst mit rtf-Dateien versuchen.
Weisst du zufaellig wie man die Tags , die man fuer rtf-Dateien braucht , finden kann.


Zu Admin:
tview = gtk_text_view_new ();
buffer = gtk_text_view_get_buffer (GTK_TEXT_VIEW (tview));


/* load content of a text file*/
ifstream fin;
fin.open("test.rtf",ios::in|ios::out);
gchar temp[300];
fin.read(temp, 300);
gtk_text_buffer_set_text (buffer, g_strdup (temp), -1);
fin.close();

ich moechte so "lesen"!

Boron
30-11-2002, 14:17
:D Gleich der nächste Schocker: RTF ist von Microsoft :eek:!!

Spezifiaktion gibt es hier: http://msdn.microsoft.com/library/en-us/dnrtfspec/html/rtfspec.asp

Viel Spass :D

anda_skoa
30-11-2002, 15:09
Ah, du möchteste den Text aus dem Doc.

Das ist nicht so schwer.
Schwer wird es, wenn man die ganze Formatierung, etc. braucht.

Beim Lesen kann dir da wvware helfen:
http://wvware.sourceforge.net/

Ciao,
_

nitram
30-11-2002, 15:17
Danke , danke ihr seid grosse Hilfen fuer mich.


Ich mache mich dann an die Arbeit


ciao
Mah

nitram
30-11-2002, 15:36
HI

noch eine Frage , wisst ihr auch wie man unter c++/GTK Html oder Pdf lesen kann??


Thx

Mah

anda_skoa
30-11-2002, 15:45
eine HTML Datei ist reiner Text.
Das sollte also nicht schwer sein :)

ghostscript kann PDF, vielleicht kann man das benutzen.

Ciao,
_