Hmm, okay, aber mit Perl hab ich nie programmiert. Wäre aber auch kein Problem, das mit der Bash zu benutzn oder dann alles auf Perl umzustellen. Hauptsache, ich krieg aus einer - das soll der Einsatzzweck sein - HTML-Seite von einem Forum eine datei im folgenden Stil heraus:
Code:
Seitentitel (TITLE-Tag), aber ohne Forenname
<<<Beiträge hintereinander>>>
Autor
Erstellt am
HTML-Code (eine Zeile)
<<<Wiederholen für alle Beiträge>>>
Das System, wo diese Einträge herauszulösen sind, ist mir bereits klar. Also muss das Skript die folgenden inträge durch zeilenumbrüche getrennt in eine Dtei schreiben:
Text zwischen <title> und </title> (10 Zeichen vom Anfang aber wegnehmen)
Text nach "von " bis zum nächsten Leerzeichen
text nach "erstellt am " (es folgt ein Datum) sagen wir mal bis zum </td>
Tetx zwischen <td class="general"> und </td> in EINER ZEILE
2.-4. Schritt wiederholen, bis kein Fundstück mehr.
Anschließend (besser als zweites Skript) folgendes mit erzeugter Datei machen:
Gesamtzahl Beiträge zählen (Anzahl nicht leerer Zeilen minus 1, es wird die Titelzeile ausgenommen)
Bestimmten fest eingebauten text an den Output schreiben
Erste Zeile einlesen und n den Output (in bash macht man das gut mit cat << EOF >> textdatei)
weiteren eingebauten Text an den Output
schleife: von 1 bis Gesamtzahl Beiträge
{
Festen Text an Output
Erste Zeile eines Blocks (ein B lock besteht aus Autor, Erstellungsdatum und HTML-Code) an Output
Fester text an den Output
Zweite Zeile vom Block an Output
fester Text
Dritte Zeile
fester Texzt an Output
} (schleife ende)
fester text an output
Weiß nicht, hört sich bestimmt kompliziert an, aber sagen wir mal so etwas in der Datei vom ersten Skript:
Code:
Mehrzeiligen text mit Bash...
LsSuper2004
20.08.2005 17:59
So, <br><br>nachdem ich in einem Konkurrenzforum (und so weiter)
peschmae
20.08.2005 22:46
Also ich würde erst die Zeilenumbrüche (...)
LSsuper2004
21.08.2005 14:28
Hmm, okay, aber mit Perl hab ich noch nie programmiert. (...)
Hoffe es wird jetzt klarer, das wäre jetzt das Ergebnis für dieses Forum und diese Beiträge hier. Also so in dem Stil.
- penma -
Lesezeichen