PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Text aus html seite greppen



illusion
02-04-2002, 04:56
Hallo!

Ich will von einer Seite einen bestimmten text heraus greppen....Nur krieg ich dabei ja den gesamten quellcode:

#!/usr/bin/perl -w
use LWP::UserAgent;
$url = 'http://bla.de/bla/';
$agent = new LWP::UserAgent;
$request = HTTP::Request->new('GET', $url);
$result = $agent->request($request);

print $result->content();

Wenn das aber n riesiger quellcode ist und ich jetzt z.B. nur den text foobar will und er steht immer so da:

class=text><b>foobar<bla bla........

Wie fisch ich das aus dem Quelltext raus?

Muss doch ganz einfach gehen irgendwie...Steh wahrscheinlich auf der Leitung um die Zeit...:)

Danke schonmal fuer Hilfe

Nighthawk
02-04-2002, 10:54
Ich hab das jetzt so verstanden dass Du das wieder ausgegeben haben möchtest was Du als Suchanfrage eingegeben hast, wo issn da der Sinn? :confused:

lolli
02-04-2002, 12:10
Versuche mal

$text=$result->content();
$text=~s/<[^>]*>/ /g;
print $text;

oliver

Doc Maverick
02-04-2002, 16:34
Hi,
Du könntest aber auch den Text erst mal mit html2text (?) in eine reine Textform umwandeln und dann greppen...
Tschüß.

illusion
02-04-2002, 17:46
Hallo!

Danke fuer die Antworten....:)

Jetzt hab ich also den Text und will ihn auslesen....Sagen wir der Text ist in Zeile 700 und ich will jetzt also Zeile 700 ausgeben von der Datei....Hab schon alles versucht an Schleifen etc....

Waere nett wenn mir jmd. ein Beispiel sagen koennte

Danke :)

lolli
02-04-2002, 17:56
$text=$result->content();
$text=~s/<[^>]*>/ /g;
print $text;

z.Bsp.:
@lines=split(/\n/,$text);
print $line[699];

oliver

illusion
02-04-2002, 18:15
danke mein Retter ;)

(glaubst sowas haet ich mit Goggle gefunden)

lolli
02-04-2002, 18:27
ups, da war wohl ein Schreibfehler drin:
@lines=split(/\n/,$text);
print $lines[699];

oliver