PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : perl LWP:Simple, Manche Seiten werden nicht geladen



harvey
18-07-2007, 19:13
Kann mir jemand sagen, warum das folgende Programm nicht funktioniert:


#!/usr/bin/perl

use LWP::Simple;

$url="http://de.wikipedia.org/wiki/Seefrosch";
getstore($url,"test.htm");


Hier wird keine Datei test.htm angelegt. Wenn ich die URL hingegen durch www.tagesschau.de ersetze, funktioniert es.

Molaf
24-07-2007, 07:58
Das scheint an der URL zu liegen. Überall wo man eine konkrete URL aufrufen kann, wird auch die Seite geladen (und dann gespeichert).

Bei Wikipedia wird ja nicht wirklich eine Seite namens Seefrosch geladen, sondern der letzte Teil der URL durch ein Skript geschleust.

FlorianL
24-07-2007, 09:21
use LWP::UserAgent;
$ua = LWP::UserAgent->new();
my $req = new HTTP::Request GET => 'http://en.wikipedia.org/wiki/Seefrosch';
my $res = $ua->request($req);
my $content = $res->content;
print $content;

rausgesucht, ungetestet....

edit: quelle: http://209.85.135.104/search?q=cache:IU2jmQlWlTIJ:forums.devshed.com/perl-programming-6/how-do-you-get-a-page-if-lwp-simple-doesn-321869.html+LWP::Simple+wikipedia&hl=de&ct=clnk&cd=2&gl=de

BLUESCREEN3D
24-07-2007, 14:45
Bei Wikipedia wird ja nicht wirklich eine Seite namens Seefrosch geladen, sondern der letzte Teil der URL durch ein Skript geschleust.
Und? Das sollte den HTTP-Client doch nicht stören.