PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : html-filter



10-02-2001, 00:44
Hallo zusammen,

ich bin gerade dabei, einen individuellen HTML-Filter mittels awk zu realisieren.
Da ich aber ein newbie bin, fällt mir
das trotz intensiven studium des manuals
recht schwer.

meine vorstellungen gehen dahin, daß der
Filter den <script language="vbscript">,
sowie den dazugehörigen </script> tag,
mit all dem was dazwischen liegt rausfiltert.

vieleicht könnt ihr mir da ein bischen unter
die arme greifen.

vielen dank
werner

13-02-2001, 15:44
Muss es unbedingt akw sein?
perl / tcl / python + regexp waere warscheinlich einfacher.

Was fuer Tags willst Du Filtern?
Koennen die auch geschachtelt vorkommen?

z.b.

#!/usr/bin/env python
import sys, re
print re.sub(r"(?is)(<\s*img[^>]*>.*?<\s*/\s*img\s*> )","",sys.stdin.read())
filtert alle &lt;img&gt;...&lt;/img&gt; tags aus stdin

[Dieser Beitrag wurde von jgbauman am 13. Februar 2001 editiert.]