Anzeige:
Ergebnis 1 bis 4 von 4

Thema: Bash: Text zwischen html-tags extrahieren

  1. #1
    Registrierter Benutzer
    Registriert seit
    14.11.2002
    Ort
    Obertshausen
    Beiträge
    87

    Bash: Text zwischen html-tags extrahieren

    Hallo zusammen,

    die Frage ist für Euch sicher einfach, aber ich komme auch nach googeln und rumprobieren nicht drauf.

    Ich habe eine html-Datei in der sich ein Text aus mehreren Zeilen in einem pre-tag befindet.

    Also:
    <html>
    ...
    <pre>Text den
    ich haben
    will</pre>
    ...
    </html>

    wie kann ich in einem Bash-script den Text extrahieren?


    Kann mir da jemnd spontan helfen?

    Danke
    Celindir
    May the source be with you...

    www.celindir.de

  2. #2
    Registrierter Benutzer Avatar von undefined
    Registriert seit
    01.03.2004
    Beiträge
    1.255
    Also da würde ich eher einen »xsltproc« Aufruf mit einer Stylesheet Datei empfehlen.
    mfg undefined
    --
    Undefined Behavior (undefiniertes Verhalten) bedeutet meistens etwas ungültiges.
    xhtml Debugger

  3. #3
    Registrierter Benutzer
    Registriert seit
    14.11.2002
    Ort
    Obertshausen
    Beiträge
    87
    hatte gehofft, eine etwas einfachere Methode mit sed oder awk zu finden.
    Die hier genannte erschliesst sich leider noch nicht für mich.

    Gibt es Alternativen?

    Danke
    Celindir
    May the source be with you...

    www.celindir.de

  4. #4
    Registrierter Benutzer
    Registriert seit
    07.05.2007
    Beiträge
    656
    Moin,

    meinst Du sowas?

    Code:
    jan@jack:~/tmp> echo '<html>
    ...
    <pre>Text den
    ich haben
    will</pre>
    ...
    </html>
    ' | sed -rn '/<pre>/,/<\/pre>/{s/<\/?pre>//;p}'
    Text den
    ich haben
    will
    Jan

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •