So, hier mal ein Sed-Script was einfach alles Zwischen <TAG> und </TAG>s ausgibt - allerdings noch keine Trennungsmöglichkeit von Text zwischem erstem und anderen <TAG></TAG>-Paaren.
Ausführen: sed -n -f sedscript.sed data.txt
Code:
/<TAG>/ {
h
c
}
/<\/TAG>/ {
H
g
s#<TAG>##
s#</TAG>##
p
}
H
Wenn man beim p noch ein q (uit) anhängt wird nur die erste Fundstelle angegeben:
Ausführen: sed -n -f sedscript.sed data.txt
Code:
/<TAG>/ {
h
c
}
/<\/TAG>/ {
H
g
s#<TAG>##
s#</TAG>##
p
q
}
H
die kann man jetzt natürlich aus der Datei entfernen à la
Code:
sed -e "0,/<TAG>/d" -e "0,/<\/TAG>/d" -i data.txt
und dann das Script auf die nächste Fundstelle loslassen. Eine schlauere Variante um die Daten aus sed nach Bash zu kriegen fällt mir eben gerade nicht ein.
MfG Peschmä
Lesezeichen