unknown_spirit
16-02-2010, 22:25
Ich habe ein Problem mit dem Streameditor, er entfernt mir den Zeilenumbruch in der ersten Zeile der ersten Sequenz nicht. Nachfolgende Zeilen und Sequenzen werden wie gewünscht bearbeitet.
Hier die Datei:
http://www.cibiv.at/~ingo/Brno/data/proteomes/SACCE_prot.fa
Hier der Befehl:
sed -i '{:q;N;s/\(^[A-Z].*[A-Z]\)\n\([A-Z]\|\*\)/\1\2/g;t q}' Output/SACCE_prot.fa
Das Ergebnis sieht so aus:
>YAL034C|YAL034C
MGLYSPESEKSQLNMNYIGKDDSQSIFRRLNQNLKASNNNNDSNKNGLNM SDYSNNSPYG –Hier die beanstandete Stelle
RSYDVRINQNSQNNGNGCFSGSIDSLVDEHIIPSPPLSPKLESKISHNGS PRMASSVLVGSTPKGAVENVLFVKPVWPNGLSRKRYRYATYGFLSQYKIF SNLAQYSKNIINRYNNLAYNARHKYSKYNDDMTPPPLPSSSSRLPSPLAS PNLNRQARYNMRKQALYNNNLGKFESDTEWIPRKRKVYSPQRRTMTTSPH RAKKFSPSSTPHTNIASIEAIHDAPQYIPNVSWKKLPDYSPPLSTLPTDS NKSLKIEWKGSPMDLSTDPLRNELHPAELVLAQTLRLPCDLYLDSKRRLF LEKVYRLKKGLPFRRDAQKACRIDVNKASRLFQAFEKVGWLQDSNFTKYL *
>YAL068W-A|YAL068W-A
MHGTCLSGLYPVPFTHNAHHYPHFDIYISFGGPKYCITALNTYVIPLLHH ILTTPFIYTYVNITEKSPQKSPKHKNILLFNNNT*
.
.
.
Kennt jemand den Grund für dieses Verhalten?
MfG,
unknown_spirit
Hier die Datei:
http://www.cibiv.at/~ingo/Brno/data/proteomes/SACCE_prot.fa
Hier der Befehl:
sed -i '{:q;N;s/\(^[A-Z].*[A-Z]\)\n\([A-Z]\|\*\)/\1\2/g;t q}' Output/SACCE_prot.fa
Das Ergebnis sieht so aus:
>YAL034C|YAL034C
MGLYSPESEKSQLNMNYIGKDDSQSIFRRLNQNLKASNNNNDSNKNGLNM SDYSNNSPYG –Hier die beanstandete Stelle
RSYDVRINQNSQNNGNGCFSGSIDSLVDEHIIPSPPLSPKLESKISHNGS PRMASSVLVGSTPKGAVENVLFVKPVWPNGLSRKRYRYATYGFLSQYKIF SNLAQYSKNIINRYNNLAYNARHKYSKYNDDMTPPPLPSSSSRLPSPLAS PNLNRQARYNMRKQALYNNNLGKFESDTEWIPRKRKVYSPQRRTMTTSPH RAKKFSPSSTPHTNIASIEAIHDAPQYIPNVSWKKLPDYSPPLSTLPTDS NKSLKIEWKGSPMDLSTDPLRNELHPAELVLAQTLRLPCDLYLDSKRRLF LEKVYRLKKGLPFRRDAQKACRIDVNKASRLFQAFEKVGWLQDSNFTKYL *
>YAL068W-A|YAL068W-A
MHGTCLSGLYPVPFTHNAHHYPHFDIYISFGGPKYCITALNTYVIPLLHH ILTTPFIYTYVNITEKSPQKSPKHKNILLFNNNT*
.
.
.
Kennt jemand den Grund für dieses Verhalten?
MfG,
unknown_spirit