Skip to content

howto - sed - work with xml files - get content inside one tag

Assuming you have a large xml file (say 400 megabytes) and you want to grep the content inside one tag, which tool would solve this better then sed?

sed -n -e 's/.*\(.*\)<\/my_magicTag>.*/\1/p' myInputFile.xml > myInputFileFilteredByMyMagicTag.xml
So what we are doing? We are telling sed to search for none or a lot of text before "", store none or a lot of text before "". With "\1", we are using the first remembered pattern (since we only use one "()", we only have one in this command). With "\p", we are telling sed to print this out. After that, as usual, we are using ">" to redirect the standard output into a file.

Trackbacks

Keine Trackbacks

Kommentare

Ansicht der Kommentare: Linear | Verschachtelt

Noch keine Kommentare

Kommentar schreiben

Die angegebene E-Mail-Adresse wird nicht dargestellt, sondern nur für eventuelle Benachrichtigungen verwendet.
Um einen Kommentar hinterlassen zu können, erhalten Sie nach dem Kommentieren eine E-Mail mit Aktivierungslink an ihre angegebene Adresse.

Um maschinelle und automatische Übertragung von Spamkommentaren zu verhindern, bitte die Zeichenfolge im dargestellten Bild in der Eingabemaske eintragen. Nur wenn die Zeichenfolge richtig eingegeben wurde, kann der Kommentar angenommen werden. Bitte beachten Sie, dass Ihr Browser Cookies unterstützen muss, um dieses Verfahren anzuwenden.
CAPTCHA

Markdown-Formatierung erlaubt
Formular-Optionen