Re: [問題] 留下比對正確的部分

作者: godspeedlee (妳,我可以)   2011-05-17 14:08:07
※ 引述《no1kk (心中在下雨)》之銘言:
: 我要作的是把html檔案之中
: 圖片的tag留下來,其他全部刪除
: 從精華區看到
: 要比對img的tag的方法是
: <img[^>]*>
: 但是我要怎麼把其他的部分全部清除呢?
: 我補充一下,因為我是用Notepad++這種文字編輯器的搜尋/取代功能
: 搜尋可以輸入正規表示法
: 但是無法先把比對正確的部分存下來後再吐出來
: 這是比較麻煩的
: 似乎只能搜尋所有不是<img[^>]*>的部分,並且清除
有大量檔案,何不考慮grep甚至是perl?
如果在您的問題中「把圖片的tag留下來,其他全部刪除」
等於「只取出圖片的tag」
用後者的角度思考事情會比較容易,你也已經有答案了
如果是前者就麻煩了,下面這個 regex pattern 可刪除除了<img>
之外的所有 tag
<(?!img\b)[^>]+>
但是除了 tag 之外,還有本文,還有 javascript, css...把這些通通用
regex 刪除可累人了

Links booklink

Contact Us: admin [ a t ] ucptt.com