作者godspeedlee (godspeed lee)
看板RegExp
标题Re: [问题] 留下比对正确的部分
时间Tue May 17 14:08:07 2011
※ 引述《no1kk (心中在下雨)》之铭言:
: 我要作的是把html档案之中
: 图片的tag留下来,其他全部删除
: 从看到
: 要比对img的tag的方法是
: <img[^>]*>
: 但是我要怎麽把其他的部分全部清除呢?
: 我补充一下,因为我是用Notepad++这种文字编辑器的搜寻/取代功能
: 搜寻可以输入正规表示法
: 但是无法先把比对正确的部分存下来後再吐出来
: 这是比较麻烦的
: 似乎只能搜寻所有不是<img[^>]*>的部分,并且清除
有大量档案,何不考虑grep甚至是perl?
如果在您的问题中「把图片的tag留下来,其他全部删除」
等於「只取出图片的tag」
用後者的角度思考事情会比较容易,你也已经有答案了
如果是前者就麻烦了,下面这个 regex pattern 可删除除了<img>
之外的所有 tag
<(?!img\b)[^>]+>
但是除了 tag 之外,还有本文,还有 javascript, css...把这些通通用
regex 删除可累人了
--
http://godspeedlee.myweb.hinet.net/
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 111.80.104.171