作者no1kk (心中在下雨)
看板RegExp
标题[问题] 留下比对正确的部分
时间Mon May 16 02:50:21 2011
我要作的是把html档案之中
图片的tag留下来,其他全部删除
从看到
要比对img的tag的方法是
<img[^>]*>
但是我要怎麽把其他的部分全部清除呢?
我补充一下,因为我是用Notepad++这种文字编辑器的搜寻/取代功能
搜寻可以输入正规表示法
但是无法先把比对正确的部分存下来後再吐出来
这是比较麻烦的
似乎只能搜寻所有不是<img[^>]*>的部分,并且清除
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.64.136.243
※ 编辑: no1kk 来自: 211.75.166.220 (05/16 17:03)
1F:→ no1kk:因为有大量档案要做处理,用这样会比较快速(?!) 05/16 17:03
2F:推 kdjf:egrep -v ?? 05/24 23:44
3F:→ kdjf:不对, grep 就好了 05/24 23:45
4F:推 kuan:grep -o '<img[^>]*>' 这样应该可以 08/25 09:33