作者collin2315 (梭哈!)
看板perl
标题[问题] 关於regular expression
时间Thu Aug 16 02:11:41 2007
要把html中的tag以及被标签的文字皆去除,应该如何表示才对?
句子的形式如下:
<font color = "red"><B>E2F-1</B></font> can also ...
<font color = "blue"><B>induce</B></font> of ...
<font color = "green"><B>p73</B></font> is a ...
欲得到:
can also ...
of ...
is a ...
使用$sentence =~ s/<[^>\w]*>//g; 却无法将E2F-1、induce、p73去除
请问正规表示法应如何写才能将被标签的文字去除,留下剩下非标签的文字
感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.228.75.109
1F:推 PsMonkey:等等... 那就什麽都不会剩下了耶? 08/16 02:21
2F:→ PsMonkey:直接回传一个空字串会不会比较实在.... XDXD 08/16 02:21
3F:→ collin2315:抱歉..没说清楚 句子中不只这些标签还有其他的字 08/16 02:30
4F:→ reizarc:$string =~ s/<[^><]>//g; 08/16 02:58
※ 编辑: collin2315 来自: 61.228.75.109 (08/16 03:18)
5F:推 david220:单纯看你的测资是 $str =~ s/\<.+\>\s*//g; 就可以了 XD 08/16 11:42
6F:推 collin2315:谢谢^^ 08/17 15:58