作者b60413 (None)
看板Perl
标题[问题] 如何消除html tag
时间Fri Apr 3 00:52:39 2009
关於这个问题 我知道可以用正规式直接去实做
但是对於正规式的使用还没有很透彻的了解
想问看看是否有相关的HTML module可以把html tag消除掉
只留下tag跟tag中的内容
(有到cpan网站中去找 但是资料过於庞大 找得很没头绪)
或者有人可以跟我讲 如何利用正规式去实做吗?
有查到可用<(.| )*?>去消除所有的HTML Tag
但是消除後的文字Home与Test连在一起....希望能做到分开的效果
或者是结果储存在一个阵列当中
谢谢
HTML Example:
<a href="
http://127.0.0.1">Home<span>Test</span></a>
须将Home跟Test抓出来
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.232.66.53
1F:→ deh3215:1904篇看看也许有点帮助..我用HTML::TreeBuilder清除所有 04/03 01:53
2F:→ deh3215:tag...这个模组算清的蛮乾净的 04/03 01:53
3F:→ deh3215:HTML::Strip也可,把那串文字存成txt档,读进来用HTML:: 04/03 02:11
4F:→ deh3215:Strip可清除掉tag,剩下 Home Test 04/03 02:12