作者DearKurt (U SUCK)
看板C_Sharp
标题Re: [问题] 如何把字串中的特定字串撷取出来
时间Sun Feb 19 17:00:04 2006
如果处理的都是网页原始码的文字档
除了regex 还有另一种方法 就是在javascript常用的document object model(DOM)
微软的webbrowser类别有把网页转成DOM物件的功能 可惜要写程式不是很方便
我自己试 它好像会强迫一定要显示出完整网页 也就是还会下载一些网页图片
好消息是网路上有人自己写了一个library
http://www.codeproject.com/dotnet/apmilhtml.asp
这个library可以直接把网页原始码转换成DOM物件
已经懂得DOM的话 用这个写程式抓那些字串就很方便
不然的话 个人感觉regex会比较简单
※ 引述《terrytai (Terry)》之铭言:
: 如果要从一个html档案中找出特定的字串
: 整个原始码抓出来的字串设程string tempCode
: 已经知道我想要的字串前面一定有>
: 後面一定有</a>
: 如何把html档案中每个符合这个条件的字串
: 都抓出来另存成新的字串?
: 那麽我是不是就先设了string StartString = ">";
: string EndString = "</a>";
: 然後呢?
: 怎麽去找出介於StartString跟EndString中间的每个字串?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 59.104.83.234
1F:→ terrytai:已经懂得DOM的话......小弟还没学过这个 ^^" 02/19 17:07