作者jami520 (我的生命因你而发光)
看板Visual_Basic
标题[.NET] 如何解析HTML码?
时间Sat Jan 1 23:35:13 2011
目前有撷取到网页的原始码,但要如何撷取我要的资讯呢?
Dim web As New System.Net.WebClient()
web.Headers.Add("Content-Type", "application/x-www-form-urlencoded")
Dim d As Byte() =
System.Text.Encoding.GetEncoding("Big5").GetBytes("syear=20100908")
Dim res As Byte() =
web.UploadData("
http://www.tai.asp", "POST", d)
MsgBox(System.Text.Encoding.GetEncoding("Big5").GetString(res))
res为撷取到的网页原始码
那我假设要网页原始档里面<TD align=right class="12bk">8817</TD>的8817
不知道接下来还要怎样处理呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 219.71.218.129
1F:推 pinkykk:字串处理吗? 01/02 00:30
2F:→ jami520:是的~ res已经是网页的原始码了,但要撷取要的字串如何做? 01/02 07:49
3F:→ jami520:正规化可以写成~抓取<TD> </TD>的方式吗?这样子改为其他 01/02 08:20
4F:→ jami520:如<span></span>的方式也可以适用,只是这要如何写呢? 01/02 08:21
5F:推 UniFish:先抓"<TD",然後在搜寻">"~这样才是完整的判断 01/02 12:27