[問題] 抓網頁的幾個小問題

作者: kyo0010 (~KYO~)   2014-11-25 21:47:06
WebClient wc = new WebClient();
wc.Encoding = Encoding.UTF8;
string result = wc.DownloadString(htmlStr);
textBox1.Text = result;
很簡單的幾句而已 想把網頁的資料抓下來
成功把HTML抓下來了 想解析的時候發現抓下來的HTML有些DIV 裡的TR 跟 TD 都不見了
只看的到
<div id="m"><div id="table01">
(消失的TR跟TD)
</div> <br></div>
可是要的值都在消失的TD裡面
想了整天不知道怎麼解....
想求大大們提點一下小弟
作者: Peruheru (還在想)   2014-11-26 08:32:00
你要說的是table吧?div底下怎麼會直接放tr和td?另外回回歸問題,我猜那是因為那些資料是js產生的你抓的資料大概是網頁剛產生的狀態,所以沒有動態內容我是不太清楚純靠c#自己刻要怎麼做...我的話只會想到靠其他東西來完成,如phantomjs之類的
作者: a926 (Aaron)   2014-11-26 10:09:00
你可能要在找一下,我猜你要的內容是Ajax做出來的找他call的回傳資料的網址
作者: Litfal (Litfal)   2014-11-28 15:50:00
開瀏覽器監視一下HTTP活動,應該蠻容易找到問題點的

Links booklink

Contact Us: admin [ a t ] ucptt.com