[問題] 請教如何parsing網頁

作者: liptonbin (我還存在耶)   2022-08-11 14:50:39
請問一下
我有底下網頁的表格 想要用c#做parsing
例如想要抓出表格的第一欄和第二欄 (抓 <CENTER> 0 </CENTER> 中間的值)
0=36s
0=54s
....
第一欄總數相加 0+0+...+0+...=0
https://ibb.co/rQvBpxf
下面比較麻煩,格式比較不固定, (抓 30</a> </center> 前面的值)如最後一張圖
0=1s
4=9s
...
...
第一欄總數相加 0+4+0+...+9+30+...+3+...+15+...+1+...+23...=85
https://ibb.co/Dw3rW7T
檔案路徑: https://filebin.net/8nwar5cyuh2ioi46
請問c#上該怎麼做
非常感謝
作者: ga009900 (Lienfa)   2022-08-12 11:16:00
可以試試看用 regular expression
作者: liaommx (Orz)   2022-08-12 21:36:00
以爬蟲的方式去抓抓看,剩下都是程式邏輯過濾資料關鍵字 HtmlNodeCollection
作者: wezmag (wezmag)   2022-08-13 13:54:00
Html Agility Pack 可以試試

Links booklink

Contact Us: admin [ a t ] ucptt.com