Re: [問題] VBA 抓非固定表單的資料

作者: Neisseria (Neisseria)   2016-06-26 12:47:52
如果妳的專業不是資訊相關的,去 soft job 徵人做比較快
只是幫忙抓資料,應該不算寫論文的槍手
如果想自己來的話,提示一下:
因為那個網頁是用 frame 分成數個網頁
可以單獨處理其中一個子頁面,會比較簡單,如下:
http://structurednotes-announce.tdcc.com.tw/Snoteanc/apps/bas/BAS210.jsp
然後,觀察一下網頁原始碼
可以發現那個按鈕會引發一段 JavaScript 程式
單純用 HTTP GET/POST 可能無法作用
而要使用 Selenium 這種網頁自動化軟體,模擬操作選單和按鈕的動作
Selenium 有許多種語言的 binding,挑一個喜歡的即可
如果沒有特別的偏好,建議選 Python 的 binding
然後,就要開始自己刻命令稿來自動化得到網頁
寫好命令稿後,可取得網頁原始碼
之後,再用 HTML parser 去取出自己需要的部分
附上一小段範例,僅供參考
https://pastebin.com/PJEyDPCt
小弟只是一時手癢,試玩一下,不是什麼高手
希望板上各位大大不要鞭太大力 3Q
※ 引述《Super16666 (SuperJJ)》之銘言:
: 軟體:EXCLE
: 版本:2010
: 想問怎樣抓下面的資料,我是在TDCC境外平台
: http://structurednotes-announce.tdcc.com.tw/Snoteanc/
: 因為論文需要,想要一口氣抓下方所有的資料(如下圖),可是這個真的太多了...
: http://i.imgur.com/YAdT3ng.png
: 進去網站之後,點左側"商品總覽"
: 我想要一口氣把所有"發行人/總代理人"下方的表格都下載下來
: http://i.imgur.com/c1M7BaTg.png
: 可是有兩個困難點
: 1. 第一個就是從EXCEL的時候,如果我直接COPY網址,他只會連到這個首頁...
: 這樣子就不能直接抓表格...
: 2. 就是他的頁碼介面很不友善,只能一頁一頁點,也要點到最後一頁才知道總共有幾頁
: 而且假設你要到第十頁只能一頁一頁點...
: http://i.imgur.com/TmhefhZ.png
: 想問問看有沒有大神可以一口氣下載全部資料...
: 救救小妹我的論文QQ
: 目前有網友是建議用createobject("internetexplorer.application")
: 不過我已經嘗試好久了真的弄不太出來,有人可以稍微指點一下嗎?

Links booklink

Contact Us: admin [ a t ] ucptt.com