Re: [問題] 網路爬蟲相關問題

作者: tses89214 (幻想天空)   2017-06-07 13:44:38
※ 引述《tses89214 (幻想天空)》之銘言:
: [問題類型]:
:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
: [軟體熟悉度]:
: 入門(寫過其他程式,只是對語法不熟悉)
: [問題敘述]:
: 各位好,我想要抓取旅遊網站上面的金額的資訊,就是橘色的NT$的部分
: https://goo.gl/rTUzDp (網址過長所以縮了一下)
: 但因為沒有處理過動態的網站而卡關,
: 目前進度是使用read_html以及readLines這兩個function試過,
: 發現抓到東西的與看到的網頁原始碼不一樣。
: 從開發者工具雖然有看到幾個.js的項目,
: 卻不太知道該用GET或是POST什麼東西給他們,
: 所以想問:該用什麼方法才能得到想要的資料呢?
: 謝謝!
: PS.只要能拿到網頁的原始碼就行了,後面的文字處理我可以自己來。
: [關鍵字]:
:
: 網路爬蟲
:
抱歉又有新的問題了QQ,
目前進度是想要爬在各種行程裡面,不同票種(成人,小孩,老人等)的票價,
從開發者工具看到它是在選定套餐與時間之後,對一串網址傳送訊息得到資料,
以同一個行程當例子(https://goo.gl/rTUzDp),範例網址如下:
https://www.klook.com/xos_api/rest/arrangements_api/3547822.json?gateway=web&_=1496809592949
但我搞不懂的是,他的"...api/3547822.json"這段,
那串數字是怎麼得到的? 不同的套餐、時間,那串數字就會不一樣,
想說如果能知道規律就能得到回傳的資訊了,
抑或者有其他的方法可以得到不同行程中的不同票種的票價嗎?

Links booklink

Contact Us: admin [ a t ] ucptt.com