[問題] AJAX網路爬蟲 stanleychao PTT批踢踢實業坊

[問題] AJAX網路爬蟲

作者: stanleychao 2019-05-31 22:57:30

之前都是用scrapy搭配selenium爬蟲，不過遇到動態網頁就會慢很多
最近爬文得知可以用AJAX方式去把所需要資料讀出來，不過無法跟網路教學一樣讀出json格式
以下是我要資料流程
EX:
import requests
import json
url = 'https://fb.oddsportal.com/feed/match/1-6-E5R55yD8-3-1-yj4d1.dat'
response = requests.get(url)
response.text
問題就如下打response.text時會出現以下，而不是像chrome工具顯示後面還有一大串json
"globals.jsonpCallback('/feed/match/1-6-E5R55yD8-3-1-yj4d1.dat', {'e':'404'});"
請問這是為什麼呢？
謝謝

作者: q79236 (昕翔) 2019-06-01 01:19:00

試試看把header設定的跟google chrome一樣看看

作者: a11780922 (蘿蔔特務) 2019-06-01 20:03:00

header 要給參數

作者: utdsml (阿邊肥) 2019-06-11 11:58:00

scrapy可以用splash處理AJAX

繼續閱讀

無法找到程序輸入點caron0225 [問題] 我這樣架構方向正確嗎? (新手)ccu516 [閒聊] Py.Taipei 五月月會a9202507 [問卷]資訊人員學習新程式語言的動機意圖vivian1725 [問題] 如何讀取crystal report 的RPT檔案blacknate [問題] 關於兩個功能只能執行一個Kuoluky [問題] 利用python網路爬蟲登入A601B8 [問題] GUI選擇v00623 2019第24屆大專校院資訊應用服務創新競賽opal0425 [問題] 新手詢問找不到project interpreterpigers