PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] 如果爬回來的response部分內容有加密?
作者:
bckkt
(bckkt)
2018-03-03 22:25:11
如題
拿到response之後,做了一次URL decode才看到json的結構
直接貼到json editor online,有報錯
後來丟到dirtymarkup,發現有些地方長得如下
每個response都會有3~4處長這樣,json格式會被破壞,似乎網站會隨機找幾處來加密
請問有沒有大大遇過這種的ORZ,被加密的資料佔了要爬的資料很大一部分
因為爬的是籃球比賽即時的分數,所以能不用selenium就不用
作者:
ckc1ark
(偽物)
2018-03-03 23:05:00
就看他怎麼解的照做囉
作者:
bckkt
(bckkt)
2018-03-03 23:14:00
謝謝回應,大大的意思是說把網站載下來,看網站的.js來找?
作者:
s860134
(s860134)
2018-03-04 12:44:00
看起來還是 json format? 通常這個是 base64import base64;base64.b64decode
作者:
WunoW
(WunoW)
2018-03-04 20:13:00
你去宮廟找人幫你通靈比較快
繼續閱讀
[資訊] 大陸(python大全)教學資源
alen84204
[資訊] 101 個 numpy 小測驗
aaaba
[問題] 問一個excel寫檔的蠢問題
bckkt
[問題] 從判決書中匹配法條
goofi0211
[問題] 關於schedule同步問題
phoenixcx
[問題] pyserial delete 0x7f變成backspace 0x08
subset
[問題] 如何將GUI中的內容寫入網頁表單
XperiaZ6C
[問題] def f(*arg) 不指定變數請教(已解決)
znmkhxrw
[問題] 零基礎新手自學網路課程請益
ethan5566
[問題] bs4 爬蟲疑惑請求指引
thomasflee
Links
booklink
Contact Us: admin [ a t ] ucptt.com