[問題] python2 抓ptt web版資料 (https)

作者: sheeder (ㄎㄎ)   2014-11-06 03:50:05
大家好
最近需要抓ptt上的文章資料再分析
所以就開始學python2
參考了網路上的一些範例,後來可以抓網頁的資料了
不過卻只有pttweb版的資料無法,
是因為python2不支援https的網頁嗎?
不過google也是https可是卻有抓到東西
請問大家如果用python2有什麼辦法可以成功?
(花了整天的時間就是找不到可以work的><)
謝謝!
作者: uranusjr (←這人是超級笨蛋)   2014-11-06 08:13:00
請提供 minimal reproducing example
作者: Yukirin (いい天気!)   2014-11-06 19:47:00
之前有抓過有人寫好的套件
作者: Markseinn   2014-11-06 22:52:00
我用mechanize這套件可以抓
作者: sheeder (ㄎㄎ)   2014-11-07 03:32:00
謝謝大家!主要應該是cookie的問題

Links booklink

Contact Us: admin [ a t ] ucptt.com