[問題] 爬網頁抓影片的疑問

作者: DearYoyoDon (yoshito)   2016-04-21 18:15:32
各位板友好,
最近看youtube教學
練習用Python抓圖片、影片、分析網站
import requests
res = requests.get('
http://www.maplestage.com/episode/139279/%E4%B8%80%E8%A2%8B%E5%A5%B3%E7%8E%8B+20160420+%E9%81%93%E9%AB%98%E4%B8%80%E5%B0%BA+%E9%AD%94%E9%AB%98%E4%B8%80%E4%B8%88+%E5%A4%AB%E5%A6%BB%E7%94%9F%E6%B4%BB%E8%AB%9C%E5%B0%8D%E8%AB%9C!/')
print res.text
我是找maplestage練習抓上面的影片
像上面的影片是dailymotion的
可是在res.text裡面內容找不到相關的影片連結
小弟不太懂網頁裡面語言
所以試了很就可是還是無法成功
所以想知道是不是有方法找到影片的連結來下載
作者: busystudent (busystudent)   2016-04-21 18:21:00
幾個問題希望你回答,你這網頁裡有許多影片,請問你要抓哪支影片?所以你目標是抓影片聯結還是下載影片?
作者: DearYoyoDon (yoshito)   2016-04-21 18:35:00
希望能直接抓下影片,例如能下載某個節目某一集
作者: aweimeow (喵喵喵喵 ヽ( ・∀・)ノ)   2016-04-21 20:10:00
影片網址是這個嗎?http://goo.gl/okaoP4ptt站方不給貼 ppt.cc 只好貼 goo.gl 的 orz
作者: DearYoyoDon (yoshito)   2016-04-21 20:10:00
存取遭到拒絕耶@@?!
作者: aweimeow (喵喵喵喵 ヽ( ・∀・)ノ)   2016-04-21 20:12:00
http://pastebin.com/7yqGJCWv 我把影片網址貼這呃,我知道原因了我換了個 IP 再去存取這個網址是 403他那個網址是只能讓我的 IP 存取,所以你才會 forbidden總之,他把影片網址藏在這段 " target="_blank" rel="nofollow">
你找看看囉,找的到影片網址下載就容易了
作者: DearYoyoDon (yoshito)   2016-04-21 20:37:00
那用什麼解析這些網址,這是能轉換的嗎?你圖片裡上面那一行的網址裡面的HTML就可以只接找到mp4的連結
作者: aweimeow (喵喵喵喵 ヽ( ・∀・)ノ)   2016-04-21 20:45:00
可以試試 lxml 然後用 xpath 來找到你要的東西BeautifulSoup 好像也可以,但是我沒有用過
作者: DearYoyoDon (yoshito)   2016-04-21 20:55:00
非常感謝,我一開始試soup但是總覺得好像轉換後有些找不到,不過我現在是先從網站裡面找到.../embed/..的影片連結,再從新的網站去找下載連結有點麻煩,但是先這樣做,希望版友能指點 :)

Links booklink

Contact Us: admin [ a t ] ucptt.com