Re: [問題] 網路爬蟲抓不到標籤<img>的src屬性 rexyeah PTT批踢踢實業坊

Re: [問題] 網路爬蟲抓不到標籤<img>的src屬性

作者: rexyeah (ccccccc) 2018-11-11 21:29:57

不在意速度的話...
from selenium import webdriver
from bs4 import BeautifulSoup
url = 'https://v.comicbus.com/online/comic-103.html?ch=924'
browser = webdriver.PhantomJS()
browser.get(url)
html = browser.page_source
soup = BeautifulSoup(html, 'html.parser')
img_url = 'https:%s' % soup.find('img', {'id': 'TheImg'})['src']
print img_url
====
不過其實phantomjs已經deprecated了，但還是可以用。
上面那段我自己跑過，可以抓到，只是真的很慢
※ 引述《bugbug777 (sil)》之銘言：
: 大家好，小魯是個網路爬蟲新手
: 最近想來寫一個下載圖片的網路爬蟲
: 這裡附上簡短的程式碼
: <img border="0" id="TheImg" name="TheImg"/>
: 似乎抓不到src的這個屬性，請問這是為什麼？
: 圖示8comic的海賊王924話圖片
: https://imgur.com/ccnRjKr

作者: bugbug777 (sil) 2018-11-11 21:55:00

請問用火狐可以嘛還是你只是隨便挑一個瀏覽器用@@a

作者: rexyeah (ccccccc) 2018-11-11 22:06:00

都可以我只是順手用個default headless的driver

作者: bugbug777 (sil) 2018-11-11 22:15:00

謝謝你喔還貼出完整的程式碼

作者: zo6596001 (超帥肥宅) 2018-11-12 00:34:00

我在上一串貼的圖用火狐，是因為在Linux比較好裝

繼續閱讀

[已解決] 網路爬蟲抓不到標籤<img>的src屬性bugbug777 [問題] tkinter print另一個執行中的py檔的方法st40182 [問題] 有關dict用法 (DFS找有向圖中的cycle)skyHuan [問題] if 的判斷是否有特殊限制?jasonhsu14 [問題]python爬蟲中html選取元素問題cscscs56 [問題] 簡單面試問題jkkert [問題] 如何安裝另一個anaconda promptbewilderment [問題] xlwings excel插圖透明化caron0225 [問題]爬蟲-匯率運算問題cscscs56 [問題] python正規表示式如何做？han999

Re: [問題] 網路爬蟲 抓不到標籤<img>的src屬性

Re: [問題] 網路爬蟲抓不到標籤<img>的src屬性