[問題] 新手爬蟲問題

作者: giveme520   2016-07-26 23:31:53
在練習抓資料上網找網頁照打
然後卡在 IndexError: list index out of range
教網頁只說打[0]
但是我抓的網頁出來空格多很多
http://imgur.com/a/xR1PN
是要改成多少數值呢? 謝謝
作者: ccvs (kisS x Sis)   2016-07-27 12:02:00
你有先看過DOM的文件嗎空格是因為node中沒有strong這個標籤
作者: giveme520   2016-07-29 12:59:00
@@ 可是我用infolite看是strong說..
作者: tacovirus (小璋丸)   2016-07-29 13:36:00
Python 寫爬蟲歡迎來這我的 GitHub 抄http://tinyurl.com/juhodhr
作者: giveme520   2016-07-30 23:07:00
感謝!
作者: kimball (我在抗拒什麼...)   2016-07-31 03:03:00
你 .product-content 那行抓到的 list,裡面有很多元素沒有 strong 的標籤。 更精確的說是有些有,有些沒有沒有的元素,你再用 strong 去抓,就會抓不到東西,變成空的 list。 空的list就沒東西了,用索引取值自然爆error解法之一是加一個邏輯, 如 if len(item)==0: 再抓strong
作者: giveme520   2016-07-31 16:34:00
謝謝 我再試試!以前只學過ㄧ點VB和JAVA都還回去了

Links booklink

Contact Us: admin [ a t ] ucptt.com