[問題] BeautifulSoup4使用問題

作者: tyc5116 (累人啊....)   2018-03-04 16:20:13
如題,照著書上的教學作測試,得到預期外的結果
(使用Python3.4, OS windows 8.1)
書本爬這個網頁作範例
https://goo.gl/Htv4bm
也提供了程式碼供下載
https://goo.gl/Qjz2eN
預期只會得到清單的各個名稱
Vegetable Basket
Russian Nesting Dolls
...(略)
span等等的那些也都抓到了,同樣測試了descendants及next_siblings,也得到奇怪的結果
請問是我對預期的結果有誤會嗎?以下附上一部份測試得到的結果
再麻煩解答,謝謝
<tr><th>
Item Title
</th><th>
Description
</th><th>
Cost
</th><th>
Image
</th></tr>
<tr class="gift" id="gift1"><td>
Vegetable Basket
</td><td>
This vegetable basket is the perfect gift for your health conscious (or
overweight) friends!
<span class="excitingNote">Now with super-colorful bell peppers!</span>
</td><td>
$15.00
</td><td>
<img src="../img/gifts/img1.jpg"/>
</td></tr>
<tr class="gift" id="gift2"><td>
...
(略,id = gift1~gift5都有列出來,格式同上)
作者: tyc5116 (累人啊....)   2018-03-04 16:48:00
抱歉,看懂了,排序一下html的格式後就看出來了
作者: ar54971   2018-03-06 03:35:00
作者: galeondx   2018-03-06 04:14:00

Links booklink

Contact Us: admin [ a t ] ucptt.com