[問題] 定位子層級的標籤

作者: alansyue (alansyue)   2018-07-26 00:45:29
大大們好,我是非本科系,也在學習 Python 的初學者
最近在學習爬蟲有些問題想詢問,但不知道該如何清楚定義問題
所以覺得標題有點難理解,還請多多包涵
最近在練習爬取一個網站,想爬出一些值但是遇到問題
程式碼結構如以下示意
<div class="top">
<p>
<i class="text1">
::before
</i>
Hello text1
</p>
<p>
<i class="text2">
::before
</i>
Hello text2
</p>
我想抓 Hello text1 這個資訊就好
我有試過用 BeautifulSoup 的 find("p") ,但發現網站內還有很多其他的p
但用 select(".text1") 得出的值是 None,猜測因為字是寫在<p>上
因此想請問大家有沒有比較好直接抓到這個字的方法,非常感謝!!

Links booklink

Contact Us: admin [ a t ] ucptt.com