哈囉,我正在用Python寫一個自動抓圖程式,想要從HTML碼中抓出href的連結。
使用Selenium 的 find_element_by_xpath ,但不管怎麼樣都抓不出連結。
HTML碼如下:
...
<li><a class="AAA XXX" href="連結1">View</a></li>
<li><a class="AAA" href="連結1">Download</a></li>
<li><a class="BBB" href="連結2">Download Large Version</a></li>
...
程式碼如下:
try :
# 優先下載大圖(連結2)
target = driver.find_element_by_xpath("//a[@class='BBB']")
print(target.text)
except:
# 沒有大圖
try:
# 下載小圖 (連結1)
target = driver.find_element_by_xpath("//a[@class='AAA']")
print(target.text)
except:
# 連結沒有圖片
print ("nothing")
輸出結果:
Download Large Version
上網查了一下,改成
target = driver.find_element_by_xpath("//a[@class='BBB']/@href")
輸出結果則是:
nothing
請問一下,要怎麼讓xpath讀出href的連結呢?
還是有什麼更好的方法呢?