[問題] selenium取網頁內容的問題 kanako PTT批踢踢實業坊

[問題] selenium取網頁內容的問題

作者: kanako (我是香民) 2016-10-20 17:52:05

請問一下如何使用selenium取得瀏覽器出現畫面的完整文字內容？
單純用webdriver的page_source是不是無法完整取得某些動態網頁的內容？
我遇到的問題是瀏覽器載入頁面後page_source跟在瀏覽器中看到的頁面原始碼不一樣
https://goo.gl/wMi3LO　這是我嘗試載入的網頁
程式碼如下
driver = webdriver.Chrome("driver path")
wait = WebDriverWait(driver, 30);
driver.get(url)
try:
WebDriverWait(driver,
delay).until(EC.presence_of_element_located((By.XPATH,
'//*[@class="content__article-body from-content-api js-article__body"]')))
html = driver.page_source
print "Page is ready!"
except TimeoutException:
print "Loading took too much time!"
把html變數內容存下來卻沒有我設定等待其出現的網頁元件
試過phantomjs也是一樣的結果
請問一下應該要怎麼做才會取得完整的畫面原始碼
謝謝

作者: BigBank ( ) 2016-10-22 03:11:00

之前用phantomJS可以取得完整內容

作者: sky800507 (B翰) 2016-10-22 13:02:00

我用Firefox得到的page_source中有你要找的class喔可能是你中間程式碼的問題?

繼續閱讀

[問題] 關於實現 "文字複製" 的問題(ctrl+c)Assing [問題] 爬蟲拆寫字串問題jackjenny [問題] or 邏輯問題kero961240 [問題] 關於排版縮排跑掉問題herbacin [問題]在不同測試case中共用同一個變數-pytestjacobcan118 套件安裝問題dinoptt1993 [問題] 字元編碼顯示問題？koshi0413 [問題] pyomo 使用相關的ERROR 解決Muhaosic 相關套件安裝問題dinoptt1993 [問題] py2exe 和 pyinstaller 都有一樣問題os653