[問題] 爬蟲問題

作者: il0306 (MrSix)   2020-11-10 10:40:44
[問題類型]:
爬蟲爬不出來
[軟體熟悉度]:
R爬蟲新手
[問題敘述]:
想將網站上的文字和數字抓下
https://i.imgur.com/3WRTVVA.jpg
安全不能等之類的文字我抓的到
但就地區和數值抓不下來
都回覆空質
[程式範例]:
url_list = 'https://168.motc.gov.tw/countrydeadhurt/%E8%87%BA%E5%8C%97%E5%B8%8
2?y=100&m=1'
temp = read_html(url_list)
temp %>% html_nodes(xpath = '//*[@id="areaList"]/div')
[環境敘述]:
[關鍵字]:
作者: andrew43 (討厭有好心推文後刪文者)   2020-11-10 17:03:00
動態生成的。temp就已經沒有抓到了。試試rselenium
作者: obarisk (OSWALT)   2020-11-11 20:17:00
在 script 裡, html_node("script") grep 清一下再解json

Links booklink

Contact Us: admin [ a t ] ucptt.com