[問題] 爬蟲問題 cd12631 PTT批踢踢實業坊

[問題] 爬蟲問題

作者: cd12631 (<(◥█◤△◥█◤)>) 2017-06-14 23:39:40

[問題類型]:
程式諮詢(我想用R 做某件事情，但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
使用者(已經有用R 做過不少作品)
[問題敘述]:
平常是很少爬蟲之前有在爬的時候也算是順利
今天臨時把之前爬過的東西翻出來要抓資料
網頁如下:
http://ntpc.youbike.com.tw/cht/f12.php?loc=taipei
但之前爬得很順利的東西(兩年前)
今天突然抓不下來
爬文以及google一下似乎是Keep-Alive Connection的問題
也許這兩年內這網站加上這東西
google了一下相關的資訊還是無法爬成功
只好上來請教各位先進
[程式範例]:
library(magrittr)
library(httr)
library(rvest)
library(stringr)
# 例如我要抓這網頁可停空位那一欄
ubikeurl <- "http://ntpc.youbike.com.tw/cht/f12.php?loc=taipei"
urlubike <- read_html(ubikeurl)
ubike <- urlubike %>%
html_nodes(., xpath = "//tr/td[4]") %>%
html_text
[環境敘述]:
R version 3.4.0 (2017-04-21)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
[關鍵字]:
選擇性，也許未來有用

作者: max6 (啊囉哈) 2017-07-02 12:44:00

那個table是用javascript生成的，所以直接download html是看不到的。你可以用Selenium開Browser去抓。或是讀他的原始碼看那個table怎麼生成的。目前看起來是javascript有一個變數arealist, urldecode再parse json後就是你到的東西，注意他的中文是用unicode顯示

繼續閱讀

Re: [問題] 折線圖+長條圖呈現celestialgod Re: [問題] 折線圖+長條圖呈現celestialgod Re: [問題] 在R中有處理http query stringcelestialgod [心得] Rfacebook使用心得與問題tan800630 Re: [問題] 折線圖+長條圖呈現sacidoO [分享] Kaggle Bosch 生產線分析 74名, 前6%f496328mm [問題] leaflet for R 是否可使用 TGOS 底圖？berlin0212 [問題] shiny模板問題fjuheadache [問題] choose.dir() 資料夾的選取qazwsx879345 [問題] shiny reactiveValue observe疑問clansoda