Re: [問題] tuber套件擷取YouTube頻道資訊

作者: iambakr (123)   2020-06-23 00:50:48
原文恕刪
後來我用以下方式可以成功抓到想要的資訊了!!
# Get Channel description
get_description <- function(id) {
get_channel_stats(id)$snippet$description
}
description <- lapply(data$id, get_description)
description_df <- do.call(rbind, lapply(description, data.frame))
# Get Channel region
get_Country <- function(id) {
get_channel_stats(id)$snippet$country
}
Country <- lapply(data$id, get_Country)
Country_df <- as.data.frame(data.table(Country))
但以上方式雖然成功抓到資料,有幾個問題也想請教前輩
1. 這邊只列出抓兩種資訊(description & country)
但假設我要抓五個以上資訊的話,只能像上述寫法寫五組嗎?
2. 由於抓出來的資訊有包含英文, 中文, 日文甚至是阿拉伯文在內
我用以下寫法產出的CSV檔,非英文都會出現亂碼或是大量這種<U+25B6>
write.table(x = data, file = "Youtube.csv",
fileEncoding = "UTF-8", row.names = F)
設定了Sys.setlocale("LC_CTYPE", "Japan")等語系都還是不行
想請問該如何解決?
謝謝各位
補上 sessionInfo()
R version 4.0.0 Patched (2020-04-26 r78306)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 10 x64 (build 18363)
Matrix products: default
locale:
[1] LC_COLLATE=English_United States.1252
LC_CTYPE=English_United States.1252
LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C
LC_TIME=English_United States.1252
system code page: 950
作者: locka (locka)   2020-06-23 09:38:00
1. 你get_description這個function只做一件事(…$snippet$description取值),那為什麼不直接寫就好XD 上篇討論的寫法還是沒解決嗎?2. 請參考前面 UTF-8 寫入問題那一篇,用readr套件應該可以解決你的問題

Links booklink

Contact Us: admin [ a t ] ucptt.com