Re: [問題] 抓取PTT網頁,請問此程式碼的錯誤在哪?

作者: clansoda (小笨)   2016-10-21 16:44:42
Hi,很遺憾的是你後面那部分我有點看不太懂,但可以提供另外一種方法
來做到你想要做的事情 http://pastebin.com/yEvK1FuG
只有一個小問題,就是他的本文含在一個大TAG裡面但是有其他小TAG
我找不到一個很好的方式只抓本文,因此裡面會有一些title跟日期的廢話
用xml_contents可以只抓到本文,但是它的位置很不固定,只要有例如版主
塞了一些話進去的話,他的位置就會往後,這個只能看看有沒有了解結構的人
看看有甚麼好方法解決了
下面是用到的package
library(xml2)
libray(httr)

Links booklink

Contact Us: admin [ a t ] ucptt.com