[問題] ptt 爬出作者跟文章怎麼存進excel裡?

作者: rayray0410 (蘇韋在哪裡)   2019-03-05 17:21:01
練習爬蟲的路上先從ptt 下手
最近遇到的困境是該怎麼把爬到的內容存進excel裡
原本是想說利用list 一個存標題、一個存內文,再用dataframe輸出至excel
但一直存不進去,看著錯誤代碼才想到 爬到的不是string
而是 item 或是 object的東西
以下是簡略的程式碼,標題存進title的list、內文存進article裡
ptt_title = soup.select('span.article-meta-value')
// 標題
title[count] = ptt_title[2].text
content = soup.find(id="main-content").text
// 內文
article[count] = content
count++
但顯然.text 是沒辦法直接存入的! 所以想請教版上的各位
還有甚麼辦法可以存進excel呢??
感謝各位!!
作者: lemon651 (小明)   2019-03-06 11:47:00
估計是沒轉成text吧
作者: powerkshs (氣質斯文讀書人)   2019-03-06 00:47:00
df.to_excel
作者: rayray0410 (蘇韋在哪裡)   2019-03-05 23:00:00
謝謝!關鍵好像是.text()?
作者: jiyu520 (不要鯽魚我)   2019-03-05 22:21:00

Links booklink

Contact Us: admin [ a t ] ucptt.com