[問題] 新手請教爬蟲 lovex PTT批踢踢實業坊

[問題] 新手請教爬蟲

作者: lovex (L O V E X) 2020-09-01 17:26:32

新手學習爬蟲中~
請問如以下的學校公告欄
http://www.cshs.kh.edu.tw/post/book.asp
soup = BeautifulSoup(html, 'html.parser')
for link in soup.find_all(href=re.compile("view")):
print(link.get('href'))
這樣可以抓到內文實際的連結，但不知如何抓細節
主要想抓整個table把新的資料寫入sql db, 不知道怎麼抓好呢?
(因為它的table都沒有id 或 class之類的~)
(新增資料

作者: panex0845 (èƒ–å…‹æ€) 2020-09-01 19:44:00

整個表格也沒幾行把網頁抓下來做字串分析就行了

作者: chickengod (雞大俠) 2020-09-01 20:11:00

有 table 的話用 soup 抓出 table 餵給 pandas不過這網頁有 RSS 的話直接用 feedparser就不需要自己處理網頁

繼續閱讀

[問題] 如何打開 raw image filemorningjis [問題] Xlwings資料型態問題sillygrace [問題] Mac用程式改AV片名改到檔案不見kiwistar [問題] class中method名稱一樣tsaiminghan [問題] 要如何透過python取得network log資訊laya1017 [問題] vscode 範例檔案突然有問題jackjenny [問題] list與list[:]差異ericrobin [問題] mac 用Jupyter 無法使用graphvizSupershero Re: [心得] 上傳照片或影片到 Google Photofunky1221 Re: [心得] 上傳照片或影片到 Google Photofunky1221