[心得] 新聞網站技術細節分析

作者: tacovirus (小璋丸)   2018-11-08 01:11:19
最近嘗試把新聞爬蟲做得系統化,也發現各新聞網站的技術問題
大致上整理了兩份表格,可以知道有哪些技術債還沒還
如果想去這些新聞媒體 coding 可以推測要拆的雷
https://github.com/virus-warnning/twnews/blob/feature/search-news/docs/SOUP_NOTES.md
如果覺得這爬蟲有用,也歡迎抓來玩玩
只要在 Python 3.5 以上這樣裝就可以了
pip3 install twnews
詳細請見
https://pypi.org/project/twnews/
作者: neo5277 (I am an agent of chaos)   2018-11-08 02:00:00
推推推
作者: skitty (aki)   2018-11-08 09:42:00
請問有效率是指什麼?
作者: yyc1217 (somo)   2018-11-08 10:29:00
應該大部分都有RSS可以訂閱
作者: jerry1144 (′・ω・`)   2018-11-08 14:36:00
推! 新聞分解最完整的竟然是聯合跟中時...慘
作者: alvinlin (林矜業)   2018-11-11 18:57:00
不錯呦。收了。多謝。

Links booklink

Contact Us: admin [ a t ] ucptt.com