[分享] 最近完成的防爬蟲 PHP library

作者: terryshin (溫暖的小太陽)   2019-06-10 14:35:28
最近完成的 library,主要用在自己網站
大約問市約一個月。
設計動機:
因為盜文農場 (例如 xx 頭條) 之類的爬蟲實在很多
由其中國那邊很流行用鏡像對映的方式盜人全站放廣告
讓我覺得很不爽。因為才會做這個。
做好之後稍微整理一下分享出來。
https://github.com/terrylinooo/shieldon
文件:
https://shield-on-php.github.io/
使用遇到問題歡迎到GitHub開 Issue 給我。
作者: holishing   2019-06-10 17:00:00
先推分享
作者: tgenie (你看不到我)   2019-06-11 08:22:00
推一個
作者: ice831107 (沁雨)   2019-06-11 19:10:00
推大大分享
作者: bakedgrass (蒙古烤小草)   2019-06-12 04:26:00
這樣是不是也犧牲了SEO?
作者: MoMoShota (正太控)   2019-06-12 09:43:00
回4樓,這個可以設定白名單給指定的 bot
作者: hareion08 (巨蟹)   2019-06-12 13:47:00
作者: alian954 (PhantasyStaR)   2019-06-14 13:24:00
作者: cph911 (911_cph)   2019-06-18 08:24:00
設白名單的話爬蟲不是也能偽裝嗎?
作者: teli (You Are)   2019-06-25 15:49:00
分享有推
作者: vi000246 (Vi)   2019-07-02 15:06:00
是用RDNS去判斷是否白名單的 應該不能偽裝吧
作者: powyo (光子郎)   2019-07-08 13:34:00
這有辦法防headless嗎
作者: harry8736968 (HiSunday)   2019-07-19 12:37:00
推分享
作者: swallowcc (guest)   2019-08-13 10:13:00
推,讚讚
作者: Edison4ever (叫我阿希就好)   2018-01-04 09:22:00
之前都用python爬 http://bit.ly/2QKPf4V看到這麼完整的repo會想要重新回去玩PHP 謝分享~
作者: yuiweq1999 (imre2009)   2018-02-06 08:41:00

Links booklink

Contact Us: admin [ a t ] ucptt.com