[問題] 網頁資料抓取 filiaslayers PTT批踢踢實業坊

[問題] 網頁資料抓取

作者: filiaslayers (司馬雲) 2014-03-03 15:17:58

/* 聽說註明使用的語言、環境
* 問題有可能較容易被解決...
*/
我寫了一個script想要抓取一個網頁上的檔案列表
這個網頁是用apache做index，也就是會把目錄下的檔案自動生成一個列表
我有上網google到一個方法，不過他寫的我實在看不懂...
有人可以教我怎麼分析嗎?
wget

作者: danny8376 (釣到一隻猴子@_@) 2014-03-03 19:23:00

誰跟你說一定要用'了? "只是要考慮shell的一些特殊符號要記得跳脫比較麻煩而已

作者: filiaslayers (司馬雲) 2014-03-03 21:04:00

所以是都可以嗎?我看所有的教學文都用'才覺得奇怪

作者: danny8376 (釣到一隻猴子@_@) 2014-03-03 21:44:00

兩者的差別你可以分別跑 echo '$PATH' 和 echo "$PATH"差異很明顯

作者: danny8376 (釣到一隻猴子@_@) 2014-03-03 21:47:00

然後回一下你問了第二行的話很簡單就是從wgetlog.txt裡面抓出URL:後面的部分

作者: danny8376 (釣到一隻猴子@_@) 2014-03-03 21:48:00

(就是WGET輸出檔案中檔案的部分抓出來之後再把&換成& (HTML的特殊字元跳脫)

繼續閱讀

[問題] 如何正確地截出想要的字串neurone [問題] PHP preg_replace 的問題KC73 [問題] 有組文字集合如何比對至少符合的次數season5566 [問題] 查標點符號mathtku Fw: [請益] regex請教MaxHaru Re: [問題] 一段表達式, 希望版友能幫忙解析...danny8376 Re: [問題] 一段表達式, 希望版友能幫忙解析...DongFeng Re: [問題] 一段表達式, 希望版友能幫忙解析...danny8376 [問題] 一段表達式, 希望版友能幫忙解析...DongFeng [問題] A條件下抓取B條件Dream74

Contact Us: admin [ a t ] ucptt.com