[問題] 網頁資料抓取

作者: filiaslayers (司馬雲)   2014-03-03 15:17:58
/* 聽說註明使用的語言、環境
* 問題有可能較容易被解決...
*/
我寫了一個script想要抓取一個網頁上的檔案列表
這個網頁是用apache做index,也就是會把目錄下的檔案自動生成一個列表
我有上網google到一個方法,不過他寫的我實在看不懂...
有人可以教我怎麼分析嗎?
wget
作者: danny8376 (釣到一隻猴子@_@)   2014-03-03 19:23:00
誰跟你說一定要用'了? "只是要考慮shell的一些特殊符號要記得跳脫比較麻煩而已
作者: filiaslayers (司馬雲)   2014-03-03 21:04:00
所以是都可以嗎?我看所有的教學文都用'才覺得奇怪
作者: danny8376 (釣到一隻猴子@_@)   2014-03-03 21:44:00
兩者的差別 你可以分別跑 echo '$PATH' 和 echo "$PATH"差異很明顯
作者: danny8376 (釣到一隻猴子@_@)   2014-03-03 21:47:00
然後回一下你問了 第二行的話 很簡單就是從wgetlog.txt裡面抓出URL:後面的部分
作者: danny8376 (釣到一隻猴子@_@)   2014-03-03 21:48:00
(就是WGET輸出檔案中 檔案的部分抓出來之後再把&換成& (HTML的特殊字元跳脫)

Links booklink

Contact Us: admin [ a t ] ucptt.com