[問題] 使用爬蟲抓圖的問題

作者: friendever (hi~)   2014-07-26 19:15:39
不確定這樣的問題要怎麼分類
我想寫個小程式可以固定去抓某個網頁的某張圖
那個圖的位置是固定的
只是內容會隨著每次refresh改變
那邊的html程式大改長得像這樣
<img src="XXimg.php?str=code">
那個code看起來是一組hash code,就是今天的日期加上一些亂數
看起來是每次載入網頁的時候
會去跟server的一段php code要一張圖,回傳過來
這樣子的圖要怎麼抓呢?
因為網路上教的方法都是去抓「固定的一張圖」
像這種來源的圖檔要怎麼抓呢?
謝謝大家
作者: ssccg (23)   2014-07-26 21:05:00
抓網頁,找到網址,抓圖
作者: Y78 (Y78)   2014-07-26 22:55:00
regexp
作者: PTT007 ( )   2014-07-27 00:07:00
用程式模擬瀏覽器,當它網頁載入完以後,再用regular抓圖
作者: lolikung (幹麼查我?)   2014-07-27 02:22:00
PHP Simple HTML DOM Parser可能是 php 頁面會重新導向到圖片網址,所以抓到的其實是 header?
作者: ssccg (23)   2014-07-27 03:08:00
你先看看那個圖片網址回來的response內容是什麼是直接content type就是圖,還是http 302還是別的東西server端php還什麼都不重要,你只要管回來的是什麼
作者: hschao (SugarGreen)   2014-08-03 22:23:00
照抓呀 content-type 應該也還是image

Links booklink

Contact Us: admin [ a t ] ucptt.com