[問題] wget 下載網頁 src="//..."

作者: VElysian (くるみ)   2018-08-31 22:32:59
如題
用 wget 下載的網頁含有圖片
網址:
https://www.mobile01.com/newsdetail/26682/eric-bike
圖片:
src="//attach.mobile01.com/attach/201808/mobile01-abfe7e57cf816f7fb5fdcf08d1e98b34.jpg"
假設原始碼為 src="//image.jpg"
wget 遇到這樣的連結都無動於衷,
導致下載的網頁不完整。
請問有沒有解決辦法,感激不盡!
作者: kenduest (小州)   2018-08-31 23:59:00
下載的命令完整參數是 ?
作者: VElysian (くるみ)   2018-09-01 00:17:00
wget -HpkKE url找到 manual 中 --convert-file-only 有寫The rest of the URL has been left untouched,including the net path ("//") which would otherwisebe processed by Wget and converted to the effectivescheme (ie. "http://").可是下載的檔案裡還是 src="//... 啊 ><"
作者: newversion (海納百川)   2018-09-01 00:21:00
試試看 -m 或 -r
作者: VElysian (くるみ)   2018-09-01 00:45:00
結果還是一樣:wget -HpkKE -r -l 1 url
作者: Hevak (Arthow Eshes)   2018-09-01 01:52:00
你要從瀏覽器的角度去思考,看到 // 瀏覽器會自動把 // 轉成跟當前頁面一樣協定比方說你網頁在 https://,當下頁面的 src="//開頭網址"就會被當成 src="https://兩斜線後面都一樣" 處理
作者: hijkxyzuw (i,j,k) ×(x,y,z)   2018-09-01 13:15:00
用 --convert-links

Links booklink

Contact Us: admin [ a t ] ucptt.com