[問題] 如何爬blob圖檔

作者: guanj (gaunj)   2020-12-12 22:39:59
如題
因為網頁是有跟js互動的
所以我想要用selenium爬上面的圖片
圖片部分的原始碼長這樣
<img border="0" class="hej-view__content"
src="blob:https://xxxxxxxxxxxxxx/10c7d445-5263-4bcf-b999-7e1e1a669d45">
有一些直接貼 blob:https://XXXXXXXXX/XXXXXXXX 這串網址可以找的到圖
這類的有辦法爬下來
另一些貼網址去找只會顯示 "檔案可能已遭到移動、編輯或刪除。"
這個就不知道要怎麼爬
不知道blob的運作原理,為什麼可以讓有些圖片可以爬 有些不行
有沒有大大可以指引一下方向
謝謝!
作者: TakiDog (多奇狗)   2020-12-13 03:16:00
可以用js 撈Object,看是寫js request送回自己的server或是轉base64再用python解,或是樓下提供更好的方法XDblob可以查 File API / Blob urls

Links booklink

Contact Us: admin [ a t ] ucptt.com