Re: [心得] Similarweb | SEMrush | GA 哪個最不準?

作者: GALINE (天真可愛CQD)   2022-07-20 11:43:10
※ 引述《danceofdie (zong)》之銘言:
: 1. 對於資料流量來源的總結,兩家公司都以隱私為由不公開資料來源,所以看完官方文件後也是不知道實際的來源是什麼。
https://www.similarweb.com/corp/ourdata/
https://www.semrush.com/kb/998
雖然很模糊,但這兩家其實有大概講一下資料來源
- 拿一堆關鍵字丟搜尋引擎的結果頁面看結果
- 跟上面類似,不過是去拉維基百科之類的大型公開資料
- 跟第三方買各種資料
- 第一方資料(不過說能拿到 GA 資料但不講怎麼拿到 GA 資料,毛毛的)
這種大規模資料搜集有時候生意不是那麼好端上檯面。
自己沒做過,但古早有聽人講過「到處下廣告,然後用廣告成效估計網站用量」之類的招
這招現在應該沒有五年十年前這麼好用,但大概還是有把戲能變?
另外 similarweb 直接在網站上提到他們會跟 ISP 買資料。
某個程度上滿嚇人的...
總之,他們的主要資料大~概~不是實際用量數據。
而是各種側面資料,加上一部分流量資料來作為估計用的基準。
這樣估計出來的資料光是能落在同一個數量級就很了不起了。
GA 直接用 JavaScript 測量網站使用狀況,品質會好得多
但也不會是百分之百準確
- Firefox 某些情況下會擋 GA,Brave 應該也會擋
- 跑在客戶端的 code 本來就不可能完全可信
- 會各種被塞(黑帽 SEO?)資料
作者: Boston (Boston)   2022-07-20 17:48:00
我印象中 similarweb 是透過網路封包分析(跟 ISP 買資料
作者: GALINE (天真可愛CQD)   2022-07-20 20:58:00
如果是 shared host 或雲端服務,分析能力還是有限現在HTTPS幾乎標配,除非環境污染 MITM,不然打穿機率不高自己的機器或固定外部IP應該就能抓很準了突然想到DNS那個方向應該還是有招...
作者: guanting886 (Guanting)   2022-07-21 01:00:00
正常環境不會有MITM數據資料可以一魚多吃 當你使用平台的服務就同意他們可以怎麼使用你的資料 而且賠償是有上限的有些數據也不一定需要ISP 那邊買當你拉進那些免費的字體、JS、服務就是幫別人收集資料完善他們的服務舉例說 SEMRUSH 可以知道某網站數據狀況,上面的數據缺很意外跟 GA 上的資料接近,即使有誤差。可是那個網站呢用的AWS、Cloudfront + Cloudflare 的服務其他就是一些常見的 GA、FB PIXEL、BING 追蹤轉換、成效的東西還有 Google Font你說究竟是誰出賣了這個網站的呢 不知道 但是一開始你同意了服務條款,他們也得到你的授權,他只要適當的去掉可以識別的資料他們怎麼用你也拿他們沒什麼辦法 畢竟免費服務麻像某家賣IP Geo 資料的業者,他們怎麼可以抓到很準確的 Country/City 可以思考一下他們以前推了什麼服務給網友XD還有一些數據平台資料鎖很緊,爬蟲還不一定爬得穩,不是合作夥伴我是不相信啦XD
作者: GALINE (天真可愛CQD)   2022-07-21 15:04:00
「正常」是不應該有...(望向 superfish 案CDN 業者拿到的資料品質應該也不錯這年頭資料都被賣來賣去的啊....

Links booklink

Contact Us: admin [ a t ] ucptt.com