※ 引述《danceofdie (zong)》之銘言:
: 1. 對於資料流量來源的總結,兩家公司都以隱私為由不公開資料來源,所以看完官方文件後也是不知道實際的來源是什麼。
https://www.similarweb.com/corp/ourdata/
https://www.semrush.com/kb/998
雖然很模糊,但這兩家其實有大概講一下資料來源
- 拿一堆關鍵字丟搜尋引擎的結果頁面看結果
- 跟上面類似,不過是去拉維基百科之類的大型公開資料
- 跟第三方買各種資料
- 第一方資料(不過說能拿到 GA 資料但不講怎麼拿到 GA 資料,毛毛的)
這種大規模資料搜集有時候生意不是那麼好端上檯面。
自己沒做過,但古早有聽人講過「到處下廣告,然後用廣告成效估計網站用量」之類的招
這招現在應該沒有五年十年前這麼好用,但大概還是有把戲能變?
另外 similarweb 直接在網站上提到他們會跟 ISP 買資料。
某個程度上滿嚇人的...
總之,他們的主要資料大~概~不是實際用量數據。
而是各種側面資料,加上一部分流量資料來作為估計用的基準。
這樣估計出來的資料光是能落在同一個數量級就很了不起了。
GA 直接用 JavaScript 測量網站使用狀況,品質會好得多
但也不會是百分之百準確
- Firefox 某些情況下會擋 GA,Brave 應該也會擋
- 跑在客戶端的 code 本來就不可能完全可信
- 會各種被塞(黑帽 SEO?)資料