GA 數據資料 “取樣” 可能與門檻簡介,以及盡可能避免或改善之辦法與討論

G


本篇文章重點關鍵字/標籤:

說到 GA 數據資料取樣可能與門檻簡介、盡可能避免或改善之辦法與討論..

相信有不少企業、團隊隨著網站規模越來越大,有時候若打算要在 Google Analytics 中進行進階區隔、刪選器或是次要維度分析以進行更進階的分析,就會發現數據報表上出現數據已經經過取樣如這篇文章首頁圖。



但相信我們大家都知道數據只要一經過取樣、其準確度與參考價值就會大幅度降低。

所以我們今天主要要來研究與討論的,就是在了解為什麼 Google Analytics 報表數據資料會觸發取樣門檻後,未來又可怎麼做以避免讓我們的報表數據被取樣。

時間範圍選擇不會造成數據取樣

↳像是在預設(標準)報表中,數據資料分析區間不論拉多長都不會被取樣


至於有關上述稍微提到的進階區隔、刪選器或是次要維度都是在操作 Google Analytics 時最重要與方便的技巧與習慣,就如我們在 “進階區隔+ 主要維度+ 次要維度– 直接或點擊網址的訪客背景研究” 中的文章介紹所提。

至於有關為什麼 Google Analytics 要將 “數據取樣” 以及數據取樣之基本技術解釋、對於數據分析的危害以及相關延伸知識,就可以參考 Harris 先生在 “認識 Google Analytics的『取樣數據』- 初學者篇” 文章中提出的文字介紹。
(而今天這篇文章,主要是要來談我們該怎麼面對與盡力克服 Google Analytics 的限制,並希望能讓大家未來都能對 “數據” 有更全面的敏銳度..)


此外就是在每一個段落後都會為其內容增加一些補充參考資訊連結,若剛好有檢視需求,就建議可以按著 Ctrl(或 ⌘ Command) 鍵再點選這些補充文章連結。如此就可以默默另開視窗,看是要先看或真的有需要時再到另一個頁籤查看!!

什麼條件會讓資料數據取樣

↳數據資料取樣的定義




在 Google Analytics 中預設 “不會被取樣” 的報表

也因為我們都不希望 Google Analytics 數據被取樣,所以我們就可以先了解 Google Analytics 數據會被取樣的一些門檻,又或者是哪些數據不會被取樣。這樣我們未來在收集數據時,就知道可以透過哪些報表或事先準備以讓數據更加精準。

預設報表部會進行資料取樣

↳預設報表不會進行資料取樣*3



如上圖所提到的取樣條件以及標題下方第一句話:預設報表不會進行資料取樣。也就是說 Google Analytics 預設(標準)報表、左側導覽列中每一張報表都是不會被取樣的。

預設、標準報表

↳所謂預設(標準)報表



再者就是除了如這篇文章封面圖、以及一開始所提到的,分析日期起訖也不會影響報表數據是否會被取樣外,可事先自定的自訂報表也比較不容易被取樣(目前測試之結果)如下圖。

自訂報表

所謂 “自訂報表” 就是如我們在 “自訂報表天天看 – 快速整理對經營網站最有幫助的資訊集” 這篇文章中提到,是在 Google Analytics 中一個相當便利的操作應用功能。



建立自訂報表

↳建立自訂報表之介面


如何盡可能避免跨過被取樣門檻

接續上段內容敘述,若在某天發現自己的 Google Analytics 報表中上方看到黃色驚嘆號,那就或許可以參考以下幾種做法、以避免數據被取樣。

一、使用 Google Analytics 預設(標準)報表檢視數據 + 事先將流量來源盡可能分類

像是若我們一開始就能將各種廣告流量來源、媒介,透過 UTM 或網址產生器盡可能細分。那我們未來就只要用這預設(標準)報表就能夠清楚分析與比較不同來源/媒介之效益。

自訂不同的來源、媒介
↳先利用網址產生器分類數據來源、媒介

未抽樣數據

↳且看來就算新增不同時間範圍比較,也不影響數據是否會被取樣



二、縮短分析區間長短

雖然說在 Google Analytics 預設(標準)報表下,不論分析區間長短都不會導致數據被取樣。但若在某個已經確定會被取樣的報表中,是可以透過縮短分析區間長短而促使數據回到未取樣之狀態(如從一個月縮短為一週或一天..)。

這時因為數據已經確定不會被取樣,所以就一樣還是可以跟 “上一個時段” 或 “去年同期” 之數據進行比較與分析,相信還是有許多參考價值的。

抽樣數據

未抽樣數據

↳數據只要不要經過取樣就較具有參考價值



三、安裝不同的 Google Analytics 資源(Property)追蹤碼

這個做法是最簡單、一勞永逸但僅適用於一個網站中出現完全不同內容、主題資訊的狀態。

因為簡單說就是因為在免費 Google Analytics 帳戶中,限定在資源(Property)層級下臨時查詢報表中工作階段若超過50萬筆就會被取樣。

所以若我們網站規模真的已經非常大,且不同頻道都有完全不同主題與內容,那不如就是透過 “新建資源(一帳戶可建50個資源、一資源可建立25個檢視)” 為不同的主頻頻道安裝不同的資源追蹤碼,也相信這樣應該更能夠避免數據被抽樣。

帳戶、資源與資料檢視最多數量

↳或乾脆換一個帳戶,那有多少個網站都不用擔心


上述第一個辦法中提到的 “網址產生器” 如我們於 ““廣告活動” 報表數據與 “網址產生器” 的實際操作與應用參考” 文章中之介紹,真的也是 Google Analytics 最大分析與應用關鍵之一。



網址產生器

在今天 GA 數據資料取樣可能與門檻簡介、盡可能避免或改善之辦法與討論之後…

畢竟免費的 Google Analytics 再怎麼強大在面對各式各樣的分析需求時,有時候還是會有一些限制與不足。不過其實網站分析工具相當多,根據主要分析需求的不同也或許有更為恰當的分析工具。

像是我們 Harris 先生十分推薦的 “網站分析軟體 SimilarWeb, 用過就離不開!”,以及目前在國際間相當知名的 “Hubspot ─ 讓企業UP UP的跨功能分析管理平台” 以及 “Mixpanel網站數據分析初體驗” 都是在進行網站分析進而進行策略規劃的選項。

the similarweb



有關這位努力看見數據的人

蔡先生

共同創辦人/專案總監 業務接洽/聯絡方式..
Email Address: ada@awoo.ai / Line ID: 539406

目前主職 awoo MarTech 技術 nununi 推廣暨服務顧問,且深耕 SEO & Google Analytics 技術多年,曾有幸擔任國內各大知名企業、品牌與協會技術交流講師,且除了盡力看見數據外更盡可能抽空看見臺北各大特色咖啡館/優質廠商於 www.triplew.tw。

努力看見數據的人

蔡先生

共同創辦人/專案總監 業務接洽/聯絡方式.. Email Address: ada@awoo.ai / Line ID: 539406 目前主職 awoo MarTech 技術 nununi...

技術交流邀約(全國可談)

ada@awoo.com.tw
02-87121128#23

回頁面頂端