規則運算式 – 快速算出各種原本需要曠日廢時才能獨立分類的資訊




用LINE傳送
對惹... 不好意思只有行動裝置可以用 LINE 分享喔.. ^^" (若是用桌機或筆電會被帶走.. ~"~) 正規表達式 Regular Expression 介紹封面

談論規則運算式前碎念為前言

如同我們昨天 “關於篩選器 – 龐大數據中鎖定目標或去蕪存菁” 開始提到的,在 Google Analytics 網站分析中支援一些規則運算式的輸入與解讀、讓我們在 Google Analytics 網站分析中可以利用這些規則運算式幫助我們進行更快速且全面的數據分析設定,不但就(幾乎)不會有誤差還可以一勞永逸、省掉多餘不必要的輸入與交叉比對!!

題外話:
這規則運算式其實有超多種翻譯如 Google Analytics 說明中心就稱之為規則運算式、維基則有以下眾多解釋為 Regular Expression、regex或regexp,縮寫為RE,正則表達式、正則表達式、正規表示法、常規表示法等..

規則運算式簡介.jpg

規則運算式簡介

說實在.. 感覺 Google Analytics 網站分析說明中心對規則運算式的解釋正是常常會聽到的 “怎麼每個字看的懂、但放在一起就不知道到底在說什麼..”。那接下來在此可能也無法完整的解釋規則運算式, 但至少在 Google Analytics 網站分析中、這規則運算式簡單說就是可以幫助我們輸入幾個簡單的字元,就能讓 Google Analytics 網站分析知道我們要了解或排除的數據有哪一些、藉此我們就可排除不必要的數據並(幾乎是)徹底掌握所有的對做出重大判斷有關的參考依據。

題外話:
但很奇怪的是、就我們的經驗發現有時就算使用規則運算式還是會有遺漏抓取的數據(但很少很少…),所以上述才會一直使用到 “幾乎” 二字。

規則運算式使用範例.jpg

規則運算式用途

如上述、也因為規則運算式可用簡單字元幫助 Google Analytics 網站分析進行數據的判斷與收集,所以我們就可以將規則運算式置入篩選器所要篩選的欄位中,而不用將所有要篩選的數據一個、一個的個別置入(且這還有重複篩選的疑慮~”~)了!!
馬上來舉例(所有規則運算式的字元功能將於下一個段落詳細列出)…
如在規則運算式中 . 這個字元(點、dot)可以表達(代表)任何一個字母、數字符號,
所以當我們在篩選器欄位放入 aw.o 時,篩選器會將 awxo, aw4o, aw$o 相關的數據都篩選出來,
再來、
^ 這個字元所表達(代表)的就是篩選資料中、一定要是以 ^ 後面字詞開頭的數據,
如當我們在篩選器放入 ^awoo 就會抓取 awoo, awoooooo, awoo is Taiwan SEO Leading Brand 等相關數據,而不會抓取 wowawoo, oowawoo 等…

題外話:
還有一個較特別的字元為 \ 主要用途是讓規則運算式字元恢復成一般字元。
如 . 在規則運算式中可以代表所有字母、數字與符號,但有時不得不 . 時,
就可以告訴 Google Analytics 網站分析 “他單純只是 . 沒什麼太多涵義、請別想太多…”
像是假設我們要篩選某 ip 位置時,就不得不用到 . 如 163.212.171.123
那為了不讓 Google Analytics 網站分析誤認我們的初衷就可以輸入 163\.212\.171\.123

規則運算式字元解釋.jpg

規則運算式各種用法

假設從以上文章已經大致了解何謂規則運算式並迫不及待要使用了,那就可以趕快來參考一下 Google Analytics 網站分析說明中心的介紹吧。(以下主要說明皆為三行排列、從第一行開始分別是字元、說明、範例)

萬用字元

.
與任何單一字元比對(不論是字母、數字或符號)
goo.gle 會與 gooogle、goodgle 和 goo8gle 三者比對成功

*
與零個或多個之前的項目比對
根據預設,之前的項目是指之前的字元,因此 goo*gle 和 gooogle、goooogle 的比對會相符

+
作用跟星號一樣,不過加號必須與至少一個之前的項目比對
gooo+gle 會與 goooogle 比對成功,但與 google 則會比對失敗

?
與零個或一個之前的項目比對
labou?r 和 labor 與 labour 的比對都會相符

|
可進行「或」條件比對
a|b 會和 a 或 b 比對相符

錨定文字

^
要求您的資料必須位於欄位的起始處
^site 會與 site 比對,但不會與 mysite 比對

$ 要求您的資料必須位於欄位的結尾處
site$ 會與 site 比對,但不會與 sitescan 比對

分組

()
使用圓括號建立一個項目,而不接受預設值
Thank(s|you) 會與 Thanks 和 Thankyou 兩者比對成功

[] 使用括號建立要比對的項目清單
[abc] 可建立一份內含 a、b 和 c 的清單


使用破折號和括號來擴充清單
[A-Z] 可建立一份大寫英文字母的清單

其他

\
將規則運算式字元轉換為日常字元
mysite\.com 中的句點不會被視為萬用字元

題外話:
所有規則運算式其實更為龐大、在此僅列舉出與 Google Analytics 網站分析說明中心的項目。

聊完規則運算式後雜談為補充

就像上面說的、規則運算式其實還有各種強大的用途就不便在此用斧,不過稍微補充一下是也因為規則運算式有時過於強大、會將所有相關數據一掃而空。所以若是有明確的數據收集意圖時還請用規則運算式明確定義。
如若我們只想收集 awoo 的數據、而不是 ooawoo, awoo, adwords 時,就可以使用 ^awoo$ 如此就不會包含到其他條件了!!

這篇 Google Analytics 精選文章發表於2013 年 05 月 01 日 星期三

立即訂閱看見數據網電子報

數據變化萬千,跟著看見數據網從數據中洞察網站經營脈動、缺失與機會!!