網頁索引(index)狀況確認暨大型網站 (other) 障礙解決辦法建議




用LINE傳送
對惹... 不好意思只有行動裝置可以用 LINE 分享喔.. ^^" (若是用桌機或筆電會被帶走.. ~"~) index checking

說到網頁索引(index)狀況確認暨大型網站 (other) 障礙解決辦法建議..

有在稍微關注網站 SEO 的朋友、應該都會了解在進行網站 SEO 前,有一個大前提是網站到底是否所有頁面都有被搜尋引擎完整索引(或說收錄、Indexing)。而這就像是不論到底是有多行有多行,至少也要先 “參賽” 才有機會角逐冠軍是一樣意思。

而被搜尋引擎 “索引” 就跟 “參賽” 是一樣的意思,想要在搜尋結果出現(甚至到首頁、前三名等..),先別說網頁 SEO 有多厲害、內容主題性有多猛烈,至少也要先被搜尋引擎蜘蛛程式 Spider 抓取網頁資訊並進行索引後,也才有機會在某人輸入某組關鍵字後、能在搜尋結果上看到該網頁連結。
(這段文字下方也有放上 Google 搜尋引擎檢索與建立索引技術的介紹影片..)

crawling-indexing

所以我們現在若是設法讓網站可以很容易就被搜尋到,除了關鍵字廣告外、應該要先確認我們網站頁面是否都有被搜尋引擎完整索引。若發現某些內容都還沒有貝索引,那其實就也先不用擔心 SEO 了,先到搜尋引擎站長工具(Google 的叫 Search Console..)提交 sitemap, 更重要的是盡力與其他網站產生串連、想辦法出現在各大網站頁面連結中即可。

但要怎麼知道我們網頁是否有被搜尋引擎正確索引呢。這時是可以在某一搜尋引擎(Google or Yahoo!)搜尋框中,輸入 site:網站網址 就可以知道該搜尋引擎目前已經收錄了多少頁面。

只是假如網站已經大到不知道現在到底有幾頁,又要怎麼知道搜尋引擎是否真有完整收錄,又或者現在只想知道到底目前網站大概有多少頁面時,那麼以下的文章將可以讓我們參考如何利用 Google Analytics 所有網頁報表、已快速了解網站目前大致頁面規模,並且再利用 site:網址 的搜尋語法,確認自己網站在搜尋引擎的收錄狀況。

題外話:

除了以下影片外,也或者可以直接前往 Google 介紹 “檢索與建立索引” 的說明頁面,裡面就有相當完整的內容。

但若網站規模大約就十幾頁的朋友其實也不用花時間看這篇文章了。畢竟這篇文章所提到的技巧,主要是對那些規模已經大到無法用數的或靠記憶就知道有幾頁的網站(通常都是購物、新聞型或不是由自己產生內容 or UGC 等網站),但就還是希望多少有些參考價值。

(為了避免瀏覽文章的心情與思緒被打斷,這篇文章中若如上方有出現超連結,或許也可以先按著 Ctrl(或 ⌘ Command) 鍵再點選該連結。如此就可以先默默另開視窗,等待會有空或真的有需要時再到另一個頁籤查看喔!!)



用 “所有網頁” 搭配 “site:網址” 來確認網站收錄數

簡單來說,Google Analytics > 行為 > 網站內容 > 所有網頁 報表所顯示的是,目前網站有哪些頁面曾被瀏覽過,而在這些頁面的訪客行為又大概是怎樣,甚至讓我們得比較每一個頁面帶來的訪客價值。

也就是說,網站整體使用性只要別真的太糟糕,內容也別難以入目。只要是一個還算正常的網站,理論上若能帶進訪客,那麼幾乎每一個頁面都要能被瀏覽過。

all-pages

所以這時我們就可以用這 “所有網頁” 的規模數量大致了解我們網站差不多有多少頁面後,緊接著再去某搜尋引擎如 Google 搜尋框中,輸入 site:網址 後就可以了解目前這個網站被搜尋引擎收錄了多少頁。

indexing

兩相對照下,就可以了解目前網站被收錄的狀況是否正常。若差距太大,也只要馬上到 所有網頁 報表確認自己有哪些類型頁面,再去搜尋結果上檢視與紀錄哪些頁面都沒被收錄,就也差不多了解接下來改善空間在哪了。

像是在上圖範例中,Google 搜尋引擎索引頁面數比 Google Analytics 所有網頁多,有可能是庫存頁面過多、但實際上已經沒有這些頁面。此外,也很有可能是雖說實際上有那麼多頁面,但對訪客而言、其實也只會瀏覽那幾個重要的頁面,而很少有人會看完所有網頁。

題外話:

再次補充在 Google Analytics 中文介面下,每張報表下方的 “頁” 不是指這份報表有幾頁,而是指在這份報表中有多少個頁面單位。

page

所謂 (other) 的每日 50,000 頁限制與應對辦法

但是,以上技巧會在一個時刻失效。就是若我們網站規模已經大到每日網站總瀏覽數超過 50,000、在 Google Analytics 的限制下就會被歸類在 (other) 中。也就是說這時再看 Google Analytics > 行為 > 網站內容 > 所有網頁 報表就不一定是網誌中所有的網頁了。
(如下圖,單日檢視某網站所有網頁報表時,可以發現下方數量不會超過49,999)

other

而上述對不需要瞭解自己網站有多少頁面的網站管理員而言或許也無妨,但若對此感到超級困擾的朋友,其實有一個頗簡單的解決方案就是別將網站所有分析數據都放在同一個檢視(Google Analytics > admin > view)中。

而這實際的做法則是當網站規模實在太大時,可以依據不同主題、甚至語系另開新的子(次)網域(所謂子(次)網域與主要網域差別如下圖..)。

subdomain

接著就可以到 Google Analytics > 管理 > 資料檢視 為每一個子(次)網域另開新的檢視,這時理論上只要分細一點,單日頁面瀏覽數就不會超過 50,000 頁了。

題外話:

且若站在網站 SEO 的角度,一些內容主題差異性過大、尤其是不同語系時,本來就會建議用子(次)網域來規劃網址 ← 還比較有機會在搜尋結果頁面上同時出現不同子(次)網域的網站連結。

至於以上所提,一個網站若每日瀏覽頁面數超過 50,000 時就會變 (other) 的說明,可參考 Google 說明中心的 “報表中的「(other)」項目” 介紹。而其中也有提到,若對這規定很不大xxxx可以怒買 Google Analytics 360, 然後這個時候 50,000 限制會擴充為 75,000。

↑要不要買就見仁見智,瀏覽網頁數到底是否重要也因網站而異。

data-limits

網頁索引(index)狀況確認暨大型網站 (other) 障礙解決辦法建議..

剛剛最後提到見仁見智,其實要不要新增那麼多子(次)網域其實也非絕對,可先參考以下從網站 SEO 與使用性(Usability) 等考量的優缺點分析,再評估網站經營的策略與限制,最後再來決定網址的制定會比較妥當喔。

advantages_and_disadvantages

這篇 Google Analytics 精選文章發表於2016 年 10 月 11 日 星期二

立即訂閱看見數據網電子報

數據變化萬千,跟著看見數據網從數據中洞察網站經營脈動、缺失與機會!!