前一段時間Google工具條PR又在更新了。我感覺更新還沒結束,顯示PR數據準確性很值得懷疑。
現在對Google PR更新本身越來越不感興趣了。因為基本上沒有大的造鏈接活動,PR值也不會有什麼太大變化了。不過看到網上有一些關於PR更新及網頁在Google中排名變化的一些迷思,覺得還是有必要把自己的一些理解跟大家介紹一下。
Google工具條PR不是真實的PR
大家所看到的工具條上顯示的綠色條,更準確的應該稱為可見的工具條PR值,而不是Google內部用於排名計算的真實PR值。
Google真正使用的PR值是連續不停的計算的,並不是每三個月或兩個月改變一次。我們看到的工具條PR是一段時間以前(比如兩個月或三個月)某一個時 間點的PR值輸出。所以我們現在看到的工具條PR值,已經是兩三個月前的數據。現在真實的PR值是多少是無法知道的。
另外,工具條上顯示的PR值是否是輸出時真實的PR值,我也表示懷疑。不僅是這次更新,從很多次更新的情況看,要么Google有意不告訴我們真實PR值,要么很多網站的數據出現了錯誤。
Google工具條PR更新與排名變化沒有時間對應關係
在論壇裡看到不少人說,Google PR值更新,網站PR提高了一或二,怪不得這幾天排名也上升了。
其實Google工具條PR更新與Google排名之間沒有時間上的對應關係。像上面說的,真實的PR是連續不停計算的,而且是隨時被計入排名算法的。更新後我們看到的工具條PR值所帶來的效應在幾個月前就已經被計入排名了。
所以不要從工具條PR值上升,來判斷對網頁排名有什麼影響。如果你同時看到工具條PR值上升和排名上升,最好找其他原因,這是時間上的巧合,而並沒有直接因果關係。
Google PR只與鏈接有關
經常看到博客留言或論壇中有人說,我的網站已經兩年了,為什麼PR還是零呢?或者,我的網站內容全是原創,為什麼PR還是零呢?
原因是,PR值與站長是否認真,內容是否原創,網站設計怎麼樣,甚至與域名年齡,都沒有直接關係。
PR的計算只是根據反向鏈接,進來的鏈接越多,這些鏈接頁本身的投票力越高,你的網頁PR值就越高。所以就算你的域名已經十年了,如果沒有反向鏈接,PR值也高不了。
最近幾個月有可能出現一些看似的例外。有的網站因為付費鏈接問題被懲罰,PR值要么下降,要么清零。目前不知道這些網站PR值變化是人工調整,還是因為算法檢測出付費鏈接後取消某些鏈接的投票力,而造成與之相關的其他網站PR值變化。總之,還是與鏈接有關。
Google已經不跳舞很久了
在論壇裡還會看到有人用Google Dance這個詞,有的專家到現在也還在說Google Dance。
其實Google已經不dance很久了。
Google dance這個詞是數年前形容Google每個月一次大更新而創出來的詞。那時候的Google更新,是網頁數據庫,算法,各數據中心之間的同步全部發生徹底變化。 Google已經不進行這種dance四年多了。
現在的排名變化更多的是因為算法更新或數據刷新而引起的。而且算法更新現在的特點是小規模不停的調整(Everflux),那種大規模的更新已經十分十分少見。
以前的真正的Google dance和現在的排名變化特徵並不相同。所以用Google Dance這個詞對某些SEO初學者來說可能有誤導。
SEO不是數學,大部分地方沒什麼精確性。 SEO更靠近是門藝術,很多時候是靠著說不清道不明的直覺和經驗,同時邏輯及細節也很重要。
舉兩個最近幫人看的網站診斷案例。
一個朋友的網站,莫名其妙的在搜索引擎中消失了。以前收錄正常,不知從什麼時候開始,網頁越來越少直到完全消失。
我看了一下網站,就是一個簡單的個人網站。邏輯告訴我,商業性網站作弊被K的可能性往往不小,個人網站作弊可能性微乎其微,沒有利益驅動,根本不值得這麼做。網站不被收錄,除了被K,要么就是robots.txt文件禁止抓取,或服務器設置禁止蜘蛛抓取。
從現象來看,我的直覺是robots文件有問題。可是打開robots文件看了看,實在看不出什麼問題,是很簡單的允許所有搜索引擎抓取。 Robots文件裡多一個斜杠少一個斜杠,天差地別,所以我瞪大了眼睛仔細看,確實看不出什麼問題。
這 時細節要發揮作用了。我用線上robots文件驗證工具查了一下,三個工具有兩個工具顯示文件最前面多出一個莫名其妙的問號,就像英文電腦沒裝中文字體打 開中文網站時看到的那種問號。直接在瀏覽器打開robots文件,或者對方把文件傳給我,用編輯軟件打開,都看不到這個問號。
經過簡單對話,發現這位朋友使用的是Windows Vista操作系統。以前就听說過Windows Vista系統有時候在處理文字時編碼會有問題。不知道什麼原因。不過結果是robots文件編碼可能出現問題,搜索引擎抓取後產生錯誤理解,結果不抓取網頁。
我在我的電腦裡把文件重新存一遍,傳給對方。對方不打開不編輯,直接上傳網頁空間,幾天后,抓取開始正常。
另一個出現問題的是英文網站。在Google搜關鍵詞,排名三天兩頭在第一頁到四五頁之間跳來跳去。但是在Google.cn排名穩定。因為是英文站,所以在Google.cn的排名毫無意義。
邏 輯告訴我,這和網站語言或服務器位置有關。看了看網站,是純英文,沒有中文字,服務器在美國。檢查了一下網站的反向鏈接,有大量的中文網站鏈接。所以初步 判斷,這些鏈接被判斷為有垃圾嫌疑。但是有很多英文網站其實都有大量垃圾中文鏈接,就算排名很差,但並不會出現這種現象。
我的直覺告訴我,雖然和大量中文網站為伍,但不至於被懲罰,而且懲罰也很少見到這種現象。
看 網站頁面看不出什麼。突然發現一個細節。在Google.com,這個網頁的排名旁邊寫著”Translate this page” (翻譯此頁),這是個很奇怪的現象。我的電腦是英文系統,用的是Google.com,英文網站的英文關鍵詞排名,不應該出現翻譯此頁這個鏈接。這說明 Google是把這個網頁當成中文網頁了,所以在Google.cn中排名穩定,但是在Google.com中跳來跳去。
再仔細看網站,確實沒有中文。打開CSS文件發現,定義的字體中有中文字體。建議對方把中文字體刪掉。過一段時間後,問題解決,Google.com中排名穩定在第一頁,當然Google.cn的排名跑後面去了。
這兩個案例都是網上的朋友在問了很多專家高手都找不出原因後,通過MSN問我。我估計專家高手們可能想得太複雜,往作弊啦,懲罰啦等方向分析去了,卻忽略了簡單的邏輯和直覺。
我在寫博客帖子的時候,經常會在帖子之間互相鏈接。在做這些交叉鏈接的時候,有以下幾個方面的考慮。
方便讀者參考其他帖子
在帖子裡談到某個概念或某件事,如果有其他帖子有詳細說明,就鏈接到那個帖子。主要是為了用戶體驗,這是在做交叉鏈接時最重要的考量。
一般留言的大都是老讀者,看過大部分帖子,但是我並不假設所有讀者都是老讀者。從統計數字看,近70%的流量都是新讀者。在帖子之間交叉鏈接,能讓新讀者更方便的了解到哪裡能找到更深入的說明。網站最初的本質之一就是引用和鏈接。
所以會看到諸如“安慰自己”,“深有體會”之類的鏈接詞。沒有別的意思,就是讓讀者知道我怎麼深有體會,怎麼安慰自己。我不覺得這沒多大意義,只要讓用戶覺得有些幫助,就有意義。
有利於老帖子被收錄
因為博客的結構特徵,老帖子會被壓到離首頁很遠的地方。雖然有按月存檔及分類存檔,但當帖子數目越來越多的時候,一些老帖子需要點擊數次才能從首頁訪問到。離首頁點擊次數越多,被收錄越困難。
所以有時候在談到相關問題的時候,鏈接到老帖子,有助於這些深層內容的收錄,及整個網站的網頁之間權重平均分配。
重點帖子推動排名
有一些自己覺得比較重點的帖子,當然也希望在搜索引擎中排名比較好。除了內容的寫作及讀者鏈接過來,博客本身的內部鏈接也會對這些帖子排名有很大幫助。
我們都知道鏈接的重要性,鏈接並不僅指外部鏈接,內部鏈接也會有幫助,而且錨文字自己能控制。所以在其他帖子談到相關問題時,鏈接到幾篇主要內容,有助於這些帖子的排名。
博客分類頁的權重和排名
大家可以看到我的博客分類比較細,其中有一些屬於很熱門的關鍵詞。比如網絡營銷,電子商務等。這兩類內容也是我目前最感興趣的題目,雖然不是我博客的主題,但也希望排名能有所提高。
不 過這些分類頁排名比帖子頁還困難。因為帖子頁還能有其他地方的轉載鏈接,這些分類頁幾乎沒人會鏈接過來。在Google,百度查一下網絡營銷,電子商務的 排名,可以看到絕大多數排在前面的都是網站的首頁。而我的分類頁已經是四級目錄,再加上沒有外部鏈接,想有所排名,只能靠自己內部鏈接,自己給自己加加 油。所以在談到這類話題時,有時候就鏈接到這些分類頁。當然也並不是每次出現這些詞就鏈接過去,那樣用戶該討厭了。
至於說鏈接一般都放在文章的下部,如果真是這樣,也純屬巧合。
今天談談搜尋引擎可能怎樣鑑別垃圾留言。
在點石論壇裡看到了太多帖子討論博客留言群發軟件以及各種各樣的經驗。很多人都認為,有不少網站靠博客垃圾留言提高排名,效果不錯,網站也沒被懲罰。不過有兩點需要考慮:
1)我們看到的大量垃圾留言不一定是網站排名的原因。為減少誤殺,搜尋引擎通常忽略垃圾留言,而不會直接懲罰留垃圾留言的網站,不然太危險了,很容易被人利用來陷害競爭對手網站。這些網站的排名很可能是我們沒發現的原因,比如有一些很強有力的外部鏈接。
2)現在不懲罰,不一定就意味著以後也不懲罰。說懲罰其實不太準確,準確的說當搜尋引擎發現這些垃圾留言時,去除這些垃圾鏈接的權重和投票力,使網站排名下降,看似是懲罰,但其實只是使網站排名回到它應有的地方。
搜尋引擎怎樣判斷垃圾留言呢?可能有以下方法。
看留言的時間關係。比如同一個博客幾秒鐘內,在不同帖子出現同一個網站的留言鏈接,這肯定不正常。或者同一個網站的垃圾鏈接,在幾乎同一時間段出現在多個博客上。這對單個博客作者來說看不出來,但對搜尋引擎來說,檢測到這些易如反掌。
留言中是否含有URL? URL只是文字還是做成一個超鏈?有的垃圾留言軟件或留垃圾留言的人野心比較大,不滿足於僅留下簽名,還在留言內容裡留下URL。在被過濾的垃圾留言中,我經常看到長達幾頁的垃圾。這種垃圾留言,我估計再蠢的搜尋引擎也能判斷出來。
留言長度。很多垃圾留言往往只是說,好文章,說的不錯,頂之類的話。這種短小而又沒什麼意義的話,也會增加被懷疑的可能性。
上了黑名單的IP及網站。就像上個帖子所說的,反垃圾軟件會收集那些垃圾網站及IP地址。一旦上了這些黑名單,就直接被過濾掉了。我相信搜尋引擎也有類似數據庫。
博客帖子有多老以及最新留言情況。如果博客帖子已經是兩年前的,而且一年半沒有新留言了,冷不丁冒出一個留言,這多少也有點可疑。
留言相關性。搜尋引擎可以通過語義分析,判斷留言與博客帖子是否有一定的相關性。群發軟件留下的垃圾,通常都是沒什麼意義,放在哪兒都相關,也都不相關的話。
多個博客留言模式。群發軟件都會往大量博客發垃圾,而且留的域名及留言內容都一樣或相似,這種模式一定會引起懷疑。
垃圾鏈接出現的速度。與真正的讀者留下的有意義的留言不同,群發軟件都是快速留下大量鏈接,搜尋引擎也可以檢測到這一點。
上面列出的垃圾留言特徵,有一些肯定已經被反垃圾軟件及搜尋引擎在使用,但不一定是全部。也肯定還有其他因素,咱們想不到,但搜尋引擎想到的。搜尋引擎永遠比咱們聰明。
如果哪位做出一個軟件,能避免上面所說的所有可能被懷疑的地方,那你是個高手。