網(wǎng)站每天都會分享很多關于SEO的文章,也分享了不少搜索算法排名因素統(tǒng)計和調(diào)查,但有一個問題一直沒仔細說。所有排名因素統(tǒng)計調(diào)查都一樣,嚴格說,從搜索結果統(tǒng)計分析出來的排名因素只能說是與排名有相關性,不一定有因果性。換句話說,觀察、統(tǒng)計得到的排名因素并不一定是真的搜索引擎使用中的排名因素。
簡單說,這些排名因素統(tǒng)計的過程是這樣:搜索典型關鍵詞(總數(shù)需要達到一定量,比如1萬個關鍵詞),下載搜索結果頁面,使用各種工具記錄、查詢、計算有排名的頁面的特征(也就是排名因素),最后分析排名好的頁面有哪些共同特征,或者有哪些排名不好的頁面所沒有的特征。
所以,這種統(tǒng)計的基礎是,“排名好”與“頁面特征”同時出現(xiàn),也就是這兩者有相關性,經(jīng)常相關性還挺高。但有相關性并不必然說明有因果性。最淺顯的比喻是,公雞打鳴和天亮經(jīng)常一起出現(xiàn),是有很高相關性的,而且是公雞打鳴后天亮,但公雞打鳴不是天亮的原因。
排名與所謂的排名因素之間也是如此。最明顯的,幾乎所有排名因素統(tǒng)計都表明,F(xiàn)acebook和Twitter等社交媒體上的點贊數(shù)、分享數(shù)、轉(zhuǎn)發(fā)數(shù)等是與Google排名相關性最高的因素,或者說兩者同時出現(xiàn)概率很高,但社交媒體互動數(shù)據(jù)高是導致排名好的原因嗎?或者說,是排名因素嗎?一直以來,Google的幾位員工都明確否認社交媒體數(shù)據(jù)是排名算法中的因素。
Google員工的話不一定都可信,但社交媒體數(shù)據(jù)不是排名因素,基本上是可以相信的。兩個原因:
a.Google拿不到社交媒體上的完整數(shù)據(jù)。目前Google和幾個主要的社交媒體都沒有協(xié)議(以前和twitter有過),不能后臺拿數(shù)據(jù),只能靠自己抓。需要登錄才能看到的信息自然抓不了,即使是不需要登錄的,由于信息量太大,Google抓取的比例我記得以前看到過統(tǒng)計,還不到10%。
b.社交媒體隨時可以禁止Google抓頁面。這個就更可怕了。不能掌握在自己手里的數(shù)據(jù),用來做重要排名因素,一旦社交媒體們翻臉,Google搜索結果質(zhì)量可能直線下降。把自己的質(zhì)量控制權放在別人手里,大公司做不出這種事。
之所以社交媒體數(shù)據(jù)好的頁面同時也排名好,可能的原因包括:
a.社交媒體數(shù)據(jù)確實是排名因素(不是必然,但不排除這種可能)
b.搜索排名好導致社交媒體分享數(shù)據(jù)好
c.搜索排名和社交媒體分享是另一個或一些共同因素造成的(比如頁面瀏覽量、外鏈數(shù)之類)
c.社交媒體互動間接造成搜索排名好
e.巧合
到底是哪一種,或是其它原因,我們目前無法知道。再比如,一個相反的例子。Searchmetrics的統(tǒng)計表明,.com域名與排名是負相關,或者說,.com域名不利于排名。這就有點費解了,一般來說.com域名都是首選啊。這很可能是被維基百科強大的排名能力干擾了,大部分查詢詞都會有一兩個維基百科的頁面排在前面,而它是.org域名。
既然所謂的排名因素和排名之間不一定有因果關系,有些甚至明確沒有因果關系,那我們忙活什么呢?那些公司費勁統(tǒng)計它干什么呢?
首先,不一定有因果關系,但也不一定就沒有因果關系。搜索引擎不說,我們就不能確定而已。更重要的是,兩者的強相關度往往是有內(nèi)在原因的,雖然我們不知道確切關系。如果SEO們把一個頁面優(yōu)化得和排名好的頁面一個樣,那么很大概率這個頁面也能獲得好排名,雖然我們也無法明確知道到底優(yōu)化的那一部分起了作用,起了多大作用。
最后提一句,處理相關性、而非因果性的關系,正是人工智能的強項。