2007年的数据,汉语网民有1.8亿,英文网民有3.6亿,两者差不多是两倍的关系。Google的PR算法理论上可以适用于任何语言,但也有客观因素影响,分享几个观点:
1. 访问来源的广度差距
全球的互联网站,中文整体比例不算低,链接权重的说法并不能完全合理解释。中文网站用户几乎都来自亚洲的这么一小块土地,覆盖地域很可能是流行程度参考之一。
2. 访问用户的量级差距
Alexa数据全球前一百名的网站里,中文只有百度、腾讯、新浪、网易、淘宝、谷歌、雅虎中国。英文用户的背景越复杂,其需求也就越分散,能从根本上能带动站群效应的提升。
3. 分词技术的语义识别差距
HTML在诞生之初估计就没考虑过汉语,某些语义标准不一定适合。所以在内容权重识别上,很有可能落后于根正苗红的英文网站,这点整个东语系都一样。
4. 内容的价值含量差距
尤其是IT行业公司,和各种学术理论,基本上源出英文,全球网站都链过去了。反过来瞧瞧汉语网站最流行什么,不服不行啊。