近日对
Google的跟踪观察发现,中文Google目前可以提供汉语拼音检索功能。用户只要在Google搜索框中输入汉语拼音进行a索,Google会根据汉语拼音给出某些相似发音的汉语词语组合,在搜索结果页面顶部会给出一条提示“您是不是要找:…”。比如,用汉语拼音yitianruixin进行搜索,会得到Google的提示“您是不是要找: 奕天锐新 倚天瑞新 一天瑞新”。
本公司对Google的此项功能做了多种可能情况的测试,并且与最大的中文
搜索引擎 百度搜索进行了比较,发现Google的中文搜索功能已经有了很大的提高,搜索结果基本令人满意。可以说Google的中文搜索效果已经与百度搜索引擎毫不逊色。
以下是我们的比较结果,其中搜索用时根据不同用户的机器性能可能有所不同。我们在对网页搜索结果比较的同时,也比较了两者的图片搜索功能。比较用的选择关键字既有现代热门词汇也有关于中国传统的词语。通过下表,我们可以看出两者的差别及效果。
|
拼音关键词
| 返回提示
| 搜索结果
| 用时(秒)
| 图片
| 用时 (秒)
| 返回提示
| 搜索结果 | 用时
| 图片 | 用时(秒) |
Buyizu | 布依族
| 26
| 0.183 | 1篇
| 0.072
| 布依族
| 26个
| 0.183
| 1篇
| 0.072 |
Bingmayong
| 兵马俑
| 173
| 0.001
| 5篇
| 0.117 | 兵马俑 兵马佣
| 380
| 0.22 | 289 | 0.09 |
wangzhan
| 网站 网战
| 1,840
| 0.0001 | 4篇 | 0.108 | 网站
| 4,720
| 0.11
| 769
| 0.10 |
Yitianruixin
| 倚天 瑞新
| | | | | 奕天锐新 倚天瑞新 一天瑞新
| | | | |
Wangzhtuiguang
| 网站推广
| 45
| 0.348 | 无
| - | 网站推广
| 159
| 0.40 | 6
| 0.09 |
Baidu
| 百度
| 385,000
| 0.0001 | 49
| 0.0001
| 百度 摆渡 百渡
| 185,000
| 0.53 | 1,020
| 0.08 |
gengshangyicenlou
| d上一层楼
| - | - | - | - | 更上一层楼
| - | - | - | - |
Wangyezhizuojiaocheng
| 网页制作教程
| | | | | 网页制作教程 网业制作教程 网页制做教程
| | | | |
我们从上表可以发现,在搜索结果数量方面,Google仍然可以超过百度,在拼音与汉字的匹配程度方面,Google也可以基本使人满意,某些较长的词语匹配精确度不如百度,某些非固定词汇的匹配数量有时可以超过百度,如yitianruixin一词。
目前,我们虽然还不清楚Google是采用何种运算法则对汉语拼音进行匹配的,但是通过测试我们可以看出,较之前几年Google的中文搜索能力确实有了很大的进步?谝恍┏ぞ渌阉魃希?ヅ涞木?范然共蝗绫就林形乃阉饕?姘俣龋??angyezhizuojiaocheng,这可能是由于Google终归是国外的产物,对我国中文词汇的使用习惯的了解还是不如本土的中文搜索引擎,所以匹配精度相对较弱;但针对某些单词或单字的匹配可以说能够,如ren,与百度相媲?耍?颐遣孪胝饣蛐硎且览涤?oogle强大的数据库容量,能够给出多种匹配汉字,给予选择。在图片搜索上,百度仍然落后于Google。
2000年9月12日,Google 公司宣布推出简体及繁体两种中文的版本,开始进行中文搜索服务。这一天开始,Google就在中文搜索市场中投掷了?墩ǖ???泄?就了阉饕?婕懊呕??敬?戳艘怀”┓缬辍?BR>
2003年9月,Google推出中文版工具栏,可以外挂在IE浏览器上。2004年2月,Google宣布将其网络指数增加10亿个页面,目前搜索网页可达42.8亿个网页,图像搜索容量扩大到了8.8一个,总体增幅达到大约三分之一。同月,Google正式宣布,为了在快速成长的中文市场上赢得客户,推出AdWords广告服务中文版,使得中文用户可以利用简繁两种文体参与Google广告系统。这一举动充分显示出Google进军中文搜索领域的企图。为中文搜索引擎领域带来不小的振动。
据统计,目前国内搜索引擎市场的份额仅仅是5亿元,但是未来三年内将达到20亿。这样一块肥厚的大蛋糕相信不会只有Google注意到了。国内搜索引擎及门户如何才能促使自己在本土领域得到进一步发展,领先于国际搜索引擎,还需要深刻考虑。
种种迹象表明,Google进军国内搜索市场决心已定。我国本土搜索引擎虽然曾经以种种口号声称要抗击Google,但是抵挡外来“侵略”不是只用口水,最重要的还是要加强自己的技术。