天枫庄资源网 Design By www.wosibo.com
目的是探测一下百度的中文分词匹配技术,百度对于搜索结果采用的是“与”逻辑,而且这个”与”逻辑在排名中应该有很高分值,由于是实验,为了加快收录,以取得更快的实验结果,我们对测试的三个页面加了些随机的文章,跟标题无关,外链方面都是均等的,都只有我这一个外链给它们,为了不影响标题的关键词匹配!同时也印证一下李彦宏所说的话。

以下为引用的内容:

记者:为什么对同一词条,百度与其他搜索引擎出来的结果不一样呢?
李彦宏:比如,在百度,检索词越长,用户找到的检索数目就越少。因为,我们认为用户检索的所有词语都应该出现,这样才能确保检索的精确性。但在谷歌或西方的搜索引擎,检索词越长,检索到的信息就越多。它们认为,与检索词中任一词语相关的信息都应该出现。换句话说,百度采用的是“与”逻辑,而谷歌或西方的搜索引擎采用的则是“或”逻辑。对用户来说,检索结果数量的多少并没有太大价值,最关键的是,他想要找的东西找到没有。

实验的第一个页面标题:李彦宏为什么吃饭?

实验的第二个页面标题:李彦宏为什么吃饭还要拿筷子?

实验的第三个页面标题:李彦宏为什么还要拿筷子吃饭?

实现前搜索结果:

SEO 百度的中文分词匹配技术

测试一小时后就收录了,当然结果也出来了。

试验后结果图片:

SEO 百度的中文分词匹配技术
李彦宏为什么吃饭还要拿筷子

SEO 百度的中文分词匹配技术
李彦宏为什么吃饭还要

SEO 百度的中文分词匹配技术
李彦宏为什么吃饭

SEO 百度的中文分词匹配技术
李彦宏吃饭

SEO 百度的中文分词匹配技术

SEO 百度的中文分词匹配技术

从试验后图片1中的结果可以看出,百度对完全匹配的检索词给予很高的分值,即使检索词的排序不同,只要这些词全部包含在页面中,都是可以加分的,这同样也能解析关键词堆砌对百度有用,而对google无用,了解了这些,也对大家做长尾关键词有个很好指导,而从以上四张图片中也验证了李彦宏所说的话:检索词越长,检索到的结果越少。大家有兴趣的自己可以再对比下google的结果,这就不难解析,为什么搜索一些词google的结果会多些了,两者的差异:百度采用的是“与”逻辑,而谷歌或西方的搜索引擎采用的则是“或”逻辑。

此实验并未考虑排名的其它因素(比如外链,网站权重,检索词出现的次数等),所以排名只能横向对比,就是看我的三个实验页面的结果进行对比。(现在大家应该知道李彦宏吃饭为什么用筷子了吧!)以上只是个人看法,也非常欢迎大家有不同的看法一起交流。

原文链接地址: http://www.1860z.com/1109.html  作者:叶松

标签:
SEO,百度,中文分词

天枫庄资源网 Design By www.wosibo.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
天枫庄资源网 Design By www.wosibo.com

评论“SEO 百度的中文分词匹配技术”

暂无SEO 百度的中文分词匹配技术的评论...

稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!

昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。

这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。

而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?