绝想首页

分词技术

forgeter [感悟] 2010-10-23 08:47:33 星期六 查看:2287 回复:0 发消息给作者

    什么是分词技术?分词技术是搜索引擎针Google左侧排名对用户提交查询的关键串进行的查询处理后,根据用户的关键词串用各种匹配方法进行的一种技术。分词技术最早研究发明的是谷歌关键词优化,也是最成熟的技术,中文分词技术大家都很清楚的。虽然谷歌是分词技术的创始者,但在中文比之英文要复杂得多,有多种语义,所以中文分词技术这方面是百度领先。

  中文分词有三种方法:1.字符串匹配的分词法 2.词义分词法 3.统计分词法。在这里就不详细介绍了,实例为主。我们以“中文分词技术”为例,假设它是网页的关键词,如何对它进行分词来使我们的网页排名更靠前,让更多人搜索到。百度分词:字符串匹配的分词是“中文分词技术”,词义分词是“中文分词”、“分词技术”,统计分词是“中文”、“分词”、“技术”。一个词百度可以分这么多个,而我们要提取对网站有用的词语,百度也会根据词语的匹配、词义的匹配、词语出现的频率,决定根据那些词语捕捉网页。

  在百度输入“中文分词技术”,排在第一页上的都是“中文分词技术”为标题的网页,除了第一位网站,是“中文分词”为标题。可能有人会觉得奇怪,其实不然在标题意思相近,文章的被关注率,网站主题,网站的外链及权重就决定了它的排名,当然这不是我们现在探讨的。我们从环保灶搜索结果可以看到,红色的字体大都为“中文分词技术”,说明在网站条件相当的情况下,先显示标题匹配的网页。然后在往后看,用百度快照查看网页,你会发现,“中文分词技术”、“中文分词”、“中文”字体为黄色,“分词技术”、“分词”为蓝色,“技术”为绿色。百度分别给它们的权重是黄色>蓝色>绿色,这样我们就知道如何选取关键词了。优先选择“中文分词技术”、“中文分词”(“中文”这个词就不用考虑了,跟我们的文章主题不符),然后再选择“分词技术”,虽然“分词技术”权重稍低,但符合我们文章主题。

  通过分词技术,结合文章主题与网民的搜索习惯,我们可以为自己集成环保灶网站确定关键词,其实这也是seo的由来。分词技术是搜索引擎的核心技术之一,如果你在这方面有研究的话,在提上网站排名方面,就能如鱼得水了。

 这里想跟大家简单介绍全文搜索引擎,它是我们日常接触最多的,也是我们最常用的,国外具有代表性的全文搜索引擎有GoogleTeoma等,在国内的代表自然就是大家熟知的百度了。它们都是从网站提取信息建立网页数据库,拥有自己的检索程序,这被大家称为“蜘蛛”(Spider)

  二:搜索引擎的工作原理

  1、从互联网上收集网页信息

  刚刚已经说它本身有自己的Spider系统,会沿着自己的网页URL链接到其他的网页,并重复这个过程,把链接到的网页搜集过来。比如www.juexiang.com当您把这个网页发布上去并提交自己的网站,那么搜索引擎就会利用Spider程序检索到这个网站,然后收录到自己的数据库里面。

  2、建立网页索引数据库

  对所搜集回来的网页进行一个系统的分析,便于用户的检索。还是拿亮金的网站举例,搜索引擎会提取亮金的网址,编码、以及关键词“环保灶、集成环保灶、外贸网站推广”等,并提取它们之间的位置、发布时间等,这些便是搜索引擎数据库里面的信息

  3、在索引数据库中搜索排序

  排序这应该是大家比较关心的问题,当我们在做搜索引擎营销的的时候,争取排序靠前这是不可避免的,这跟关键词SEO网站的定位有很大的关系,所有的网站信息会根据这个关键词的相关度进行显示,相关度越高,排名就会越靠前。

  4、组织返回搜索结果

  第四点简单的说就是检索的信息结果反馈。

  三、搜索引擎优化的联想

有一个词语想必是大家并不陌生的就是搜索引擎营销,搜索引擎的营销点来自于网络营销的策划,它已经成为网络营销的主要手段,对于网站推广、网络品牌建设、产品SEO服务推广等都取得很好的成效。例如我们自己的一个关键词“东莞网络营销”就做的很好,在百度搜索引擎的排序是第2

顶一下(97 写日记 476717 136006
分享排行

 

 

留住已经逝去的峥嵘岁月 记住曾经绽现的万种风情 在记忆即将淡漠的时候 来把这些重新回味

Copyright (C) 2008-2014 www.juexiang.com, All Rights Reserved.

京ICP备2023001011号-3   京公网安备11010802011908号

客服QQ 1017160561 违法和不良信息举报电话 13148464312 邮箱 1017160561@qq.com