经过几年的发展和摸索,搜索引擎越来越贴近人们的需求,搜索引擎的技术也得到了很大的发展。
搜索引擎的最新技术发展包括以下几个方面:
(1)提高搜索引擎对用户检索提问的理解。为了提高搜索引擎对用户检索提问的理解必须有一个好的检索提问方式,为了克服关键词检索和目录查询的缺点,现在已经出现了自然语言智能答询。用户可以输入简单的疑问句,比如“How can kill virus of computer?搜索引擎在对提问进行结构和内容的分析之后,或直接给出提问的答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于:一是使网络交流更加人性化;二是使查询变得更加方便、直接、有效。现以上面的例子进行分析,如果用关键词查询,多半用户会采用“vius”这个词进行检索,结果中必然会包括各类病毒的介绍、病毒的产生等许多无效信息。而用“How can kill virus of computer?”,搜索引擎会将怎样杀病毒的信息提供给用户,提高了检索效率。
(2)对检索结果进行处理。对于检索结果的处理方法主要有以下几种:
①链接评价。基于链接评价的搜索引擎的优秀代表是 Google(htp:/ww.google m,它独创的“链接评价体系”是基于这样一种认识,即一个网页的重要性取决于它被他网页链接的数量,特别是一些已经被认定是“重要”的网页的链接数量。这种评价体制与科技引文索引的思路非常相似,但是由于互联网是在一个商业化的环境中发展起来的一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。
②访问大众性。基于访问大众性的搜索引擎的代表是 Direct Hit,它的基本理念是多数人选择访问的网站就是最重要的网站。该搜索引擎根据以往成千上万的网络用户在检索结果中实际所挑选并访问的网站和他们在这些网站上花费的时间来统计确定有关网站的重要性排名,并以此来确定最符合用户的检索要求的网站,因此具有典型的趋众性特点。这种评价体制与基于链接评价的搜索引擎有着同样的缺点
③去掉检索结果中附加的多余信息。有调查指出,过多的附加信息加重了用户的信息负担,为了去掉这些过多的附加信息,可以采用用户定制、内容过滤等检索技术。