13919049954

搜索引擎的工作流程

作者:金城在线 日期:2018/4/19 9:56:17 人气:313

整个搜索流程主要由搜集器、索引器、检索器和用户接口四个部分来完成。具体可分为以下三个步骤


1、搜集网页信息。搜集器不停的在互联网中漫游,不断发现和搜集网页信息。其工作模式是通过跟踪网页中的超链接,从己知的数据库出发不断延伸(俗称爬行)到互联网中其他网页。理论上来说,只要网页上有一定数量有效的外部链接,机器人就能抓取到该网页的内容。并且,机器人抓取网页内容的几率和频率与网页外部链接的数量和质量呈正相关。


2、建立索引数据库。这是搜索引擎对搜集来的网页信息进行处理的过程。搜索引擎首先会对一些无意义的网站或内容进行过滤,然后由索引器对有用信息进行“解读”并逐一进行标记和识别,最后再按照特定的规则进行编排并储存为结构化的数据,以此方式建立自己的数据库。并且,机器人程序还会定期的回访已搜集到的网页,通过这种形式来对己有的索引数据库进行更新。


3、反馈查询信息。当用户在搜索引擎的用户界面中输入关键词进行信息查找时,检索器便根据用户的查询条件在索引库中快速检索文档并进行相关度评价,然后对将要输出的结果进行排序,最后再通过用户接口返回符合用户查询需求的信息。目前,搜索引擎返回的信息主要是以网页链接形式提供给用户,不过通常会在这些链接下提供一段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。


            金城在线专注网站、软件、APP、微信公众平台、小程序、抖音、头条等开发推广,如果您有这方面的需求或者不同的观点,欢迎联系交流。

    官方微信

    本文网址:http://lz.net.cn/zixunzhongxin/873.html
    读完这篇文章后,您心情如何?
    • 0
    • 0
    • 0
    • 0
    • 0
    • 0
    • 0
    • 0
    更多>>网友评论
    发表评论