搜索引擎系统是一个由许多模块组成的复杂系统,其核心模块通常包括爬虫、索引、检索和排序,主要根据用户需求对数据信息进行遍历,从互联网检索出制定信息,依据特定算法对返回结果二次排列,帮助用户及时获取有效的信息。搜索引擎的主要功能是高效准确地进行信息搜索,基本工作原理基本包括三个过程。
搜索引擎自1994年问世以来,经历了三个时期的发展。目前常用的搜索引擎工具有网络爬虫、索引建立、内容检索和链接分析等相关技术。主要搜索方式包括:以百度,谷歌为代表的全文搜索引擎;以360综合搜索为代表的元搜索引擎、以机票搜索为代表的垂直搜索引擎和以雅虎分类目搜索为代表的目录搜索引擎四种。
搜索方式 |
全文搜索引擎 |
元搜索引擎 |
垂直搜索引擎 |
目录搜索引擎 |
适用性 |
普适(主流) |
一般 |
专业内适用 |
网站内适用 |
代表引擎 |
百度,谷歌 |
360综合搜索 |
机票搜索 |
雅虎分类目搜索 |
速度 |
较慢 |
慢 |
较快 |
快 |
数据库容量 |
大而全 |
无 |
网页库 |
网站内数据 |
个性化程度 |
高 |
高 |
较低 |
低 |
信息抓取方式 |
全网抓取建立索引 |
整合其他引擎数据 |
定向分字段处理 |
人工处理 |
缺点 |
重复度高且内容繁杂 |
容易导致重复检索 |
检索范围小 |
人工成本较高 |
中国搜索引擎用户规模截止2020年3月达到75015万人,较2019年上半年增加了5545万人,搜索引擎使用率达83.0%。从市场份额来看,自谷歌退出中国后,国内搜索市场呈现一超(百度)一强(搜狗)的局面。一直以来,百度都占据着国内搜索引擎市场的首位,根据2019年2月-2020年3月搜索引擎市场份额数据分析,百度市场份额占比72.8%;其次为搜狗搜索,占比14.9%;然后是神马搜索,占比4.45%;360、谷歌和必应市场份额分别占比3.77%、2.04%、2.02%。
搜索引擎这个领域多年来都由百度独占鳌头,如今人们逐渐意识到,拥有好的内容才能打造好的搜索平台。大家所关心的,是腾讯、阿里和字节的布局与加入,能否打破传统格局,从而营造出一个更好的搜索环境。(LJ)
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。