爬虫:crawler
爬虫(crawler)是一个访问网站并且读取网站的页面和其它信息,以创建搜索引擎索引的程序。互联网上主要的搜索引擎都有这些程序,它们也被称作“蜘蛛”或“机器人”。爬虫程序访问向它们提交的网站主的网站,或者是新加网站,或者是更新网站。整个网站或者特殊的页面能够被选择性的访问和索引。爬虫的名字就来源于它们在某时爬过整个网站,跟踪连接到网站的其它页面,指导所有页面都被读取。 AltaVista搜索引擎的爬虫和它的网站被称作Scooter(滑行车),滑行车遵循在机器人排除标准(Standard for Robot Exclusion,SRE)定义的网络爬虫礼貌规则,它会高速所有的服务器,哪个文件将被排斥在索引之外,它不通过(或者不能通过)防火墙。它使用特殊的算法在成功的服务器请求之间等待,不会对其它用户的访问造成影响。
最近更新时间:2008-10-14 EN
相关推荐
-
HPE添加Morpheus Data到KVM虚拟机管理程序中
慧与HPE的虚拟机管理程序平台现在可用于混合云管理工具。 该供应商现在将Morpheus Data的软件和技术 […]
-
比较CompTIA Cloud+ 与 Cloud Essentials+ 认证
现在,云认证就像天上的云朵一样普遍。很多供应商采取独特的方法以使他们的认证计划脱颖而出。而其中有一家供应商,C […]
-
云网络工程师是做什么的?
企业需要经验丰富的员工来连接不同的IT环境,并部署混合和多云部署。这一要求使云网络工程师的工作变得很有吸引力。 […]
-
5种云设计模式以创建弹性应用程序
对任何应用程序来说,快速增长有利有弊。快速增长可增加收入,但也带来技术挑战。为了缓解这些挑战,开发人员应该考虑 […]