暂无介绍
网络爬虫是一个相对简单的自动化程序或脚本,它系统地扫描或“爬行”互联网页面,以创建它正在寻找的数据索引;这些程序通常只使用一次,但也可以编程长期使用。该程序有多种用途,也许最流行的是搜索引擎,它们使用它为网络冲浪者提供相关网站。其他用户包括语言学家和市场研究人员,或者任何试图以有组织的方式从互联网上搜索信息的人。网络爬虫的可选名称包括网络蜘蛛、网络机器人、机器人、爬虫和自动索引器。爬虫程序可以在互...