蜘蛛统计是什么
的有关信息介绍如下:网络蜘蛛也称搜索引擎蜘蛛,英文单词是Web Spider,如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛,当网页上存在链接,蜘蛛就会通过这些链接地址寻找网页,一直循环直到你的网站所有页面被抓取完。
搜索引擎要抓取互联网上的所有网页是不大可能的,一方面原因是抓取技术上的瓶颈,另一方面是存储技术和处理技术的问题,所以蜘蛛一般只抓取比较重要的网页,而评价网页重要性主要是依据网页的链接深度。通常网络蜘蛛在抓取网页的时候会发送一个请求,这个请求中就有一个字段为User -agent,用于标识网络蜘蛛的身份,例如Google网络蜘蛛的标识为GoogleBot,Baidu网络蜘蛛的标识为BaiDuSpider,Yahoo网络蜘蛛的标识为Inktomi Slurp,在网站上的访问日志记录可以看出哪些搜索引擎的网络蜘蛛来过,及读了多少数据等。
网络蜘蛛呢?网络蜘蛛即Web Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从 网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网 站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。