网站蜘蛛访问统计

蜘蛛 Baiduspider 0 compatible 1 +http wwwbaiducom search spiderhtml 百度 编程进阶笔记
发布日期 2022-12-14 更新日期 2022-12-14 阅读次数 102 文章字数 2.5k

最简单的办法,就是User-Agent

百度UA举例:

如果UA信息不对,可以直接判断为非百度搜索的蜘蛛。目前UA分为移动、PC、和小程序三个应用场景,这三个渠道UA分别如下:

 

移动UA: 

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)


Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html) 

 

PC UA:

Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

 

小程序UA:

Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)

来源:【官方说法】只需两步,正确识别百度蜘蛛(User-Agent)_搜索学堂_百度搜索资源平台 (baidu.com)

统计代码示例:

<?php

//蜘蛛统计和拦截
if(isset($_SERVER['HTTP_USER_AGENT'])){
    $ua = $_SERVER['HTTP_USER_AGENT'];
    $spider = "";  //蜘蛛识别
    //百度移动蜘蛛
    if($ua=="Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)" || $ua=="Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)"){
        $spider = "Baiduspider";
        $spiderType = "pc";
        $spiderName = "百度小pc端";
    }
    //百度pc
    elseif($ua=="Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)" || $ua=="Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)"){
        $spider = "Baiduspider";
        $spiderType = "app";
        $spiderName = "百度app端";
    }
    //百度小程序ua
    elseif($ua=="Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)"){
        $spider = "Baiduspider";
        $spiderType = "mini";
        $spiderName = "百度小程序端";
    }
    //记录蜘蛛活动
    if($spider){
        DB::sql("insert into `#system_spider`(`spider`,`spider_type`,`time`,`url`,`name`) values('$spider','$spiderType',unix_timestamp(current_timestamp),:url,'$spiderName')",array("url"=>PAGE_URL))->update();
    }
}

显示今日蜘蛛统计信息

<?php

//检测今日蜘蛛抓取信息
        $day_time = strtotime(date("Y-m-d"));
        $spider = DB::sql("select `spider`,`spider_type`,`name`,count(*)'count' from `#system_spider` where `time`>$day_time group by `spider`,`spider_type`")->selectArrList();
        assign("spider",json_encode($spider,256));

其他蜘蛛:

bing蜘蛛ua文档

google蜘蛛ua文档

手动模拟,如curl:

curl http://huaz.52dixiaowo.com -H 'User-Agent:Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)'

文章作者: 朱丰华

文章链接: https://smart.52dixiaowo.com/blog/post-253.html

版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。

蜘蛛 Baiduspider 0 compatible 1 +http wwwbaiducom search spiderhtml 百度

发表评论

相关推荐
朱丰华   |   9个月前   |   php

php判断是否被iframe

247    评论    点赞
朱丰华   |   1年前   |   checkbox

checkbox默认传值问题

409    评论    点赞
朱丰华   |   1年前   |   请求 · 一个

ab测压命令,apache测压工具

196    评论    点赞
朱丰华   |   1年前   |   mysql · 变量 · sql

MySQL实现行号-自定义变量

123    评论    点赞
朱丰华   |   1年前   |   变量 · mysql · sql · 用户

MySQL用户自定义变量

111    评论    点赞
朱丰华   |   1年前   |   linux · 文件 · 行数

linux 取得文件行数

60    评论    点赞
朱丰华   |   1年前   |   文件 · linux · 修改

linux文件的三个时间atime,mtime,ctime分别表示什么?

292    评论    点赞
朱丰华   |   1年前   |   linux · 文件

linux递归统计文件夹大小、du命令_Linux du命令:查看文件夹和文件的磁盘占用情况

208    评论    点赞
朱丰华   |   1年前   |   js · export · import

js es6 export,import,export default的用法和区别

139    评论    点赞
朱丰华   |   1年前   |   c语言 · 编译

C语言中预编译#if的使用

87    评论    点赞
朱丰华   |   1年前   |   javascript · js · obfuscator · 混淆

javascript-obfuscator混淆js文件

60    评论    点赞
朱丰华   |   1年前   |   js · 模块 · nodejs

nodejs引入自定义模块

57    评论    点赞
朱丰华   |   1年前   |   nvm · git · 安装

entos7安装、使用nvm

84    评论    点赞
朱丰华   |   1年前   |   js · 滚动 · html

原生js实现顶部进度条效果

67    评论    点赞
朱丰华   |   1年前   |   python · linux · www

linux给www用户【非root】安装python3

212    评论    点赞
朱丰华   |   1年前   |   php · 引用 · 变量 · c语言

php扩展内存管理与引用计数

139    评论    点赞
朱丰华   |   1年前   |   zend · php

php zend内核取字符串长度sizeof,ZEND_STRS,ZEND_STRL

177    评论    点赞
朱丰华   |   1年前   |   php · api · 扩展 · 执行

php sapi生命周期

100    评论    点赞
朱丰华   |   1年前   |   sizeof · strlen

C语言里的sizeof()和strlen()关联和区别

125    评论    点赞
朱丰华   |   1年前   |   php · _server · 域名

php内核,取超全局变量$_SERVER,取域名例子

93    评论    点赞
{{item.author_name}}   |   {{new Date(item.date*1000).log()}}   |   {{it}} ·

{{item.title}}

{{item.uv}}    评论    点赞