<button id="g80sy"></button>
  • <abbr id="g80sy"></abbr>
  • <button id="g80sy"></button>
    <rt id="g80sy"><delect id="g80sy"></delect></rt>
  • thinkphp6如何記錄百度等蜘蛛的爬取日志

    程序猿 2021-03-17 20:08:08 2257瀏覽 加載中

    thinkphp6記錄百度蜘蛛日志。在控制器的父類如IndexBase中寫入以下代碼,所有前端控制器繼承這個控制器

      public function initialize()
        {
    
            parent::initialize(); // TODO: Change the autogenerated stub
    
            if ($this->Config['web_status'] == 0) {  // 判斷是否關(guān)閉網(wǎng)站
                die('網(wǎng)站已經(jīng)關(guān)閉');
            }
    
            $this->baiduLog();
        }
    
        protected function baiduLog()
        {
            $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
            $url = $this->request->controller() . "/" . $this->request->action();
            $param = input("param.","","htmlspecialchars");
            $url = (string) url($url,$param);
            $ip = get_real_ip();
            $title = "";
            if (strpos($useragent, 'googlebot') !== false){
                $title =  'Google';
            } elseif (strpos($useragent, 'baiduspider') !== false){
                $title =  'Baidu';
            } elseif (strpos($useragent, 'msnbot') !== false){
                $title =  'Bing';
            } elseif (strpos($useragent, 'slurp') !== false){
                $title =  'Yahoo';
            } elseif (strpos($useragent, 'sosospider') !== false){
                $title =  'Soso';
            } elseif (strpos($useragent, 'sogou spider') !== false){
                $title =  'Sogou';
            } elseif (strpos($useragent, 'yodaobot') !== false){
                $title =  'Yodao';
            } elseif (strpos($useragent, 'googlebot') !== false){
                $title =  'Google';
            } elseif (strpos($useragent, 'baiduspider') !== false){
                $title =  'Baidu';
            } else {
    //            $title = $useragent; // 不怕數(shù)據(jù)大的話可以取消注釋,記錄所有訪問日志
            }
            if (!empty($title)) {
                BaiduLog::create(["title"=>$title,"href"=>$url,"ip"=>$ip]);
            }
        }

    以上就是thinkphp6記錄百度蜘蛛爬行日志的方法,

    get_real_ip()

    是獲取客戶真實IP的自定義函數(shù),可以在本站搜索找到。

    標(biāo)簽: thinkphp6
    最后修改:2025-07-03 12:09:02

    非特殊說明,本博所有文章均為博主原創(chuàng)。

    主站蜘蛛池模板: 琼结县| 白朗县| 会宁县| 鸡东县| 汶川县| 蓝田县| 拉孜县| 溧水县| 肥东县| 朝阳市| 凉山| 台东市| 灵宝市| 双鸭山市| 南宫市| 丹巴县| 读书| 喀喇沁旗| 龙川县| 西安市| 九江市| 栖霞市| 渭源县| 江川县| 屯门区| 隆子县| 泗阳县| 永嘉县| 商南县| 四川省| 徐水县| 镇平县| 股票| 肇东市| 宁波市| 中江县| 新野县| 米林县| 东平县| 文化| 拉孜县|