代码网站日志分析脚本

2024-11-19 03:48:35 +0800 CST views 888

网站日志分析脚本

该脚本用于分析网站日志，以统计独立访客数量和搜索引擎蜘蛛的访问次数。此工具有助于了解网站流量和搜索引擎爬虫的行为，从而优化网站的SEO表现。

使用说明

运行脚本时，用户可选择执行以下操作之一：

统计当前网站的独立访客数。
统计搜索引擎蜘蛛的爬取次数。

根据选择的操作，脚本会分析指定目录下的日志文件，并输出统计结果。

脚本代码

#!/bin/bash

# 定义日志目录
LOG_DIR="/www/wwwlogs"

# 定义输出文件，保存在当前运行目录
OUTPUT_FILE="$(pwd)/ip_count_summary.txt"

# 获取当前日期
TODAY=$(date +"%d/%b/%Y")

# 提示用户选择操作
echo "请选择要执行的操作："
echo "1. 统计当前网站独立访客数"
echo "2. 统计搜索引擎蜘蛛的爬取次数"
read -p "输入数字 1 或 2 并按回车: " OPTION

# 清空输出文件内容
> "$OUTPUT_FILE"

# 根据用户选择执行操作
if [ "$OPTION" == "1" ]; then
    echo "正在统计当前网站的独立访客数..."

    # 遍历日志目录中的每个 .log 文件
    for LOG_FILE in "$LOG_DIR"/*.log; do
        # 获取日志文件名（去除后缀）
        LOG_NAME=$(basename "$LOG_FILE" .log)
        
        # 统计当天独立IP的访问次数
        IP_COUNT=$(grep "$TODAY" "$LOG_FILE" | awk '{print $1}' | sort | uniq | wc -l)
        
        # 输出文件名和独立IP访问次数
        echo "$LOG_NAME, $IP_COUNT" >> "$OUTPUT_FILE"
    done

elif [ "$OPTION" == "2" ]; then
    echo "正在统计搜索引擎蜘蛛的爬取次数..."

    # 定义常见搜索引擎蜘蛛标识
    SPIDERS=("Baiduspider" "Googlebot" "YandexBot" "bingbot" "Sogou" "Slurp")

    # 遍历日志目录中的每个 .log 文件
    for LOG_FILE in "$LOG_DIR"/*.log; do
        # 获取日志文件名（去除后缀）
        LOG_NAME=$(basename "$LOG_FILE" .log)

        # 初始化蜘蛛爬取次数统计
        SPIDER_COUNT=0

        # 统计每个蜘蛛的访问次数
        for SPIDER in "${SPIDERS[@]}"; do
            COUNT=$(grep "$TODAY" "$LOG_FILE" | grep -i "$SPIDER" | wc -l)
            SPIDER_COUNT=$((SPIDER_COUNT + COUNT))
        done

        # 输出文件名和蜘蛛爬取次数
        echo "$LOG_NAME, $SPIDER_COUNT" >> "$OUTPUT_FILE"
    done

else
    echo "无效的选项，请输入数字 1 或 2."
    exit 1
fi

# 对结果进行排序并保存
sort -t, -k2,2nr "$OUTPUT_FILE" -o "$OUTPUT_FILE"

# 提示操作完成
echo "完成！结果已写入 $OUTPUT_FILE"

关键功能

独立访客统计：统计当天访问网站的独立IP数量，了解网站流量状况。
搜索引擎蜘蛛统计：监控主要搜索引擎的爬虫行为，优化网站SEO策略。

总结

此脚本是监控网站流量和搜索引擎爬取活动的重要工具，可帮助站长更好地分析网站表现，并根据数据优化SEO策略。运行后，结果将保存至当前目录下的 ip_count_summary.txt 文件中。

Tags: #网站日志 #SEO优化 #Bash脚本 #独立访客统计 #搜索引擎爬虫

复制全文生成海报网站日志 SEO优化 Bash脚本

推荐文章

MySQL用命令行复制表的方法

2024-11-17 05:03:46 +0800 CST

Pion是WebRTCAPI的纯Golang实现，提升了WebRTC应用开发效率

2024-11-19 08:26:56 +0800 CST

PHP内存管理终极指南：从引用计数到生产环境监控

2025-08-26 06:42:40 +0800 CST

在 Go 中如何使用 go:embed 指令嵌入静态文件

2024-11-18 21:47:02 +0800 CST

FastHTML是一个现代的Python网页应用程序框架，旨在简化网页开发，减少对JavaScript和CSS的依赖

2024-11-18 16:30:23 +0800 CST

黑客帝国代码雨效果

2024-11-19 01:49:31 +0800 CST

使用Vue3和axios库构建一个简单的电影信息展示应用。通过创建Vue项目、安装axios、编写电影展示组件，并从第三方API获取数据

2024-11-17 07:08:17 +0800 CST

Tweepy是一个强大的Python库，简化了与TwitterAPI的交互

2024-11-19 00:09:42 +0800 CST

Mayfly-Go：轻量级分布式任务调度与管理平台

2024-11-18 02:19:47 +0800 CST

前端中的 File 和 Blob 两个对象到底有什么不同

2024-11-18 14:50:11 +0800 CST

在 Linux 上安装 Go 开发环境的步骤

2024-11-18 09:58:51 +0800 CST

python-bloomfilter：一个布隆过滤器的库！

2024-11-19 06:20:14 +0800 CST

深入理解 JavaScript 中的异步编程技巧

2024-11-19 08:45:26 +0800 CST

16.6k+ 开源精准 IP 地址库

2024-11-17 23:14:40 +0800 CST

前端文件上传全攻略：从表单提交到分片上传

2025-08-16 09:29:45 +0800 CST

`asyncservo`用于Python的异步编程工具

2024-11-19 03:53:19 +0800 CST

一些实用的前端开发工具网站

2024-11-18 14:30:55 +0800 CST

H5抖音商城小黄车购物系统

2024-11-19 08:04:29 +0800 CST

Nginx 上传和超时时间限制（包括 PHP 上传限制）

2024-11-18 20:37:17 +0800 CST

Vue3中的虚拟滚动有哪些改进？

2024-11-18 23:58:18 +0800 CST

什么是 Vue 的服务端渲染（SSR）？它与客户端渲染的区别是什么？

2024-11-18 09:40:45 +0800 CST

axios 源码解析：十分钟带你实现一个 mini-axios

2024-11-18 22:27:47 +0800 CST

Python中的模块导入机制，重点分析了`sys.path`和`importlib`的使用

2024-11-19 07:12:56 +0800 CST

Shadcn UI：这个 82.7k Star 的神器，正在超越传统组件库！

2025-06-28 17:04:58 +0800 CST

Thinc是一个轻量级的Python机器学习库，专为自然语言处理设计，简化模型的创建、训练和部署

2024-11-18 13:18:03 +0800 CST

php微信文章推广管理系统

2024-11-19 00:50:36 +0800 CST

这个开源的AI证件照项目又火了！有人靠它日入300+

2024-11-19 09:20:16 +0800 CST

如何在Vue3中使用本地存储localStorage保存数据？

2024-11-19 08:11:16 +0800 CST

Gin 与 Layui 分页 HTML 生成工具

2024-11-19 09:20:21 +0800 CST

如何在Vue中使用watch功能监听数据的变化

2024-11-17 04:27:37 +0800 CST

PHP使用无头浏览器如何帮助数据提取和抓取

2024-11-19 00:20:57 +0800 CST

vue中使用rsa加密和数字签名和后端如php进行加密交互

2024-11-19 02:17:27 +0800 CST

lxml是一个功能强大且灵活的Python库，专为高效解析和操作XML/HTML文档而设计

2024-11-18 21:30:07 +0800 CST

Rust 并发执行异步操作

2024-11-19 08:16:42 +0800 CST

设置mysql支持emoji表情

2024-11-17 04:59:45 +0800 CST

Linux系统软件源更换脚本使用指南

2025-07-07 19:07:03 +0800 CST

前端动画神器 Uiverse.io：复制粘贴即可为所欲为！

2025-07-07 17:55:15 +0800 CST

Go配置镜像源代理

2024-11-19 09:10:35 +0800 CST

介绍Vue3的静态提升是什么？

2024-11-18 10:25:10 +0800 CST

2024-11-19 02:17:12 +0800 CST

Python HTTP服务器：最强工具，让你轻松搭建本地服务器！

2024-11-18 22:22:29 +0800 CST

js只保留整数，向上取整，四舍五入，向下取整等函数

2024-11-18 20:47:21 +0800 CST

每个开发人员都应该知道的 10 个 HTML 技巧

2024-11-18 15:27:51 +0800 CST

三种常用的行为设计模式：策略模式、观察者模式和命令模式

2024-11-19 05:17:20 +0800 CST

聚合支付管理系统

2025-07-23 13:33:30 +0800 CST

在Vue中，你有使用过的单文件组件吗？

2024-11-17 04:30:45 +0800 CST

前端如何一次性渲染十万条数据?

2024-11-19 05:08:27 +0800 CST

全栈利器 H3 框架来了！

2025-07-07 17:48:01 +0800 CST

Remotion是一个基于React的框架，允许前端工程师以编程方式创建高质量视频

2024-11-19 03:46:15 +0800 CST

Vue 3创建一个简单的文件上传组件，并处理上传的文件

2024-11-19 04:09:17 +0800 CST