程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Vite 6 深度解析:Rolldown 引擎替换 + Environment API,前端构建工具的终极进化
编程
Vite 6 深度解析:Rolldown 引擎替换 + Environment API,前端构建工具的终极进化
2026-05-11 07:55:02 +0800 CST
view 218
Vite6深度解析:Rolldown引擎替代Rollup让构建速度提升7-30倍,Environment API标准化client/server/edge多环境构建,详析迁移指南和实战性能数据
Vite6,Rolldown,EnvironmentAPI,前端构建,Rust打包器
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
编程
Agent-fox 深度解析:让AI用自然语言接管你的测试——从Selenium尸骸中诞生的下一代自动化测试框架
2026-05-17 01:50:10 +0800 CST
view 157
Agent-fox是一个基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图,支持自然语言测试、自动元素定位、自愈机制等核心功能。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM
Stanford CS336 深度实战:从零实现大语言模型——数据清洗、Transformer 架构、FlashAttention 系统优化到 RL 对齐的完全指南(2026)
编程
Stanford CS336 深度实战:从零实现大语言模型——数据清洗、Transformer 架构、FlashAttention 系统优化到 RL 对齐的完全指南(2026)
2026-06-02 20:14:38 +0800 CST
view 41
Stanford CS336 课程深度解读:从零实现大语言模型,覆盖 Tokenizer、Transformer、FlashAttention-2、FSDP 分布式训练、Scaling Law、Common Crawl 数据清洗去重、SFT 与 GRPO 对齐,配完整代码示例。
LLM
Transformer
Stanford CS336
FlashAttention
PyTorch
AI工程
分布式训练
强化学习
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
编程
Agent-fox深度解析:AI接管自动化测试的革命——ReAct模式下的自愈测试框架
2026-05-17 01:50:54 +0800 CST
view 181
Agent-fox是基于AI Agent的自动化测试框架,让测试从编写代码变成描述意图。核心特性包括:自然语言解析引擎(NL Parser)、多策略融合元素定位(Smart Locator)、数据准备智能体(Data Preparation Agent)和自愈恢复机制。
Agent-fox,AI测试,自动化测试,Selenium,Playwright,ReAct,LLM,测试框架
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
编程
Headroom 深度实战:让 LLM Token 消耗暴减 95% 的压缩引擎——从语义熵编码到 RAG 块优化的完全指南(2026)
2026-06-02 21:19:20 +0800 CST
view 108
Headroom 是专为 LLM 设计的通用压缩层,以 Library、Proxy、MCP Server 三种形态存在,在信息不丢失的前提下把 Token 消耗砍掉 60-95%。本文从信息论底层原理讲起,完整拆解四层压缩管线,结合真实代码实战演示接入方式。
LLM
Token优化
GitHub Trending
Python
RAG
当编译器成为自动驾驶的最后一块拼图:MLIR 如何让特斯拉 FSD 反应快 20%
编程
当编译器成为自动驾驶的最后一块拼图:MLIR 如何让特斯拉 FSD 反应快 20%
2026-04-11 12:56:32 +0800 CST
view 363
从特斯拉 FSD V14.3 的 MLIR 重写出发,系统讲解多级中间表示(MLIR)编译器框架的核心原理、方言系统、以及在自动驾驶 AI 推理中的应用。
MLIR
编译器
特斯拉
FSD
自动驾驶
LLVM
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
编程
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
2026-06-02 21:45:53 +0800 CST
view 50
Hermes WebUI 今日飙升 1725 星。本文深度拆解其架构设计、SSE流式传输机制、多模型路由策略、工具调用可视化实现,以及从本地部署到生产级优化的完整指南。
Hermes
WebUI
SSE
LLM
Agent
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
编程
Goose:Block 开源、Linux 基金会托管——本地 AI 编程代理的终极答案
2026-05-11 09:23:06 +0800 CST
view 252
Goose 是由 Block 开源、现已捐献给 Linux 基金会 AAIF 的本地 AI 编程代理。最新版本 v1.32.0(2026年5月6日)支持 Exa AI 搜索、桌面通知、@agent 协作、/skills 命令、自动压缩上下文、语音听写等功能。Rust 开发,支持 MCP 协议,可连接任何 LLM(OpenAI、Ollama、Kimi Code 等),完全本地运行无需订阅。
Goose
AI编程
本地LLM
MCP
Rust
Linux基金会
Block
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
编程
TradingAgents 深度实战:71.4K Star 的 AI 多智能体交易系统——从多 Agent 投研体系到生产级量化策略的完全指南(2026)
2026-06-02 22:14:57 +0800 CST
view 37
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表宝塔日志
代码
如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表宝塔日志
2024-11-19 09:55:50 +0800 CST
view 1663
本文介绍了如何编写一个Shell脚本来清空`log.db`数据库中的`logs`表。脚本使用`DELETEFROMlogs;`SQL语句删除所有记录,并提供了执行脚本的步骤和注意事项。强调了操作的不可逆性,并建议在执行前备份数据库文件。还提到可以使用`VACUUM;`来整理数据库空间。
数据库管理
Shell脚本
SQL操作
宝塔日志
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
编程
TriAttention深度解析:用三角函数革命性压缩KV Cache,让长推理从「显存地狱」中脱困
2026-05-17 04:14:18 +0800 CST
view 189
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 210
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
编程
TradingAgents 深度实战:7个LLM Agent复刻华尔街投研——从LangGraph多智能体架构到AI量化交易生产部署(2026完全指南)
2026-06-02 22:15:17 +0800 CST
view 33
TradingAgents 用7个专业LLM Agent完整复刻华尔街投研流程,GitHub 71.4K Star,本文从架构设计、Agent协作机制、LLM调度策略到生产级部署全面深度拆解。
AI交易
多智能体
量化交易
LLM
LangGraph
最全面的 `history` 命令指南
代码
最全面的 `history` 命令指南
2024-11-18 21:32:45 +0800 CST
view 1654
本文全面介绍了Linux和Unix系统中的`history`命令,包括其基本用法和高级选项。用户可以通过该命令查看、清空和管理命令历史记录,使用不同选项如`-c`、`-d`、`-w`等来操作历史记录。此外,文中还讨论了如何通过环境变量设置来优化历史记录的管理和使用。
Linux
Unix
命令行
Shell
技术
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
编程
【重制版】TriAttention深度解析:三角函数如何让长推理从显存地狱中脱困
2026-05-17 04:14:33 +0800 CST
view 171
深入解析MIT韩松团队提出的TriAttention方法,利用Pre-RoPE空间Q/K集中性和三角函数级数实现革命性的KV Cache压缩,在AIME25上以3072 KV budget达到与Full Attention持平的40.8%准确率,同时实现10.7倍KV显存压缩和2.5-6.3倍吞吐量提升。
LLM
KV Cache
TriAttention
MIT
英伟达
浙大
长推理
KV压缩
三角函数
RoPE
Attention优化
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
编程
Unsloth 深度实战:从 Triton 内核优化到 70% 显存压缩——2026 年 LLM 本地微调的工业级完全指南
2026-05-23 20:00:37 +0800 CST
view 98
深度剖析 Unsloth 如何通过手写 Triton 内核、智能显存管理和 LoRA/QLoRA 优化,实现训练速度 2-5 倍提升、显存占用降低 70% 的技术奇迹。
LLM
微调
Unsloth
LoRA
深度学习
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
编程
Microsoft MarkItDown 深度实战:把整个世界搬进 Markdown——从多格式解析引擎到 LLM 知识管道完全指南(2026)
2026-06-02 23:44:03 +0800 CST
view 56
Microsoft 开源的 MarkItDown 在 2026 年引爆 AI 工程圈。本文从源码级架构解析、多格式解析引擎、与 LLM 工具链的集成实战、性能优化到生产级 RAG 管道,全面拆解这款改变 AI 工程范式的工具。
Microsoft
MarkItDown
Markdown
LLM
RAG
Python
文档解析
AI工程
Rust 正在吃掉前端:Rolldown、Oxc 与 Vite 8 统一工具链的技术真相与行业启示
编程
Rust 正在吃掉前端:Rolldown、Oxc 与 Vite 8 统一工具链的技术真相与行业启示
2026-04-20 18:19:12 +0800 CST
view 341
深度解析 Rust 如何通过 Rolldown、Oxc 与 Vite 8 重塑 JavaScript 工具链格局,探讨 Rust 在前端领域渗透的深层逻辑与开发者行动建议。
Rust
Vite
Rolldown
Oxc
前端工具链
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 188
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
MarkItDown 深度解析:微软10万星开源工具如何重塑 LLM 时代的文档处理范式
编程
MarkItDown 深度解析:微软10万星开源工具如何重塑 LLM 时代的文档处理范式
2026-04-21 05:47:35 +0800 CST
view 342
深度解析微软开源工具MarkItDown:如何将PDF、Word、Excel等20+格式转换为结构化Markdown,为LLM和RAG场景提供高质量的文档预处理方案。涵盖架构设计、实战代码、性能优化与生产部署最佳实践。
MarkItDown
文档转换
LLM
RAG
Python
开源工具
微软
Zabbix 7.4 深度解析:嵌套低级别自动发现如何重新定义企业监控的自动化边界
编程
Zabbix 7.4 深度解析:嵌套低级别自动发现如何重新定义企业监控的自动化边界
2026-05-11 16:53:52 +0800 CST
view 193
Zabbix 7.4 引入嵌套低级别自动发现,彻底改变企业监控的自动化边界。本文深度解析嵌套LLD原理、发现原型机制、主机向导配置,并提供Kubernetes多层级监控的完整实战代码。
Zabbix
监控
运维
LLD
自动化
DevOps
TradingAgents 深度实战:从 78.7k Star 的多智能体交易框架到量化投研工程化完全指南
编程
TradingAgents 深度实战:从 78.7k Star 的多智能体交易框架到量化投研工程化完全指南
2026-05-24 06:38:48 +0800 CST
view 284
深度拆解 TradingAgents 多智能体交易框架的架构设计,从 LangGraph 状态图编排到结构化辩论机制,完整代码实战指南
AI Agent
量化交易
LangGraph
多智能体
LLM
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 589
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
编程
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
2026-05-11 20:48:39 +0800 CST
view 221
深度解析Llama 4 Scout/Maverick的MoE架构、128专家设计、1000万token超长上下文,附本地部署实战与许可证分析
Meta
Llama4
MoE
开源大模型
混合专家架构
Scout
Maverick
iRoPE
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
5
6
7
8
9
...
11
下一页