程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Headroom 深度实战:AI Agent 的上下文压缩革命——60%~95% Token 节省背后的架构原理与生产级实战
编程
Headroom 深度实战:AI Agent 的上下文压缩革命——60%~95% Token 节省背后的架构原理与生产级实战
2026-06-28 10:14:20 +0800 CST
view 18
深度解析 GitHub Trending 项目 Headroom:AI Agent 上下文压缩引擎的架构原理、6 种算法、60-95% Token 节省实战,涵盖 Rust 高性能核心、CCR 可逆压缩、MCP 服务器与生产级部署指南。
Headroom
AI Agent
上下文压缩
Token优化
Claude Code
Cursor
AI编程
Rust
Python
MCP
RAG
LLMOps
6G通感算智融合架构深度解析:当通信基站进化为「超级智能体」——从协议栈到底层原理的完全指南(2026)
编程
6G通感算智融合架构深度解析:当通信基站进化为「超级智能体」——从协议栈到底层原理的完全指南(2026)
2026-06-09 19:51:27 +0800 CST
view 248
深度解析6G通感算智融合架构:太赫兹通信、通感一体化ISAC、天地一体组网、算力网络协同。含代码示例和架构分析。
6G
通信技术
通感算智融合
ISAC
太赫兹
天地一体
边缘计算
网络架构
低轨卫星
MIMO
4万Star的AI Agent底层框架pi-mono:OpenClaw的发动机,用4个工具做到了极致
编程
4万Star的AI Agent底层框架pi-mono:OpenClaw的发动机,用4个工具做到了极致
2026-04-27 21:05:47 +0800 CST
view 724
pi-mono是一个4万Star的TypeScript单仓项目,专门用来构建AI Agent和管理LLM部署。OpenClaw的核心运行时就是基于Pi的SDK构建的。核心只有4个工具,系统提示词不到1000个token,通过7个独立npm包实现模块化架构。
Agent框架
开源项目
AI编程
GitHub
pi-mono
当 AI 编程遇上 Context-Mode:上下文管理范式的降维打击
编程
当 AI 编程遇上 Context-Mode:上下文管理范式的降维打击
2026-06-09 22:20:29 +0800 CST
view 209
登顶GitHub Trending的Context-Mode如何让AI编程成本降低98%?系统拆解上下文外置隔离、语义智能检索、计算逻辑外移、输出范式精简四大核心降本技术,附生产级落地指南。
AI编程
Context-Mode
MCP
上下文管理
Token优化
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
编程
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
2026-04-28 08:19:25 +0800 CST
view 483
深度解析 DeepSeek V4:混合注意力机制、MoE 架构、100万token 上下文、Agent 能力,从技术原理到部署实战,全面剖析开源模型新天花板
DeepSeek
AI大模型
开源
长上下文
MoE
混合注意力
Agent
智谱 slime 深度实战:当 RL 后训练终于有了工业级「炼丹炉」——从 Megatron+SGLang 三模块联调到 GLM-5.2 两天完成 OPD 后训练的生产级完全指南(2026)
编程
智谱 slime 深度实战:当 RL 后训练终于有了工业级「炼丹炉」——从 Megatron+SGLang 三模块联调到 GLM-5.2 两天完成 OPD 后训练的生产级完全指南(2026)
2026-06-23 07:54:24 +0800 CST
view 98
2026年6月智谱开源RL后训练框架slime,支撑GLM-5.2仅用2天完成OPD后训练。本文深度解析其三模块架构、原生引擎透传设计、PD分离、增量权重同步等核心技术,附完整生产级部署实战代码。
强化学习
RL训练
slime框架
智谱AI
GLM-5.2
Megatron
SGLang
后训练
开源框架
生产级部署
TimesFM 深度解析:Google Research 的时序预测基础模型,如何让预测速度提升 5 倍
编程
TimesFM 深度解析:Google Research 的时序预测基础模型,如何让预测速度提升 5 倍
2026-05-14 00:45:45 +0800 CST
view 338
TimesFM是Google Research开源的时序预测基础模型,支持Zero-Shot推理,预测速度比LSTM快15倍。本文深度解析其Decoder-Only Transformer架构、Next Patch Prediction预训练目标、代码实战及性能优化技巧。
TimesFM
Google
时序预测
基础模型
Transformer
.NET 11 Preview 4 深度解析:Runtime-Async 全面启用、MCP Server 内置 SDK、Process API 一行搞定——微软最务实的一次预览版升级
编程
.NET 11 Preview 4 深度解析:Runtime-Async 全面启用、MCP Server 内置 SDK、Process API 一行搞定——微软最务实的一次预览版升级
2026-05-15 20:19:03 +0800 CST
view 341
2026年5月12日微软发布 .NET 11 Preview 4,全方位深度解析:Runtime-Async 底层革命、MCP Server 一行命令内置 SDK、Process API 从8行变1行、Blazor Virtualize 修复、Web Worker 升级、MAUI dotnet watch 重获新生。程序员视角的实战指南。
.NET 11
C#
Runtime-Async
MCP
Blazor
dotnet
ASP.NET Core
Entity Framework Core
Agent Lightning 深度解析:微软如何用零代码改造让 AI Agent 实现自我进化
编程
Agent Lightning 深度解析:微软如何用零代码改造让 AI Agent 实现自我进化
2026-04-18 15:12:54 +0800 CST
view 499
深入剖析微软开源项目 Agent Lightning 的技术架构,详解零代码接入、多框架兼容、强化学习训练等核心特性
AI Agent
强化学习
LangChain
AutoGen
微软
开源
Agent Lightning 深度解析:零代码如何让任何框架的 AI Agent 实现自我进化
编程
Agent Lightning 深度解析:零代码如何让任何框架的 AI Agent 实现自我进化
2026-04-18 15:13:12 +0800 CST
view 439
深入剖析微软开源项目 Agent Lightning 的技术架构,详解零代码接入、多框架兼容、强化学习训练等核心特性
AI Agent
强化学习
LangChain
AutoGen
微软
开源
Kimi K2.6 开源深度测评:国产模型首次登顶全球代码榜首,开发者必须知道的那些事
编程
Kimi K2.6 开源深度测评:国产模型首次登顶全球代码榜首,开发者必须知道的那些事
2026-04-28 15:51:45 +0800 CST
view 867
2026年4月20日月之暗面发布Kimi K2.6,在SWE-Bench Pro拿下58.6分首次超越GPT-5.4和Claude Opus 4.6。本文从技术架构、代码实测、API集成、性能优化、工具链集成等维度进行深度测评。
AI大模型
代码工具
Kimi
月之暗面
开源模型
SWE-Bench
开发者工具
代码审查
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
编程
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
2026-06-16 06:47:47 +0800 CST
view 205
MusaCoder是首个基于国产GPU完成全链路训练的代码大模型,在KernelBench上超越Claude Opus 4.7。从三阶段数据合成、多样性RFT到执行反馈RL,深度解析全栈训练方法论。
MusaCoder
GPU Kernel
摩尔线程
国产GPU
CUDA
MUSA
大模型
强化学习
KernelBench
代码大模型
AI Coding
深度学习
SwanLab 深度实战:当国产开源 AI 训练跟踪工具遇见 W&B 替代方案——从 PyTorch 全链路监控到私有化部署、从硬件感知到多框架集成的生产级完全指南(2026)
编程
SwanLab 深度实战:当国产开源 AI 训练跟踪工具遇见 W&B 替代方案——从 PyTorch 全链路监控到私有化部署、从硬件感知到多框架集成的生产级完全指南(2026)
2026-06-21 18:24:22 +0800 CST
view 106
深度解析 SwanLab——国产开源 AI 训练跟踪工具,对标 W&B 和 MLflow。涵盖架构设计、PyTorch/Transformers/LLaMA Factory 集成、硬件全链路监控、实验对比、私有化部署(Docker/K8s)、SDK v0.8.0 性能优化等内容。
SwanLab
AI训练
PyTorch
W&B替代
MLflow
实验跟踪
硬件监控
私有化部署
浏览器自动化的终极解法:CloakBrowser 如何用 58 处 C++ 补丁让所有反机器人系统失效
编程
浏览器自动化的终极解法:CloakBrowser 如何用 58 处 C++ 补丁让所有反机器人系统失效
2026-06-21 19:31:21 +0800 CST
view 90
CloakBrowser 通过在 Chromium C++ 源码层打入 58 处补丁,从 GPU 渲染、WebGL 指纹、Canvas 声纹到网络时序特征实现真正的浏览器隐身。无需 JS 注入,直接替换 Playwright/Puppeteer 的 import,三行代码迁移,30/30 检测站点全部通过。
CloakBrowser
Chromium
反爬虫
浏览器自动化
Playwright
Puppeteer
Little Snitch for Linux 开源深度解析:当 macOS 传奇防火墙「杀入」Linux 生态
编程
Little Snitch for Linux 开源深度解析:当 macOS 传奇防火墙「杀入」Linux 生态
2026-04-10 00:25:47 +0800 CST
view 560
2026年4月8日Objective Development开源Little Snitch for Linux的eBPF核心代码。本文从源码出发,深度拆解其架构设计、过滤引擎算法、eBPF内核空间实现与用户态程序。
Linux
eBPF
网络安全
Rust
Firewall
Little Snitch
Archon深度解析:如何用YAML工作流让AI编码从玄学变成工程
编程
Archon深度解析:如何用YAML工作流让AI编码从玄学变成工程
2026-04-19 03:46:36 +0800 CST
view 541
Archon是首个开源AI编码工作流引擎,通过YAML定义开发流程,实现确定性AI编码。本文深入剖析其架构设计、DAG调度、Git Worktree隔离机制,并提供实战案例。
AI编码
工作流
开源项目
Archon
软件工程
DuckLake v1.0 深度解析:DuckDB 团队如何用关系型数据库颠覆数据湖架构——926 倍性能背后的湖仓一体新范式
编程
DuckLake v1.0 深度解析:DuckDB 团队如何用关系型数据库颠覆数据湖架构——926 倍性能背后的湖仓一体新范式
2026-05-09 13:14:28 +0800 CST
view 758
DuckDB 团队于 2026 年 4 月 13 日发布 DuckLake v1.0——一种用关系型数据库存储元数据的湖仓一体新范式。官方基准显示查询速度比 Iceberg 快 926 倍,数据摄取快 105 倍。本文深入解析其架构原理、数据内联机制、性能差异根因及实战代码。
DuckDB,DuckLake,数据湖,湖仓一体,Apache Iceberg,Delta Lake,Parquet,OLAP
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
编程
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
2026-06-10 22:16:42 +0800 CST
view 417
Headroom上下文压缩中间层实战:Token节省60-95%,精度保留97%。从原理拆解到LangChain/OpenClaw生产级集成,附完整代码示例。
AI Agent
上下文压缩
Token优化
Headroom
LLM成本
LangChain
RAG
生产级实战
RAG 2026 生产级工程化完全指南:从朴素检索到 Agentic RAG 的架构演进与性能优化实战
编程
RAG 2026 生产级工程化完全指南:从朴素检索到 Agentic RAG 的架构演进与性能优化实战
2026-05-23 03:16:51 +0800 CST
view 284
2026 年最新 RAG 生产级工程化完全指南,从 Naive RAG 到 Agentic RAG 的架构演进,11 个性能优化策略,准确率从 60% 到 94%。
RAG
检索增强生成
生产级工程化
LangChain
Agentic RAG
TinyGrad 深度解析:31K Star 的极简深度学习框架,为什么"小而可Hack"才是未来
编程
TinyGrad 深度解析:31K Star 的极简深度学习框架,为什么"小而可Hack"才是未来
2026-04-29 15:53:15 +0800 CST
view 400
深入剖析31K Star的TinyGrad框架:极简架构设计、IR编译器原理、延迟求值机制,以及为什么"小而可Hack"可能是深度学习框架的终极答案。
TinyGrad
深度学习
PyTorch
开源框架
AI
编程
apache自带的ab(http)与abs(https)压测工具用法详解
2024-11-19 01:53:49 +0800 CST
view 8402
本文详细介绍了Apache自带的ab(http)和abs(https)压测工具的使用方法,包括吞吐率、并发连接数、用户请求等待时间等基本概念。通过示例代码展示如何使用ab工具进行压力测试,并提供了测试结果的分析,包括请求数、响应时间等关键指标。最后,比较了Windows和Linux环境下的测试结果,指出了服务器性能的优化方向。
性能测试
网络工具
Apache
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
编程
LiteRT-LM:Google端侧大模型推理引擎的革命性架构——从TensorFlow Lite的困境到LLM原生推理的全链路解析
2026-04-19 22:17:39 +0800 CST
view 705
深入解析Google LiteRT-LM端侧LLM推理引擎的核心架构:分层内存池、KV Cache量化、算子融合、WebGPU运行时。与TensorFlow Lite、llama.cpp、MLX横向对比,提供生产级部署实战指南。
Google
端侧AI
LiteRT-LM
WebGPU
量化
KV Cache
TensorFlow Lite
LLM推理
向量数据库深度实战:PGVector vs Qdrant vs Milvus vs Chroma——从嵌入式到分布式的生产级完全指南(2026)
编程
向量数据库深度实战:PGVector vs Qdrant vs Milvus vs Chroma——从嵌入式到分布式的生产级完全指南(2026)
2026-06-16 22:52:56 +0800 CST
view 261
深度对比 PGVector、Qdrant、Milvus、Chroma 四大向量数据库,从内核架构、索引算法、性能基准到生产实战,附 15 个完整代码示例,帮你做出不后悔的技术选型。
向量数据库
Qdrant
Milvus
PGVector
Chroma
RAG
AI基础设施
编程
MarkItDown 深度实战:当微软用 Python 把「文档地狱」变成 Markdown 乐园——从多格式解析到 RAG 知识库落地的生产级完全指南(2026)
2026-06-16 23:52:04 +0800 CST
view 152
微软开源MarkItDown深度实战:从多格式文档解析到RAG知识库落地的完全指南,涵盖PDF/Word/Excel/PPT转换、LangChain/LlamaIndex集成、性能优化与安全防护
MarkItDown
Python
RAG
文档转换
Markdown
LLM
知识库
微软
AI Agent
LangChain
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
12
13
14
15
16
...
27
下一页