程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
万字深度解析百度 Unlimited OCR:当长文档解析遇见 R-SWA 革命——从常数级 KV Cache 到 40 页一次性识别的完整技术指南(2026)
编程
万字深度解析百度 Unlimited OCR:当长文档解析遇见 R-SWA 革命——从常数级 KV Cache 到 40 页一次性识别的完整技术指南(2026)
2026-07-02 18:16:20 +0800 CST
view 12
深度解析百度 Unlimited OCR 的 R-SWA 参考滑动窗口注意力机制,将 KV Cache 从线性增长压至常数级;3B MoE 解码器架构、DeepEncoder 视觉编码器;完整本地部署代码、KV Cache 监控脚本与 SGLang 生产推理优化指南。OmniDocBench v1.6 综合得分 93.92%,端到端 OCR 新 SOTA。
OCR
R-SWA
KV Cache
MoE
百度
长文档解析
Transformer
深度学习
Python
性能优化
React 19 深度解析:use() Hook、Server Components 生产可用、Form Actions——17 个新特性彻底改变前端开发
编程
React 19 深度解析:use() Hook、Server Components 生产可用、Form Actions——17 个新特性彻底改变前端开发
2026-05-14 02:11:03 +0800 CST
view 398
React 19于2026年5月1日正式发布,use() Hook统一数据获取和Context读取(样板代码减少60%),Server Components生产可用(首屏加载时间降低45%,Bundle体积缩小32%),Form Actions简化表单处理(样板代码减少60%),Asset Loading优化(Lighthouse评分提升22分)。
React 19,use() Hook,Server Components,Form Actions,React 新特性,前端开发
万字深度解析 Coreboot 26.06:当开源固件遇见 AI 硬件时代——从 Nova Lake 提前适配到 A/B 分区恢复的完整技术指南(2026)
编程
万字深度解析 Coreboot 26.06:当开源固件遇见 AI 硬件时代——从 Nova Lake 提前适配到 A/B 分区恢复的完整技术指南(2026)
2026-07-02 18:48:19 +0800 CST
view 10
Coreboot 26.06 版本深度解析:Intel Nova Lake 和 AMD Strix Halo 提前适配、ROM Armor 2 安全机制、A/B Recovery 分区恢复、高通 Calypso 支持,含完整编译实战与安全加固指南。
Coreboot
开源固件
Intel Nova Lake
AMD Strix Halo
ROM Armor
A/B Recovery
FSP
固件安全
Hermes Agent 深度解析:自进化 AI Agent 的三层记忆架构与 Skills 闭环实战
编程
Hermes Agent 深度解析:自进化 AI Agent 的三层记忆架构与 Skills 闭环实战
2026-05-28 14:37:01 +0800 CST
view 401
深度解析 Hermes Agent 的三层记忆架构与 Skills 自进化闭环,含完整代码实战与生产级部署方案。
AI Agent
Hermes Agent
自进化
记忆架构
Skills
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 539
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
编程
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
2026-05-28 15:44:20 +0800 CST
view 421
ASMR(Agentic Search and Memory Retrieval)在 LongMemEval 基准测试中以 99% 准确率刷新世界纪录,彻底颠覆传统 RAG 方案。本文深入解析 ASMR 的 Observer Agents、Search Agents、Memory Graph 三大核心组件,以及无向量数据库的实现原理。
ASMR
AI Agent
永久记忆
LongMemEval
Supermemory
RAG替代
OpenCode 深度实战:当开源 AI 编程 Agent 登上 GitHub Trending 榜首——从 160K Stars 到 75 模型架构、从 Model-Agnostic 范式到华为 DevEco Code 的完全指南(2026)
编程
OpenCode 深度实战:当开源 AI 编程 Agent 登上 GitHub Trending 榜首——从 160K Stars 到 75 模型架构、从 Model-Agnostic 范式到华为 DevEco Code 的完全指南(2026)
2026-06-19 13:55:36 +0800 CST
view 1319
深度解析 2026 年登顶 GitHub Trending 的开源 AI 编程 Agent OpenCode:从 160K Stars、75 模型架构、Provider/MCP/Skill/Plugin 四层扩展体系、Go 语言 Agent 引擎实现,到华为 DevEco Code 商业应用,全面掌握模型无关 AI 编程工具的设计哲学与工程实践。
OpenCode
GitHub
AIAgent
模型无关
MCP协议
Go语言
HarmonyOS
DevEcoCode
Hermes Agent 自进化架构全拆解:从 Learning Loop 到工程落地的深度实战
编程
Hermes Agent 自进化架构全拆解:从 Learning Loop 到工程落地的深度实战
2026-04-24 20:03:22 +0800 CST
view 538
深度拆解 Hermes Agent 的自进化架构,从 Learning Loop 闭环、四层记忆系统、Skill 自动创建机制到自训练飞轮,每层配代码详解,包含部署实战和二次开发指南
AI Agent
Hermes
自进化
Learning Loop
开源项目
DFlash 深度解析:块扩散模型如何让 LLM 推理加速 6 倍——2026 投机解码完全指南
编程
DFlash 深度解析:块扩散模型如何让 LLM 推理加速 6 倍——2026 投机解码完全指南
2026-05-28 19:39:07 +0800 CST
view 451
深入解析 DFlash 块扩散投机解码方案:如何让 Qwen3-8B 实现 6 倍无损加速,超越 EAGLE-3 与 llama.cpp,附 SGLang/vLLM/MLX 完整部署指南。
LLM推理
投机解码
块扩散
DFlash
推理加速
Transformer优化
GPU
CUDA
SGLang
vLLM
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
编程
百度 Unlimited OCR 深度解读:R-SWA 如何将 KV Cache 压成常数,5天 GitHub Star 破万的端到端 OCR 新范式
2026-06-27 09:15:20 +0800 CST
view 72
百度开源 Unlimited OCR,5天 GitHub Star 破万。本文深度解析其核心创新 R-SWA(Reference Sliding Window Attention),如何将解码器 KV Cache 从线性增长压成常数,OmniDocBench v1.6 刷榜 SOTA(93.92%),30B 总参/5B 激活,32K 超长上下文,一次前向全稿转录,附完整代码实战。
Unlimited OCR
R-SWA
KV Cache
MoE
端到端 OCR
百度
深度学习
Transformer
文档识别
OCR
AI 画图新姿势:用自然语言一键生成架构图、ER 图——draw.io/Mermaid/Excalidraw 智能生成方案深度解析
编程
AI 画图新姿势:用自然语言一键生成架构图、ER 图——draw.io/Mermaid/Excalidraw 智能生成方案深度解析
2026-04-16 08:54:48 +0800 CST
view 826
深度解析如何用自然语言一键生成架构图、ER图、流程图。对比Mermaid、Excalidraw、draw.io三大工具的AI生成方案,提供实战案例和最佳实践。
AI画图
自然语言生成
架构图
Mermaid
Excalidraw
draw.io
ER图
Fincept Terminal 深度解析:Bloomberg 终端的开源革命者,如何用 C++20 重新定义金融智能
编程
Fincept Terminal 深度解析:Bloomberg 终端的开源革命者,如何用 C++20 重新定义金融智能
2026-04-25 10:31:25 +0800 CST
view 659
深度解析 Fincept Terminal 开源金融分析平台:C++20+Qt6+Python 技术架构、CFA级别分析能力、100+数据连接器、DCF估值实战、与Bloomberg对比
Fincept Terminal
C++20
Qt6
金融终端
开源
量化交易
Bloomberg替代
Tinyflow 深度解析:前端 100KB 嵌入式 AI 编排,让老旧 ERP/CRM 秒变智能体
编程
Tinyflow 深度解析:前端 100KB 嵌入式 AI 编排,让老旧 ERP/CRM 秒变智能体
2026-05-14 12:38:12 +0800 CST
view 418
深入解析 Tinyflow 嵌入式 AI 编排方案:前端100KB Web Component 无侵入集成,后端Java/Node.js/Python三语言SDK,type+parameters/outputDefs节点契约实现模块化扩展,对比Dify两条路线差异,4个实战场景,中国企业AI转型务实选择。
Tinyflow
AI编排
嵌入式AI
Web Component
智能体
ERP
CRM
MELT架构深度解析:高通如何让AI"深度思考"不再耗尽内存——循环Transformer的内存革命
编程
MELT架构深度解析:高通如何让AI"深度思考"不再耗尽内存——循环Transformer的内存革命
2026-05-19 13:46:15 +0800 CST
view 289
高通AI研究院提出的MELT架构通过门控机制让循环Transformer的内存消耗保持恒定,无论思考多少轮。本文深度解析其架构原理、数学推导、训练策略与性能实测。
AI
Transformer
内存优化
深度推理
高通
腾讯开源Agent Memory:上下文卸载+Mermaid任务画布,Token消耗降低61%
编程
腾讯开源Agent Memory:上下文卸载+Mermaid任务画布,Token消耗降低61%
2026-05-14 15:31:52 +0800 CST
view 383
腾讯云开源TencentDB Agent Memory,通过上下文卸载+Mermaid任务画布为Agent长任务提供记忆压缩,实测Token消耗降低61%同时提升成功率,兼容OpenClaw/Hermes,零依赖SQLite本地存储。
AI Agent
腾讯开源
上下文管理
Token优化
Mermaid
FinceptTerminal 深度实战:当 C++20 遇上金融终端——从 Qt6 原生渲染到 37 个 AI 智能体与 QuantLib 量化引擎的生产级完全指南(2026)
编程
FinceptTerminal 深度实战:当 C++20 遇上金融终端——从 Qt6 原生渲染到 37 个 AI 智能体与 QuantLib 量化引擎的生产级完全指南(2026)
2026-06-14 22:28:06 +0800 CST
view 256
开源金融终端 Fincept Terminal v4 深度实战:C++20 原生渲染、37 个 AI 投资智能体、QuantLib 18 模块量化引擎、100+ 数据源、16 家券商接入
FinceptTerminal
C++20
Qt6
金融终端
量化交易
AI智能体
QuantLib
开源金融
Bun 从 Zig 到 Rust 的六天重写:当 AI 开始重写运行时本身——从内存泄漏到 --cpu-prof-md、从 Claude Code 到开发者工具链的 AI 原生革命(2026)
编程
Bun 从 Zig 到 Rust 的六天重写:当 AI 开始重写运行时本身——从内存泄漏到 --cpu-prof-md、从 Claude Code 到开发者工具链的 AI 原生革命(2026)
2026-06-20 10:56:29 +0800 CST
view 158
Bun六天从Zig重写为Rust的深度分析:内存泄漏、--cpu-prof-md AI原生调试、Claude Code与运行时质量之问、Drizzle ORM JIT优化实战
Bun
Rust
Zig
AI编程
JavaScript运行时
Claude Code
CPU Profiling
Drizzle ORM
Hermes Agent 深度实战:当 AI 学会「自我进化」——从学习闭环到生产级持久记忆的完全指南(2026)
编程
Hermes Agent 深度实战:当 AI 学会「自我进化」——从学习闭环到生产级持久记忆的完全指南(2026)
2026-06-09 00:21:26 +0800 CST
view 184
深度解析 Hermes Agent 的自进化闭环架构:记忆系统(SQLite+FTS5)、技能系统(自动创建与改进)、训练数据闭环。含完整部署实战代码(本地/Docker/VPS)、性能优化方案、与 OpenClaw/Superpowers/nanobot 横向对比。12000 字工程师视角长文。
Hermes Agent
自进化AI
AI Agent
Python
Nous Research
记忆系统
技能系统
Hermes Agent 深度解析:6.1万Star的自进化AI智能体,如何用闭环学习颠覆传统Agent架构
编程
Hermes Agent 深度解析:6.1万Star的自进化AI智能体,如何用闭环学习颠覆传统Agent架构
2026-04-17 07:14:13 +0800 CST
view 802
Hermes Agent深度技术解析:6.1万Star的自进化AI智能体,三层记忆系统、闭环学习机制、技能自动创建与优化,与传统Agent架构的对比分析及生产部署实践
AI Agent
Hermes
自进化
开源
Nous Research
Rust Web 框架 2026 生态全景:Axum vs Actix-web vs Warp,TechEmpower 160K req/s 背后的技术真相
编程
Rust Web 框架 2026 生态全景:Axum vs Actix-web vs Warp,TechEmpower 160K req/s 背后的技术真相
2026-05-15 03:13:09 +0800 CST
view 493
TechEmpower Round 23 数据深度解析:Actix-web 160K req/s、Axum 148K req/s 领先 Go Gin 1.5-1.7 倍。从架构设计、SQLx/SeaORM/Diesel 数据库集成、生产部署到与 Go 选型对比,2026 年 Rust Web 框架完整选型指南。
Rust,Axum,Actix-web,Warp,Web框架,SQLx,SeaORM,后端开发
PHP RFC6455 WebSocket纯协议实现:Ratchet + Workerman优雅解耦方案
编程
PHP RFC6455 WebSocket纯协议实现:Ratchet + Workerman优雅解耦方案
2026-06-20 12:28:56 +0800 CST
view 137
PHP WebSocket纯协议实现方案,基于Ratchet RFC6455 + Workerman。协议层与传输层完全解耦,自动处理握手/分帧/掩码/分片/Ping-Pong。适合需要深度定制WebSocket协议的场景。
PHP
WebSocket
RFC6455
Workerman
Ratchet
实时通信
开源
PSR-7
网络协议
Gai:AI 原生的 Go Web 全栈框架
编程
Gai:AI 原生的 Go Web 全栈框架
2026-05-21 16:19:43 +0800 CST
view 309
Gai是AI原生的Go Web全栈框架,融合Go简洁高效与Laravel优雅设计,Schema驱动开发,内置全平台AI Agent Rules,支持MySQL/PostgreSQL/SQLite。
开源项目
Go
Web框架
AI原生
ORM
Schema驱动
Hermes彻底碾压OpenClaw?10周登顶全球Token消耗榜的AI Agent架构解析
编程
Hermes彻底碾压OpenClaw?10周登顶全球Token消耗榜的AI Agent架构解析
2026-05-21 16:25:24 +0800 CST
view 289
Hermes登顶OpenRouter全球应用Token消耗榜榜首,10周内从零到全球调用量第一,自我进化技能机制、有限记忆、模型解耦、本地优先,针对性解决OpenClaw安全漏洞和效率问题。
AI Agent
OpenClaw
Hermes
架构对比
安全审计
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
编程
TriAttention深度解析:MIT韩松团队如何用三角函数让单卡4090跑出百万Token上下文
2026-04-17 10:15:58 +0800 CST
view 521
2026年4月,MIT、英伟达、浙江大学联合发布TriAttention,用三角函数建模注意力距离偏好,实现KV缓存10.7倍压缩,让单卡4090跑出百万Token上下文。
AI
大模型
Transformer
注意力机制
KV缓存
长上下文
模型优化
论文解读
2026
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
3
4
5
6
下一页