程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
编程
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
2026-05-28 15:44:20 +0800 CST
view 415
ASMR(Agentic Search and Memory Retrieval)在 LongMemEval 基准测试中以 99% 准确率刷新世界纪录,彻底颠覆传统 RAG 方案。本文深入解析 ASMR 的 Observer Agents、Search Agents、Memory Graph 三大核心组件,以及无向量数据库的实现原理。
ASMR
AI Agent
永久记忆
LongMemEval
Supermemory
RAG替代
PersonaPlex 深度解析:当 NVIDIA 让全双工语音对话进入「角色扮演」时代
编程
PersonaPlex 深度解析:当 NVIDIA 让全双工语音对话进入「角色扮演」时代
2026-04-09 11:32:36 +0800 CST
view 719
NVIDIA发布的PersonaPlex在Moshi架构基础上增加了角色扮演和语音克隆能力,让AI可以扮演教师、客服等不同身份进行实时语音对话。本文从架构、代码、实战角度全面解析这项技术突破。
PersonaPlex
NVIDIA
Moshi
全双工语音
AI对话
角色扮演
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
编程
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
2026-04-19 14:16:23 +0800 CST
view 647
深度解析 NVIDIA PersonaPlex:基于 Moshi 架构的 7B 参数全双工语音 AI 模型,170ms 打断延迟,MIT 商用许可,从架构原理到代码实战的完整技术指南。
NVIDIA
PersonaPlex
全双工语音
Moshi
Kyutai
AI语音
实时对话
语音AI
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 559
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
编程
百度开源Unlimited OCR:3B参数500M激活拿下全球第一,疑似DeepSeek出走大神之作
2026-06-22 20:57:32 +0800 CST
view 487
百度开源Unlimited OCR:3B参数500M激活,在OmniDocBench v1.6拿下93.92%端到端SOTA超越Qwen3-VL和Gemini。核心技术R-SWA参考滑动窗口注意力+DeepEncoder 16倍视觉压缩,实现40+页长程解析不失忆。疑似DeepSeek OCR核心作者魏浩然出走百度之作。
百度
OCR
开源
R-SWA
DeepEncoder
MoE
长程解析
SOTA
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
编程
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
2026-05-11 20:48:39 +0800 CST
view 422
深度解析Llama 4 Scout/Maverick的MoE架构、128专家设计、1000万token超长上下文,附本地部署实战与许可证分析
Meta
Llama4
MoE
开源大模型
混合专家架构
Scout
Maverick
iRoPE
万字深度解析 Rspack:当字节跳动用 Rust 重写前端构建——从三明治架构到 5-10 倍性能提升的完整技术指南(2026)
编程
万字深度解析 Rspack:当字节跳动用 Rust 重写前端构建——从三明治架构到 5-10 倍性能提升的完整技术指南(2026)
2026-07-02 09:47:44 +0800 CST
view 0
深度解析字节跳动开源的Rspack:Rust编写的Webpack替代方案,40K+ Stars,三明治架构设计,SWC极速转译,5-10倍构建性能提升,含完整迁移实战代码。
Rspack
Rust
Webpack
前端构建
SWC
字节跳动
Rsbuild
Module Federation
CodeGraph 深度实战:当 Tree-sitter 知识图谱终结 AI 编程的「盲人摸象」时代——从预索引架构到生产级代码理解完全指南(2026)
编程
CodeGraph 深度实战:当 Tree-sitter 知识图谱终结 AI 编程的「盲人摸象」时代——从预索引架构到生产级代码理解完全指南(2026)
2026-06-10 15:51:19 +0800 CST
view 274
CodeGraph 是一个专为 AI 编程代理打造的本地代码知识图谱引擎,通过预索引架构让 AI 真正理解代码结构。本文从 Tree-sitter 解析原理讲起,深度拆解其知识图谱构建、MCP 工具生态、性能优化与生产级集成实战。
CodeGraph
Tree-sitter
AI编程
知识图谱
MCP
Claude Code
Cursor
代码索引
CodeGraph 深度实战:当 AI 编码代理遇见代码知识图谱——从 AST 解析到本地索引引擎、MCP 集成与零文件读取模式的生产级完全指南(2026)
编程
CodeGraph 深度实战:当 AI 编码代理遇见代码知识图谱——从 AST 解析到本地索引引擎、MCP 集成与零文件读取模式的生产级完全指南(2026)
2026-06-17 09:52:23 +0800 CST
view 223
CodeGraph 是专为AI编码代理打造的本地代码知识图谱引擎,预索引代码库的符号关系和调用图,让AI直接查询结构化知识而非逐行扫描文件,Token消耗降低57%,响应速度提升46%的生产级完全指南
CodeGraph
AI编码代理
代码知识图谱
MCP
Tree-sitter
Claude Code
Cursor
AST解析
FluxDown 深度实战:当 Rust 异步引擎颠覆下载器霸权——从 Tokio 运行时架构到智能分段、多协议支持与跨平台 Tauri/Flutter 部署的生产级完全指南(2026)
编程
FluxDown 深度实战:当 Rust 异步引擎颠覆下载器霸权——从 Tokio 运行时架构到智能分段、多协议支持与跨平台 Tauri/Flutter 部署的生产级完全指南(2026)
2026-06-17 17:56:41 +0800 CST
view 257
深入剖析 FluxDown 下载器的技术架构:从 Tokio 异步运行时原理到智能分段下载实现,从多协议支持到 Tauri/Flutter 跨平台部署,全面展示 Rust 在现代桌面应用开发中的巨大潜力。
Rust
Tokio
下载器
异步编程
Tauri
Flutter
跨平台
9Router 深度实战:当 AI 编程助手学会「智能路由」——从 Token 节省 40% 到零成本无限编程的完全指南(2026)
编程
9Router 深度实战:当 AI 编程助手学会「智能路由」——从 Token 节省 40% 到零成本无限编程的完全指南(2026)
2026-06-14 05:23:52 +0800 CST
view 214
9Router深度实战:从AI编程助手的成本困境到智能路由解决方案,详解RTK Token节省器、三层智能回退、格式翻译层,附完整集成配置示例。
9Router
AI路由
Token节省
Claude Code
Cursor
免费AI
智能回退
CodeGraph 深度实战:当 AI 编程助手拥有「代码记忆」——从预索引知识图谱到跨语言调用链追踪的生产级完全指南(2026)
编程
CodeGraph 深度实战:当 AI 编程助手拥有「代码记忆」——从预索引知识图谱到跨语言调用链追踪的生产级完全指南(2026)
2026-06-06 08:37:32 +0800 CST
view 316
CodeGraph深度实战:从预索引知识图谱架构到跨语言调用链追踪,7个真实项目基准测试Token减少47%,工具调用减少58%,20+语言支持,14种框架路由检测,100%本地运行
CodeGraph
AI编程
知识图谱
MCP
代码索引
Tree-sitter
Claude Code
Cursor
OpenMontage 深度实战:全球首个开源 AI Agent 视频制作系统
编程
OpenMontage 深度实战:全球首个开源 AI Agent 视频制作系统
2026-06-27 01:14:57 +0800 CST
view 142
2026年6月GitHub Trending榜首项目OpenMontage深度解析:全球首个开源AI Agent视频制作系统,12条管线、52个工具、500+技能。
OpenMontage
AI Agent
视频制作
开源
Agentic
GitHub Trending
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 623
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
OpenMontage 深度解析:全球首个开源 Agent 视频制作系统,从架构原理到生产级实战
编程
OpenMontage 深度解析:全球首个开源 Agent 视频制作系统,从架构原理到生产级实战
2026-06-27 16:47:07 +0800 CST
view 105
全球首个开源 Agent 视频制作系统 OpenMontage 深度解析:从三层知识架构、智能体工作流、生产级部署到自定义管线开发,附完整代码示例与实操指南。
OpenMontage
AI Agent
视频制作
开源
自动化
Kimi K2.6开源:13小时编码与300子Agent集群,国产大模型抢滩长程编程高地
编程
Kimi K2.6开源:13小时编码与300子Agent集群,国产大模型抢滩长程编程高地
2026-04-27 14:52:59 +0800 CST
view 663
深度解析月之暗面开源的Kimi K2.6模型:13小时不间断编码、300子Agent集群协作、5天自主运行的技术架构与实测案例分析
Kimi K2.6
开源模型
长程编程
AI Agent
国产大模型
Moonshot AI
Agent集群
编程助手
DeepSeek V4 Flash 深度解析:开源大模型的 Agent 时代新范式
编程
DeepSeek V4 Flash 深度解析:开源大模型的 Agent 时代新范式
2026-06-30 09:16:27 +0800 CST
view 46
深度解析 DeepSeek V4 Flash 的 Ultra-MoE、CSA+HCA 混合注意力、mHC 流形约束、Engram 条件记忆四大架构创新,以及 DSpark 投机解码带来的 60-85% 推理加速。涵盖 SWE-bench 79% 性能分析、API 调用实战与部署方案。
DeepSeek
V4 Flash
MoE
开源大模型
AI Agent
Kimi K2.7 Code 深度实战:当 1 万亿参数 MoE 架构遇见编码 Agent——从 256K 超长上下文到 thinking-token 暴降 30% 的生产级完全指南(2026)
编程
Kimi K2.7 Code 深度实战:当 1 万亿参数 MoE 架构遇见编码 Agent——从 256K 超长上下文到 thinking-token 暴降 30% 的生产级完全指南(2026)
2026-06-17 08:28:27 +0800 CST
view 166
深度解析月之暗面Kimi K2.7 Code开源编程模型:1T MoE架构、256K超长上下文、thinking-token暴降30%的生产级完全指南。涵盖架构原理、API接入、本地部署、Agent集成、性能优化等全链路实战。
Kimi
K2.7
AI编程
MoE架构
长上下文
Agent
Kimi K2.7 Code 完全指南:当 1 万亿参数 MoE 遇见编码 Agent——256K 上下文×thinking-token 暴降 30% 的生产级实战(2026)
编程
Kimi K2.7 Code 完全指南:当 1 万亿参数 MoE 遇见编码 Agent——256K 上下文×thinking-token 暴降 30% 的生产级实战(2026)
2026-06-17 08:28:57 +0800 CST
view 248
深度解析月之暗面Kimi K2.7 Code开源编程模型:1T MoE架构、256K超长上下文、thinking-token暴降30%的生产级完全指南。涵盖架构原理、API接入、本地部署、Agent集成、性能优化等全链路实战。
Kimi
K2.7
AI编程
MoE架构
长上下文
Agent
MiMo Code 深度实战:当小米杀入 AI 编程赛道——从 SQLite FTS5 持久记忆到子智能体编排、Max Mode 并行推理与 Compose 自进化工作流的生产级完全指南(2026)
编程
MiMo Code 深度实战:当小米杀入 AI 编程赛道——从 SQLite FTS5 持久记忆到子智能体编排、Max Mode 并行推理与 Compose 自进化工作流的生产级完全指南(2026)
2026-06-17 13:23:19 +0800 CST
view 314
深度拆解小米 MiMo Code V0.1.0 的架构设计、持久记忆系统、子智能体编排、Goal 裁判模型、Max Mode 并行推理与 Compose 工作流
AI编程
MiMo Code
小米
Coding Agent
开源项目
万字深度解析 DeepSeek V4:当 1.6 万亿参数遇见 DSA 稀疏注意力——开源大模型如何让 API 账单暴降 95%(2026)
编程
万字深度解析 DeepSeek V4:当 1.6 万亿参数遇见 DSA 稀疏注意力——开源大模型如何让 API 账单暴降 95%(2026)
2026-07-01 07:13:58 +0800 CST
view 34
2026年4月DeepSeek V4发布,1.6万亿参数+百万上下文+SWE-Bench 80.6%,API成本暴降95%。深度解析DSA稀疏注意力、MoE架构、生产级部署实战。
DeepSeek V4
DSA 稀疏注意力
MoE 架构
百万上下文
开源大模型
API 成本优化
大模型部署
Agent 能力
SWE-Bench
DeepSeek
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 559
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
HarmonyOS 7 深度实战:当操作系统学会「思考」——从Agent亲和架构到HMAF 2.0智能体框架的生产级开发完全指南(2026)
编程
HarmonyOS 7 深度实战:当操作系统学会「思考」——从Agent亲和架构到HMAF 2.0智能体框架的生产级开发完全指南(2026)
2026-06-13 09:54:08 +0800 CST
view 367
深度拆解HarmonyOS 7 Agent亲和架构、HMAF 2.0智能体框架、A2A/A2UI协议、openPangu 2.0大模型,含完整开发实战代码与性能优化指南
HarmonyOS
鸿蒙
Agent
HMAF
A2A
A2UI
MCP
华为
智能体
拒绝劝退!基于pi-mono的轻量级AI Agent学习神器LoongClaw
编程
拒绝劝退!基于pi-mono的轻量级AI Agent学习神器LoongClaw
2026-04-22 13:28:09 +0800 CST
view 633
OpenClaw太重?LoongClaw基于pi-mono架构的轻量级AI Agent学习神器,大道至简,聚焦Agent Loop本质,适合初学者和二次开发。
LoongClaw
pi-mono
AI Agent
开源
OpenClaw
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
19
20
21
22
23
...
73
下一页