程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
万字深度解析 claude-mem:给 Claude Code 装上「长期记忆大脑」——从生命周期钩子到 AI 智能压缩的工程化实践(2026)
编程
万字深度解析 claude-mem:给 Claude Code 装上「长期记忆大脑」——从生命周期钩子到 AI 智能压缩的工程化实践(2026)
2026-07-01 02:42:33 +0800 CST
view 14
2026年6月thedotmack/claude-mem以2.4万Star成为Claude Code生态最热门记忆插件。深度解析五大核心组件:生命周期钩子捕获层、AI智能压缩引擎、混合存储层、混合检索与排序层、上下文自动注入层。含完整安装配置实战、Token效率优化、与Headroom/supermemory对比、生产环境最佳实践。
claude-mem
Claude Code
AI记忆系统
上下文压缩
编码助手
生命周期钩子
向量数据库
混合检索
Token优化
长期记忆
AI工程化
开源项目
Milvus 向量数据库深度实战:从零构建生产级 RAG 系统——AI 时代语义检索的架构设计与性能优化
编程
Milvus 向量数据库深度实战:从零构建生产级 RAG 系统——AI 时代语义检索的架构设计与性能优化
2026-05-22 18:14:42 +0800 CST
view 321
深入解析 Milvus 向量数据库的核心原理与架构设计,从向量嵌入、ANN 算法到 RAG 系统实战,涵盖生产环境性能优化技巧,助你构建企业级 AI 应用。
向量数据库
Milvus
RAG
AI
语义检索
向量检索
Embedding
HNSW
ANN
Claude Opus 4.8 深度实战:Dynamic Workflows 如何让单个开发者指挥百个 AI Agent 并行编码——从混合推理架构到生产级多智能体调度的完全指南(2026)
编程
Claude Opus 4.8 深度实战:Dynamic Workflows 如何让单个开发者指挥百个 AI Agent 并行编码——从混合推理架构到生产级多智能体调度的完全指南(2026)
2026-06-03 03:15:05 +0800 CST
view 222
深度解析 Claude Opus 4.8 的 Dynamic Workflows 多智能体并行编码能力,涵盖混合推理架构、Effort Control 推理控制、诚实性对齐改进,附完整 Python 调度器实现和代码审查流水线实战
Claude
Opus 4.8
Dynamic Workflows
AI Agent
混合推理
多智能体
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
编程
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
2026-05-11 20:48:39 +0800 CST
view 414
深度解析Llama 4 Scout/Maverick的MoE架构、128专家设计、1000万token超长上下文,附本地部署实战与许可证分析
Meta
Llama4
MoE
开源大模型
混合专家架构
Scout
Maverick
iRoPE
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 520
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
MoE架构深度实战:当模型参数突破万亿——从DeepSeek R2到GPT-5的稀疏激活革命(2026完全指南)
编程
MoE架构深度实战:当模型参数突破万亿——从DeepSeek R2到GPT-5的稀疏激活革命(2026完全指南)
2026-06-26 00:46:56 +0800 CST
view 69
2026年,大语言模型的参数量已经突破1.2万亿(DeepSeek R2),但推理时的计算量只相当于200亿参数的稠密模型。这背后的核心技术就是Mixture of Experts(MoE)架构。本文深度解析MoE的核心原理、工程实现、负载均衡策略,以及DeepSeek R2和GPT-5中的最新优化技巧。包含完整的PyTorch代码实战,从零实现MoE层。
MoE架构
混合专家
DeepSeek R2
稀疏激活
门控网络
负载均衡
大模型推理
细粒度MoE
共享专家
GPT-5
MongoDB 8.3 深度解析:面向 AI 智能体生产环境的平台升级,向量搜索性能提升 50%
编程
MongoDB 8.3 深度解析:面向 AI 智能体生产环境的平台升级,向量搜索性能提升 50%
2026-05-14 02:04:57 +0800 CST
view 334
MongoDB 8.3于2026年5月12日在伦敦.Local大会发布,向量搜索性能提升50%(延迟从5.2秒降至2.1秒),召回率提升至92%。新增混合搜索()联合优化向量+全文+地理搜索,智能体事务冲突自动解决,吞吐量提升320%。
MongoDB,向量搜索,混合搜索,智能体,AI生产环境,事务冲突自动解决
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
编程
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
2026-05-28 16:37:41 +0800 CST
view 214
深入解析 Meta Llama 4 的 MoE 混合专家架构原理,探讨其如何以 17B 激活参数撬动万亿级算力,并提供完整的本地部署实战指南。
Llama4
MoE
混合专家
开源大模型
本地部署
Meta
人工智能
深度学习
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
编程
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
2026-04-28 08:19:25 +0800 CST
view 502
深度解析 DeepSeek V4:混合注意力机制、MoE 架构、100万token 上下文、Agent 能力,从技术原理到部署实战,全面剖析开源模型新天花板
DeepSeek
AI大模型
开源
长上下文
MoE
混合注意力
Agent
MemPalace 深度解析:记忆宫殿架构如何让 AI Agent 告别"金鱼记忆"
编程
MemPalace 深度解析:记忆宫殿架构如何让 AI Agent 告别"金鱼记忆"
2026-06-10 11:48:11 +0800 CST
view 197
深度解析 MemPalace——54k Stars 的开源 AI Agent 记忆系统,用记忆宫殿架构实现 96.6% R@5 召回率,无需 API key 完全本地运行。
AI Agent
MemPalace
记忆系统
MCP
向量检索
LongMemEval
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
编程
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
2026-04-28 21:16:14 +0800 CST
view 489
深度解析 GitHub 19K Star 的 RAG-Anything 多模态 RAG 框架:All-in-One 架构设计、MinerU 文档解析、多模态知识图谱、向量-图谱融合检索,完整覆盖从原理到生产部署的技术细节。
RAG
多模态
知识图谱
LightRAG
MinerU
AI
向量检索
文档处理
TurboVec 深度实战:当 Google ICLR 2026 向量量化算法遇见 Rust SIMD——从 31GB 到 4GB、搜索比 FAISS 快 20% 的生产级完全指南(2026)
编程
TurboVec 深度实战:当 Google ICLR 2026 向量量化算法遇见 Rust SIMD——从 31GB 到 4GB、搜索比 FAISS 快 20% 的生产级完全指南(2026)
2026-06-16 08:21:57 +0800 CST
view 184
深度解析 TurboVec:基于 Google ICLR 2026 TurboQuant 算法的 Rust 向量检索引擎。1000万向量从31GB压缩到4GB,ARM平台搜索速度比FAISS快19%,零训练增量写入,完整RAG集成指南。
Rust
SIMD
向量检索
TurboQuant
RAG
FAISS
量化
AI
Python
PostgreSQL 18 深度解析:I/O 子系统重构与 AI 时代的数据底座进化
编程
PostgreSQL 18 深度解析:I/O 子系统重构与 AI 时代的数据底座进化
2026-05-09 12:14:33 +0800 CST
view 437
PostgreSQL 18 发布:I/O 子系统重构带来 3 倍性能提升,虚拟生成列节省 30% 存储,uuidv7 时间有序 UUID,OAuth 2.0 企业集成,pgvector + DiskANN 亿级向量检索,SQL:2023 标准兼容。
PostgreSQL
数据库
性能优化
向量检索
AI
PostgreSQL + pgvector 向量检索深度实战:从嵌入存储到 AI 原生数据库的架构设计与生产级实践
编程
PostgreSQL + pgvector 向量检索深度实战:从嵌入存储到 AI 原生数据库的架构设计与生产级实践
2026-05-22 23:16:27 +0800 CST
view 321
深度实战 pgvector 向量检索扩展:从 HNSW 索引调优到生产级 RAG 系统构建,覆盖混合检索、AIDB 自动化管道、性能优化和分布式部署
PostgreSQL
pgvector
向量检索
RAG
AI数据库
HNSW
pgvector 向量检索与 AI 原生 PostgreSQL 深度实战:HNSW 调优、混合检索与生产级 RAG 全指南
编程
pgvector 向量检索与 AI 原生 PostgreSQL 深度实战:HNSW 调优、混合检索与生产级 RAG 全指南
2026-05-22 23:16:56 +0800 CST
view 307
深度实战 pgvector 向量检索扩展:从 HNSW 索引调优到生产级 RAG 系统构建,覆盖混合检索、AIDB 自动化管道、性能优化和分布式部署
PostgreSQL
pgvector
向量检索
RAG
AI数据库
HNSW
last30days-skill 深度解析:当 AI 终端学会「全网记忆」,信息差终于被彻底粉碎
编程
last30days-skill 深度解析:当 AI 终端学会「全网记忆」,信息差终于被彻底粉碎
2026-04-10 03:42:48 +0800 CST
view 942
last30days-skill 深度解析:GitHub 10K+ Stars 的 AI 终端扩展,跨平台抓取全网过去30天真实社区讨论,终结信息差时代
AI工具
Claude Code
开源
GitHub
信息检索
RAG 2026 生产级工程化完全指南:从朴素检索到 Agentic RAG 的架构演进与性能优化实战
编程
RAG 2026 生产级工程化完全指南:从朴素检索到 Agentic RAG 的架构演进与性能优化实战
2026-05-23 03:16:51 +0800 CST
view 299
2026 年最新 RAG 生产级工程化完全指南,从 Naive RAG 到 Agentic RAG 的架构演进,11 个性能优化策略,准确率从 60% 到 94%。
RAG
检索增强生成
生产级工程化
LangChain
Agentic RAG
MySQL 9.7 LTS 深度解析:企业级功能下放社区,从向量检索到 Hypergraph 优化器的数据库新纪元
编程
MySQL 9.7 LTS 深度解析:企业级功能下放社区,从向量检索到 Hypergraph 优化器的数据库新纪元
2026-05-10 15:21:45 +0800 CST
view 568
MySQL 9.7 LTS 深度解析:Oracle 将企业版功能下放社区,VECTOR 向量类型支持 RAG,Hypergraph 优化器解决复杂 JOIN,JSON Duality Views 实现关系与文档一体化,性能翻倍至 500K QPS
MySQL
数据库
向量检索
Hypergraph
AI
RAG
MemPalace 深度实战:当记忆宫殿遇上 AI Agent——从 2000 年前认知术到 96.6% 召回率的本地记忆系统完全指南(2026)
编程
MemPalace 深度实战:当记忆宫殿遇上 AI Agent——从 2000 年前认知术到 96.6% 召回率的本地记忆系统完全指南(2026)
2026-06-12 15:20:19 +0800 CST
view 281
从 2000 年前古希腊记忆术到 96.6% R@5 的 AI 本地记忆系统,深度解析 MemPalace 的 Wing/Room/Drawer 架构、可插拔后端设计与 MCP 集成实践
AI记忆
MemPalace
MCP
向量检索
RAG
本地部署
Python
AI Agent
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
编程
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
2026-05-02 10:33:28 +0800 CST
view 463
深入拆解Apache Doris 4.1的技术内核:从FE/BE架构到存算分离、从原生向量检索到混合搜索、从RAG实战到生产部署,全方位解析实时数仓如何演化为AI时代统一数据底座
Apache Doris
向量检索
实时数仓
RAG
存算分离
OLAP
AI数据库
ClickHouse 2026 深度实战:从列式存储到向量检索——OLAP 之王的全栈工程化完全指南
编程
ClickHouse 2026 深度实战:从列式存储到向量检索——OLAP 之王的全栈工程化完全指南
2026-05-24 10:34:46 +0800 CST
view 408
2026年ClickHouse深度实战完全指南:从列式存储原理到MergeTree引擎家族,从集群架构到最新向量检索能力,从数据摄入到生产级性能调优,覆盖12大核心主题的工程化长文。
ClickHouse
OLAP
数据库
列式存储
向量检索
MemPalace 深度实战:给AI装上「记忆宫殿」——从96.6%召回率到生产级长期记忆系统的完全指南(2026)
编程
MemPalace 深度实战:给AI装上「记忆宫殿」——从96.6%召回率到生产级长期记忆系统的完全指南(2026)
2026-06-13 03:15:59 +0800 CST
view 178
MemPalace深度实战:本地优先的AI记忆系统,LongMemEval基准96.6% R@5(开源第一),29个MCP工具,Wing/Room/Drawer三层结构化存储,让AI拥有可靠的结构化长期记忆。
AI记忆系统
MemPalace
Claude Code
长期记忆
向量检索
MCP协议
Claude Code 持久记忆实战:从三层压缩机制到 Claude-Mem 的跨会话记忆实现
编程
Claude Code 持久记忆实战:从三层压缩机制到 Claude-Mem 的跨会话记忆实现
2026-04-22 09:32:54 +0800 CST
view 570
深入解析 Claude Code 三层上下文压缩机制的局限,以及开源项目 Claude-Mem 如何通过 SQLite+向量检索双轨架构实现跨会话持久记忆,并探讨记忆插件背后的商业博弈与技术启示。
Claude Code
CIaude-Mem
上下文压缩
AI编程
持久记忆
LLM
向量检索
阿里巴巴 zvec 深度解析:让向量搜索回归进程内的极致性能之道
编程
阿里巴巴 zvec 深度解析:让向量搜索回归进程内的极致性能之道
2026-04-23 05:10:48 +0800 CST
view 583
深度解析阿里巴巴开源的轻量级进程内向量数据库zvec,从Proxima引擎架构、RabitQ量化算法、HNSW索引优化、WAL持久化到SIMD自动分发,含完整Python/Node.js代码实战与性能对比
zvec
向量数据库
Proxima
RabitQ
HNSW
嵌入式数据库
AI
向量检索
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
下一页