程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
编程
MarkItDown 深度解析:微软开源的文档转换神器如何重塑 LLM 时代的知识处理流水线
2026-04-18 06:17:21 +0800 CST
view 442
深度解析微软开源的 MarkItDown 文档转换工具,从架构设计、源码实现到实战应用,揭秘它如何成为 LLM 时代知识处理的基础设施。
MarkItDown
微软开源
文档转换
LLM
RAG
Python工具
Markdown
PDF转换
Agent Lightning 深度解析:微软如何用零代码改造让 AI Agent 实现自我进化
编程
Agent Lightning 深度解析:微软如何用零代码改造让 AI Agent 实现自我进化
2026-04-18 15:12:54 +0800 CST
view 516
深入剖析微软开源项目 Agent Lightning 的技术架构,详解零代码接入、多框架兼容、强化学习训练等核心特性
AI Agent
强化学习
LangChain
AutoGen
微软
开源
Agent Lightning 深度解析:零代码如何让任何框架的 AI Agent 实现自我进化
编程
Agent Lightning 深度解析:零代码如何让任何框架的 AI Agent 实现自我进化
2026-04-18 15:13:12 +0800 CST
view 450
深入剖析微软开源项目 Agent Lightning 的技术架构,详解零代码接入、多框架兼容、强化学习训练等核心特性
AI Agent
强化学习
LangChain
AutoGen
微软
开源
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
编程
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
2026-06-16 06:47:47 +0800 CST
view 228
MusaCoder是首个基于国产GPU完成全链路训练的代码大模型,在KernelBench上超越Claude Opus 4.7。从三阶段数据合成、多样性RFT到执行反馈RL,深度解析全栈训练方法论。
MusaCoder
GPU Kernel
摩尔线程
国产GPU
CUDA
MUSA
大模型
强化学习
KernelBench
代码大模型
AI Coding
深度学习
Headroom深度解析:AI Agent上下文压缩层如何节省95% Token
编程
Headroom深度解析:AI Agent上下文压缩层如何节省95% Token
2026-06-29 10:12:11 +0800 CST
view 58
Headroom 可在不显著损失信息的前提下将 AI Agent 上下文 Token 压缩 60%-95%。本文深度解析其核心原理、源码实现、集成实战与性能基准,附完整可运行代码示例。
AI Agent
上下文压缩
Headroom
Token优化
LangChain
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
编程
上下文压缩实战:Headroom 如何让 AI Agent 的 Token 成本暴降 95%——从原理深度拆解到生产级接入完全指南(2026)
2026-06-10 22:16:42 +0800 CST
view 454
Headroom上下文压缩中间层实战:Token节省60-95%,精度保留97%。从原理拆解到LangChain/OpenClaw生产级集成,附完整代码示例。
AI Agent
上下文压缩
Token优化
Headroom
LLM成本
LangChain
RAG
生产级实战
RAG 2026 生产级工程化完全指南:从朴素检索到 Agentic RAG 的架构演进与性能优化实战
编程
RAG 2026 生产级工程化完全指南:从朴素检索到 Agentic RAG 的架构演进与性能优化实战
2026-05-23 03:16:51 +0800 CST
view 301
2026 年最新 RAG 生产级工程化完全指南,从 Naive RAG 到 Agentic RAG 的架构演进,11 个性能优化策略,准确率从 60% 到 94%。
RAG
检索增强生成
生产级工程化
LangChain
Agentic RAG
Headroom 深度解析:AI Agent 上下文压缩层——Token 暴降 60-95% 背后的架构哲学与生产级实践
编程
Headroom 深度解析:AI Agent 上下文压缩层——Token 暴降 60-95% 背后的架构哲学与生产级实践
2026-06-30 03:12:30 +0800 CST
view 25
深度解析 Headroom 上下文压缩层:透明代理架构、SDC/SSA/RME/FO 四大压缩算法、源码级实现分析、生产级部署实践与成本测算
Headroom
AI Agent
上下文压缩
Token优化
LangChain
AutoGen
MCP
Helidon 4.4 深度解析:当 Oracle 把 LangChain4j AI Agent 能力直接内建进 Java 微服务框架
编程
Helidon 4.4 深度解析:当 Oracle 把 LangChain4j AI Agent 能力直接内建进 Java 微服务框架
2026-04-11 11:26:05 +0800 CST
view 748
2026年4月Oracle发布Helidon 4.4,原生集成LangChain4j AI Agent能力。本文深度解析这一重磅更新,从架构演进、代码实战到性能优化,全面展示Java微服务框架如何拥抱AI Agent时代。
Java
Helidon
LangChain4j
AI Agent
微服务
gsplat深度解析:3D高斯泼溅的CUDA加速革命——从伯克利/英伟达开源库到生产级实时渲染
编程
gsplat深度解析:3D高斯泼溅的CUDA加速革命——从伯克利/英伟达开源库到生产级实时渲染
2026-06-30 15:18:05 +0800 CST
view 24
深度解析UC伯克利/NVIDIA等机构联合开发的gsplat开源库:CUDA加速的3D高斯泼溅渲染引擎,节省4倍显存、缩短15%训练时间,涵盖数学原理、CUDA架构、训练流程、性能优化与生产应用。
gsplat
3D Gaussian Splatting
CUDA
图形渲染
3D重建
NeRF
实时渲染
PyTorch
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
编程
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
2026-05-11 19:45:54 +0800 CST
view 450
GPT-5-Codex突破性引入Dynamic Thinking机制,简单任务节省93.7%token,复杂任务可自主工作7小时以上。深度解析核心技术架构与SWE-Bench表现,及其对开发者工作方式的根本性改变。
GPT-5-Codex
OpenAI
AI编程
Dynamic Thinking
Codex
SWE-Bench
自主编程
Agent
CSS 2026 新特性深度解析:从锚点定位到瀑布流布局,前端开发迎来纯 CSS 解决方案时代
编程
CSS 2026 新特性深度解析:从锚点定位到瀑布流布局,前端开发迎来纯 CSS 解决方案时代
2026-04-21 10:51:18 +0800 CST
view 552
深度解析 CSS 2026 核心新特性:锚点定位彻底替代 Popper.js、原生瀑布流布局告别 JavaScript 库、滚动驱动动画实现零 JS 滚动效果。包含完整代码示例、性能对比和浏览器兼容性方案。
CSS
前端
Web开发
Anchor Positioning
Masonry
Scroll Animation
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 554
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 700
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
Elasticsearch写入、读取、更新、删除以及批量操作(Golang)
编程
Elasticsearch写入、读取、更新、删除以及批量操作(Golang)
2024-11-18 17:43:54 +0800 CST
view 2234
本文介绍了Elasticsearch的基础操作,包括创建、删除、更新、查询和批量操作等。使用三方包`github.com/olivere/elastic`能有效降低开发成本,提升工作效率。文中提供了详细的代码示例,展示如何在Golang中实现这些操作,适合需要处理数据和检索的开发者参考。
Elasticsearch
Golang
数据处理
开发工具
LLM推理引擎深度实战:从PagedAttention到生产级部署,万字长文吃透2026年最关键的AI基础设施
编程
LLM推理引擎深度实战:从PagedAttention到生产级部署,万字长文吃透2026年最关键的AI基础设施
2026-06-27 12:44:29 +0800 CST
view 66
2026年LLM推理引擎深度实战:从PagedAttention、连续批处理、量化技术到生产级K8s部署,万字长文覆盖vLLM、SGLang、TensorRT-LLM、TGI四大框架架构原理与实测对比
LLM推理
vLLM
PagedAttention
SGLang
推理优化
TensorRT-LLM
生产部署
KV Cache
量化
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
编程
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
2026-04-16 19:11:21 +0800 CST
view 491
LangChain4j是Java世界的LangChain,简化Java应用集成大语言模型,支持OpenAI/Claude/DeepSeek等模型,提供RAG、Agent、Tool Calling、Memory等完整能力,Apache 2.0协议。
Java
LangChain
AI
LLM
RAG
Agent
开源
工具调用
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 205
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
Helidon 4.4:当 Java 微服务框架开始"长脑子",AI 编排不再是 Python 专利
编程
Helidon 4.4:当 Java 微服务框架开始"长脑子",AI 编排不再是 Python 专利
2026-04-08 15:04:17 +0800 CST
view 559
Oracle Helidon 4.4.0 引入 AI Agent 编排能力,Java 微服务框架进入 AI 原生时代。深度解析 Workflows、Dynamic Agents 两种执行模式,完整代码实战。
Helidon
Java
AI Agent
LangChain4j
微服务
超越 OpenClaw 的 Agent 新王:Hermes Agent 自进化闭环架构深度解析
编程
超越 OpenClaw 的 Agent 新王:Hermes Agent 自进化闭环架构深度解析
2026-04-17 19:45:47 +0800 CST
view 439
深度解析 Nous Research 开源的 Hermes Agent,从四层记忆系统、自进化闭环、平台无关核心架构等角度全面剖析这个 2026 年最火的开源 AI Agent 项目,并对比 OpenClaw 的技术路线差异
AI Agent
Hermes Agent
Nous Research
自我进化
四层记忆
开源项目
GitHub Trending
OmniVoice 深度实战:当小米 k2-fsa 团队用扩散语言模型重塑语音合成——从零样本克隆到 600 语言高保真 TTS 的生产级完全指南(2026)
编程
OmniVoice 深度实战:当小米 k2-fsa 团队用扩散语言模型重塑语音合成——从零样本克隆到 600 语言高保真 TTS 的生产级完全指南(2026)
2026-06-15 14:21:23 +0800 CST
view 314
深入解析小米 k2-fsa 团队开源的 OmniVoice 单阶段扩散语言模型 TTS 系统,0.8B 参数支持 600+ 语言,零样本克隆仅需 3-10 秒参考音频,RTF 低至 0.025,Apache-2.0 免费商用。
TTS
语音合成
OmniVoice
k2-fsa
扩散模型
零样本克隆
多语言
MachineLearning
Audio
小米
Cognee 深度实战:当 AI Agent 装上持久化记忆——从向量搜索到知识图谱的生产级完全指南(2026)
编程
Cognee 深度实战:当 AI Agent 装上持久化记忆——从向量搜索到知识图谱的生产级完全指南(2026)
2026-06-09 23:18:18 +0800 CST
view 181
深度解析开源项目 Cognee 如何通过向量搜索与知识图谱的融合,为 AI Agent 提供持久化、动态化的记忆能力。从核心概念、架构设计到生产级代码实战。
AI Agent
记忆系统
知识图谱
向量搜索
Cognee
Python
LangChain
n8n 深度实战:从工作流自动化引擎到 AI Agent 编排平台——源码架构、生产部署与性能优化的完整指南(2026)
编程
n8n 深度实战:从工作流自动化引擎到 AI Agent 编排平台——源码架构、生产部署与性能优化的完整指南(2026)
2026-06-28 19:13:10 +0800 CST
view 60
n8n 深度实战:从源码架构、执行引擎、AI Agent 集成、生产级 Docker 部署、性能优化到安全架构,12000 字完整指南(2026)
n8n
工作流自动化
AI Agent
LangChain
RAG
低代码
TypeScript
Node.js
自托管
生产部署
AI Agent长期记忆工程实战:从语义向量到生产级记忆系统的完整落地
编程
AI Agent长期记忆工程实战:从语义向量到生产级记忆系统的完整落地
2026-06-29 04:44:18 +0800 CST
view 43
深入探讨如何为AI Agent构建持久化、可检索、分层管理的长期记忆系统,从向量数据库选型到LangChain生产级集成,附带完整Python代码。
AI Agent
长期记忆
向量数据库
Qdrant
LangChain
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
9
10
11
12
13
...
36
下一页