程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 157
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
Helidon 4.4:当 Java 微服务框架开始"长脑子",AI 编排不再是 Python 专利
编程
Helidon 4.4:当 Java 微服务框架开始"长脑子",AI 编排不再是 Python 专利
2026-04-08 15:04:17 +0800 CST
view 512
Oracle Helidon 4.4.0 引入 AI Agent 编排能力,Java 微服务框架进入 AI 原生时代。深度解析 Workflows、Dynamic Agents 两种执行模式,完整代码实战。
Helidon
Java
AI Agent
LangChain4j
微服务
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
编程
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
2026-04-08 15:51:53 +0800 CST
view 1508
深度对比SGLang与vLLM两大LLM推理框架,从架构设计、核心原理、性能实测、适用场景多维度解析,附2026年选型建议
LLM
SGLang
vLLM
推理优化
大模型
OmniVoice 深度实战:当小米 k2-fsa 团队用扩散语言模型重塑语音合成——从零样本克隆到 600 语言高保真 TTS 的生产级完全指南(2026)
编程
OmniVoice 深度实战:当小米 k2-fsa 团队用扩散语言模型重塑语音合成——从零样本克隆到 600 语言高保真 TTS 的生产级完全指南(2026)
2026-06-15 14:21:23 +0800 CST
view 256
深入解析小米 k2-fsa 团队开源的 OmniVoice 单阶段扩散语言模型 TTS 系统,0.8B 参数支持 600+ 语言,零样本克隆仅需 3-10 秒参考音频,RTF 低至 0.025,Apache-2.0 免费商用。
TTS
语音合成
OmniVoice
k2-fsa
扩散模型
零样本克隆
多语言
MachineLearning
Audio
小米
Cognee 深度实战:当 AI Agent 装上持久化记忆——从向量搜索到知识图谱的生产级完全指南(2026)
编程
Cognee 深度实战:当 AI Agent 装上持久化记忆——从向量搜索到知识图谱的生产级完全指南(2026)
2026-06-09 23:18:18 +0800 CST
view 147
深度解析开源项目 Cognee 如何通过向量搜索与知识图谱的融合,为 AI Agent 提供持久化、动态化的记忆能力。从核心概念、架构设计到生产级代码实战。
AI Agent
记忆系统
知识图谱
向量搜索
Cognee
Python
LangChain
你的超级大脑跑在你自己的机器上:MateClaw开源多智能体AI平台
编程
你的超级大脑跑在你自己的机器上:MateClaw开源多智能体AI平台
2026-04-28 03:31:17 +0800 CST
view 536
MateClaw(太一)是Java/Spring Boot构建的开源多智能体AI平台。核心特性:14+家供应商自动故障转移、LLM Wiki知识管理、五种入口(Web/桌面/嵌入/IM/SDK)、RBAC多用户管理。与OpenClaw、Hermes Agent、Claude Code、Cursor对比分析。
AI Agent
开源项目
多智能体
Spring Boot
企业级
io_uring + BPF 深度实战:BPF 程序进驻内核事件循环——从异步 I/O 演进到自定义内核执行引擎的全链路解析
编程
io_uring + BPF 深度实战:BPF 程序进驻内核事件循环——从异步 I/O 演进到自定义内核执行引擎的全链路解析
2026-05-09 02:08:06 +0800 CST
view 388
深度解析 2026 年 Linux 内核里程碑变更:io_uring + BPF struct_ops 的融合,BPF 程序正式进驻内核事件循环,零 syscall 开销的极致异步 I/O 性能。
io_uring
BPF
eBPF
Linux内核
异步IO
系统编程
性能优化
高并发
Gemma MacOS Tuner 深度解析:在 Apple Silicon 上用 PyTorch 和 MPS 高效微调多模态 Gemma
编程
Gemma MacOS Tuner 深度解析:在 Apple Silicon 上用 PyTorch 和 MPS 高效微调多模态 Gemma
2026-04-09 01:14:39 +0800 CST
view 920
详解 gemma-tuner-multimodal 项目:在 Apple Silicon 上通过 PyTorch MPS 后端对 Google Gemma 系列模型进行 LoRA 微调,支持文本、图像、音频三种模态,完全本地运行,数据不出机器,零 NVIDIA GPU 依赖。
Gemma
Apple Silicon
PyTorch
MPS
LoRA
微调
Machine Learning
使用 Gomail 在 Go 语言中轻松实现邮件发送功能及 Mailtrap 测试指南
编程
使用 Gomail 在 Go 语言中轻松实现邮件发送功能及 Mailtrap 测试指南
2024-11-18 21:14:22 +0800 CST
view 3224
本文介绍了如何在Go语言中使用Gomail库实现邮件发送功能,并提供了Mailtrap测试指南。Gomail以其易用性和高可靠性被广泛应用,适合集成邮件通知。文中包含了安装步骤、代码示例及SMTP配置,帮助开发者快速上手邮件发送功能,并通过Mailtrap进行测试,确保邮件功能的正常运行。
Golang
邮件服务
开发工具
DeerFlow 2.0 深度实战:从 LangGraph 中间件链到 Docker 沙箱的超级智能体架构全解
编程
DeerFlow 2.0 深度实战:从 LangGraph 中间件链到 Docker 沙箱的超级智能体架构全解
2026-05-09 04:41:16 +0800 CST
view 395
深度解析字节跳动开源的超级智能体运行时DeerFlow 2.0,从18层中间件链到Docker沙箱隔离,从Lead Agent协调到渐进式技能加载,完整剖析其技术架构与生产级部署实践
AI Agent
DeerFlow
LangGraph
Docker
字节跳动
智能体架构
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 365
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
DeerFlow 2.0 深度解析:字节跳动开源超级智能体运行时——从 LangGraph 重构到生产级 Agent 基础设施的技术革命
编程
DeerFlow 2.0 深度解析:字节跳动开源超级智能体运行时——从 LangGraph 重构到生产级 Agent 基础设施的技术革命
2026-05-15 23:46:24 +0800 CST
view 420
DeerFlow 2.0完整架构解析:从LangGraph重构到生产级Agent基础设施,深入讲解沙箱执行、技能系统、长期记忆、子代理并行、MCP集成等核心技术。
AI Agent
DeerFlow
LangGraph
字节跳动
开源
DeerFlow 2.0 深度实战:从「对话机器人」到「可进化超级智能体」——字节跳动开源超级 Agent 运行时的架构设计与生产级实践
编程
DeerFlow 2.0 深度实战:从「对话机器人」到「可进化超级智能体」——字节跳动开源超级 Agent 运行时的架构设计与生产级实践
2026-05-22 10:29:50 +0800 CST
view 546
深度解析字节跳动开源的超级智能体运行时框架DeerFlow 2.0,从多层记忆架构、Supervisor-Worker多Agent协作到Docker沙箱隔离,全面拆解其工程设计细节与生产实践。
AI Agent
DeerFlow
字节跳动
多智能体
LangChain
沙箱
上下文工程
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
编程
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
2026-04-09 04:54:56 +0800 CST
view 689
Google于2026年4月发布Gemma 4开源模型系列,首次全面切换Apache 2.0许可证,搭载Per-Layer Embedding架构创新,26B MoE以3.8B激活参数击败Qwen3-235B。本文深度解析PLE架构、稀疏激活机制与全规格产品矩阵。
Gemma 4
Google
开源模型
Apache 2.0
MoE
Per-Layer Embedding
本地优先的 AI 记忆系统 MemPalace 深度解析:96.6% R@5 背后的架构设计
编程
本地优先的 AI 记忆系统 MemPalace 深度解析:96.6% R@5 背后的架构设计
2026-04-28 12:24:56 +0800 CST
view 495
深度解析 MemPalace 源码:从宫殿记忆隐喻、存储后端抽象、ONNX embedding 加速、LLM closet 生成到 entity 检测,完整剖析 96.6% R@5 背后的工程设计。
AI
记忆系统
向量数据库
ONNX
Embedding
Python
ChromaDB
开源
.NET 11 Preview 4 深度实战:Runtime-Async 革命、Process API 重生、MCP Server 模板——微软如何用一次预览版重新定义后端开发范式
编程
.NET 11 Preview 4 深度实战:Runtime-Async 革命、Process API 重生、MCP Server 模板——微软如何用一次预览版重新定义后端开发范式
2026-05-16 09:44:07 +0800 CST
view 317
.NET 11 Preview 4 深度解析:Runtime-Async 全面启用、Process API 大规模扩展、MCP Server 模板、EF Core 向量搜索、Blazor 电路暂停恢复
.NET 11
Runtime-Async
ASP.NET Core
MCP
EF Core
Process API
Blazor
Redis 8.8 深度实战:当原生 Array 数据结构遇见生产级缓存革命——从 INCREX 原子限流到子键通知的完全指南(2026)
编程
Redis 8.8 深度实战:当原生 Array 数据结构遇见生产级缓存革命——从 INCREX 原子限流到子键通知的完全指南(2026)
2026-06-16 17:23:59 +0800 CST
view 98
Redis 8.8 深度解读:原生 Array 数据结构填补十五年空白,INCREX 原子限流、XNACK 主动失败标记、子键通知等新特性从架构原理到生产级实战的完全指南
Redis
Redis 8.8
缓存
数据结构
性能优化
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 572
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
ds4 深度实战:当 Redis 之父用纯 C 重写本地推理引擎——从 KV 缓存磁盘持久化到 Metal 极致优化的完全指南
编程
ds4 深度实战:当 Redis 之父用纯 C 重写本地推理引擎——从 KV 缓存磁盘持久化到 Metal 极致优化的完全指南
2026-06-11 07:51:35 +0800 CST
view 205
Redis之父antirez新作ds4深度解析:非对称2-bit量化、KV缓存磁盘持久化、Metal极致优化,284B模型在MacBook上跑出26 tok/s的完全指南
ds4
DeepSeek
本地推理
Metal
KV缓存
量化
antirez
Redis
Redis 8 深度解析:开源缓存的「性能狂飙」与「One Redis」革命
编程
Redis 8 深度解析:开源缓存的「性能狂飙」与「One Redis」革命
2026-05-12 02:25:32 +0800 CST
view 339
深度解析Redis 8的核心突破:One Redis理念将所有模块内置告别碎片化、I/O线程机制重写让吞吐量提升112%(8线程)、30项性能优化让命令延迟最高降低87%、内存优化让Hash表占用-16.7%有序集合-30.5%、新增8种数据结构(Vector Set/JSON/Time Series/概率结构)、Redis Query Engine查询处理能力16倍提升、Redis 8.6新增热键检测HOTKEYS与LRM逐出策略
Redis8,缓存,性能优化,OneRedis,数据结构,内存优化,I/O线程,全文搜索,向量搜索,热键检测
React Doctor 深度解析:当 AI 写的 React 代码比人类还烂,谁来当主治医师
编程
React Doctor 深度解析:当 AI 写的 React 代码比人类还烂,谁来当主治医师
2026-05-12 03:13:55 +0800 CST
view 522
深度解析React Doctor:AI编程助手生成代码质量诊断工具,0-100健康评分、60+Lint规则、死代码检测、AI Agent集成50+工具、oxlint+ESLint双引擎、GitHub Actions CI/CD、框架自动检测、程序化API
ReactDoctor,React代码质量,AI编程,Million.js,oxlint,ESLint,代码健康分,死代码检测,Lint规则,GitHubActions,ClaudeCode,Cursor集成
Redis 8.0 深度解析:30项性能飞跃、8种新数据结构与重回开源的破局之路
编程
Redis 8.0 深度解析:30项性能飞跃、8种新数据结构与重回开源的破局之路
2026-05-12 18:40:32 +0800 CST
view 270
深度解析Redis 8.0最新版本核心变化:命令延迟降低87%、吞吐量提升112%、新增8种数据结构(向量集/JSON/时序/概率结构)、重回BSD开源、I/O线程重构、Query Engine提升16倍。含架构解析与代码实战。
Redis8,Redis新版本,向量数据库,JSON数据结构,内存数据库,性能优化,开源
refine 深度解析:35K Star 的 AI 低代码框架,让企业级 B 端应用开发提速 3 倍
编程
refine 深度解析:35K Star 的 AI 低代码框架,让企业级 B 端应用开发提速 3 倍
2026-05-06 08:13:17 +0800 CST
view 476
refine 是基于 React 的开源前端框架,34K Star,专为快速开发企业级 B 端应用设计。零配置 CRUD、原生 AI 集成、模块化架构、Headless 设计不绑定 UI 库。
refine
React
低代码
企业级
AI
TypeScript
告别笨重 CAD:Claude 写出来的 3D 建筑编辑器,浏览器打开就能用
资讯
告别笨重 CAD:Claude 写出来的 3D 建筑编辑器,浏览器打开就能用
2026-04-24 07:27:07 +0800 CST
view 528
PascalEditor是一款由ClaudeAI参与开发的WebGPU3D建筑编辑器,开源免费、浏览器直接运行、性能流畅。本文深入分析其技术架构(WebGPU、ReactThreeFiber、脏节点追踪、Monorepo分层设计)、核心特性(零门槛免安装、完全免费开源、AI参与开发)、与主流工具(酷家乐、SketchUp、AutoCAD/Revit)的对比,以及它所代表的AI编程新范式。适合装修房主、设计师、前端开发者及创业团队使用。
WebGPU
ReactThreeFiber
AI编程
开源3D工具
Claude
前端图形学
建筑可视化
MIT协议
3D编辑器
浏览器应用
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
24
25
26
27
28
...
54
下一页