程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 415
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 399
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Agent-Reach 深度实战:当 AI Agent 学会「睁眼看世界」——从多后端路由架构到生产级全平台联网的工程革命(2026)
编程
Agent-Reach 深度实战:当 AI Agent 学会「睁眼看世界」——从多后端路由架构到生产级全平台联网的工程革命(2026)
2026-06-30 18:45:27 +0800 CST
view 62
深度解析Agent-Reach多后端路由架构,涵盖17个平台联网能力、生产级部署、MCP集成与最佳实践,约12000字
Agent-Reach
AI Agent
互联网访问
MCP
多后端路由
OpenCLI
Agent工具链
联网能力
OpenClaw
Claude Code
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
编程
Apache Doris 4.1 深度拆解:当实时数仓长出 AI 大脑——从向量检索到统一数据底座的全链路技术实战
2026-05-02 10:33:28 +0800 CST
view 480
深入拆解Apache Doris 4.1的技术内核:从FE/BE架构到存算分离、从原生向量检索到混合搜索、从RAG实战到生产部署,全方位解析实时数仓如何演化为AI时代统一数据底座
Apache Doris
向量检索
实时数仓
RAG
存算分离
OLAP
AI数据库
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
编程
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
2026-04-21 07:57:28 +0800 CST
view 593
Kimi K2.6开源发布,SWE-Bench Pro 58.6分超越GPT-5.4和Claude Opus 4.6,300个子Agent并行4000步骤持续5天
Kimi
开源
AI编程
Agent
月之暗面
SWE-Bench
大模型
Oracle AI Database 26ai 深度实战:当五十年的关系数据库长出 AI 的骨骼——从向量搜索到 Agentic AI、Autonomous Lakehouse 的完整拆解(2026)
编程
Oracle AI Database 26ai 深度实战:当五十年的关系数据库长出 AI 的骨骼——从向量搜索到 Agentic AI、Autonomous Lakehouse 的完整拆解(2026)
2026-06-17 18:22:45 +0800 CST
view 194
2026 年 Oracle 26ai 深度解析:从 VECTOR 数据类型到向量索引(IVF/HNSW)、Select AI Agent、Private Agent Factory、Unified Memory Core、Autonomous Lakehouse、Iceberg 原生支持、自动调优到 Deep Data Security 与后量子加密,万字长文完整拆解架构变革与生产落地
Oracle 26ai
Vector Search
AI Agent
Lakehouse
向量搜索
数据库
AI
自治数据库
万字深度解析百度 Unlimited OCR:当 R-SWA 遇见 MoE——3B 参数如何碾压端到端 OCR 全场(2026)
编程
万字深度解析百度 Unlimited OCR:当 R-SWA 遇见 MoE——3B 参数如何碾压端到端 OCR 全场(2026)
2026-07-01 03:42:17 +0800 CST
view 56
2026年6月百度开源Unlimited OCR,5天GitHub Star破万。深度解析R-SWA注意力机制、MoE架构、16倍视觉Token压缩,以及为何能将KV Cache从线性增长压成常数。
Unlimited OCR
OCR
R-SWA
MoE
百度
深度学习
计算机视觉
文档识别
KV Cache
AI-Scientist-v2 深度实战:当AI学会自己做科研——从Agentic Tree Search到Workshop-Level论文全自动生成(2026)
编程
AI-Scientist-v2 深度实战:当AI学会自己做科研——从Agentic Tree Search到Workshop-Level论文全自动生成(2026)
2026-06-12 20:20:27 +0800 CST
view 234
2026年3月,AI生成的论文登上了Nature。本文深度拆解The AI Scientist-v2系统,从Agentic Tree Search算法到端到端智能体架构,结合代码实战,完整讲解AI自主做科研的技术全貌。
AI科研
自动化科研
AI-Scientist
Agentic Tree Search
科研自动化
PostgreSQL:从关系数据库到万能数据平台——扩展生态如何让 PG 吞掉一切场景
编程
PostgreSQL:从关系数据库到万能数据平台——扩展生态如何让 PG 吞掉一切场景
2026-04-21 08:50:25 +0800 CST
view 456
深度解析 PostgreSQL 如何通过六大扩展覆盖向量搜索、HTAP、时序、地理空间、图数据库、消息队列全场景,含完整代码实战与性能优化方案
PostgreSQL
pgvector
pgvectorscale
pg_duckpipe
TimescaleDB
PostGIS
Apache AGE
pgmq
数据库
扩展
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
编程
告别"辅助驾驶":GPT-5-Codex如何用动态思考重新定义AI编程
2026-05-11 19:45:54 +0800 CST
view 464
GPT-5-Codex突破性引入Dynamic Thinking机制,简单任务节省93.7%token,复杂任务可自主工作7小时以上。深度解析核心技术架构与SWE-Bench表现,及其对开发者工作方式的根本性改变。
GPT-5-Codex
OpenAI
AI编程
Dynamic Thinking
Codex
SWE-Bench
自主编程
Agent
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
编程
AI Scientist-v2 深度解析:当人工智能学会「从零开始做科研」——Agentic Tree Search 如何改写科学发现的游戏规则
2026-04-12 15:55:06 +0800 CST
view 760
AI Scientist-v2 由 Sakana AI 联合牛津大学等机构研发,于 2026 年正式发表于 Nature,首次实现端到端科研自动化。其核心创新 Agentic Tree Search 让 AI 在 ML 领域生成论文通过 ICLR Workshop 双盲评审,获 6.33 分高于 55% 人类投稿。本文全面解析其系统架构、核心算法与未来方向。
AI Scientist
Sakana AI
Agentic Tree Search
科研自动化
AI Agent
LLM
Nature
万字深度解析 AI-Scientist-v2:当AI成为首席研究员——自动化科学发现的范式革命与工程化实践(2026)
编程
万字深度解析 AI-Scientist-v2:当AI成为首席研究员——自动化科学发现的范式革命与工程化实践(2026)
2026-07-01 05:43:08 +0800 CST
view 37
深度解析SakanaAI的AI-Scientist-v2系统:首个通过顶级会议评审的AI生成论文系统,涵盖Agentic Tree Search算法、系统架构、代码实战与性能分析
AI-Scientist-v2
自动化科学发现
Agentic Tree Search
LLM Agent
SakanaAI
科学研究自动化
AI研究
开源项目
花3块钱、2小时训练一个64M的"小破模型",能干啥?
编程
花3块钱、2小时训练一个64M的"小破模型",能干啥?
2026-04-21 09:05:56 +0800 CST
view 432
MiniMind:从零手写完整LLM训练流水线,64M参数,2小时+3块钱训练完成,支持预训练+SFT+RLHF+工具调用,适合Multi-Agent/自动化/端侧集成
开源
LLM
PyTorch
模型训练
MiniMind
AI
工具调用
RLHF
Archon 深度解析:当 AI 编码进入「工程化 Harness」时代——首个开源工作流引擎如何让 AI 编程从玄学变科学
编程
Archon 深度解析:当 AI 编码进入「工程化 Harness」时代——首个开源工作流引擎如何让 AI 编程从玄学变科学
2026-04-12 18:54:54 +0800 CST
view 496
Archon 是 GitHub 本周 16.7k 星的热门项目,首个开源 AI 编码 Harness 构建器。本文深度解析其设计理念、架构实现、核心特性,以及如何用 YAML 工作流让 AI 编程从玄学变科学。
AI编程
Archon
Claude Code
工作流引擎
编程工具
YAML
万字深度解析 DeepSeek V4:当 1.6 万亿参数遇见 DSA 稀疏注意力——开源大模型如何让 API 账单暴降 95%(2026)
编程
万字深度解析 DeepSeek V4:当 1.6 万亿参数遇见 DSA 稀疏注意力——开源大模型如何让 API 账单暴降 95%(2026)
2026-07-01 07:13:58 +0800 CST
view 68
2026年4月DeepSeek V4发布,1.6万亿参数+百万上下文+SWE-Bench 80.6%,API成本暴降95%。深度解析DSA稀疏注意力、MoE架构、生产级部署实战。
DeepSeek V4
DSA 稀疏注意力
MoE 架构
百万上下文
开源大模型
API 成本优化
大模型部署
Agent 能力
SWE-Bench
DeepSeek
OpenSSL 4.0 深度解析:ECH 加密握手与后量子密码学的双重革命
编程
OpenSSL 4.0 深度解析:ECH 加密握手与后量子密码学的双重革命
2026-05-12 01:18:07 +0800 CST
view 485
深度解析OpenSSL4.0三大核心升级:ECH加密整个TLS握手消除SNI隐私泄露、ML-DSA-MU与RFC8998后量子国密混合算法套件实现量子安全、cSHAKE可定制哈希函数防止重放攻击,附完整C/Python/Go多语言迁移实战与ECH部署指南
OpenSSL,TLS,ECH,后量子密码学,ML-DSA-MU,RFC8998,SM2,SM3,SM4,cSHAKE,隐私保护,国密算法,迁移指南
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 569
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
Hermes Agent 深度解析:当 AI 学会「自我进化」——从四层记忆架构到技能自生成的工程全解
编程
Hermes Agent 深度解析:当 AI 学会「自我进化」——从四层记忆架构到技能自生成的工程全解
2026-04-13 02:56:20 +0800 CST
view 1361
深度解析Hermes Agent的工程实现:四层记忆架构(SQLite+FTS5)、技能自生成闭环、与OpenClaw的本质对比,以及这条「自我进化」路线对AI工具链未来的意义。
AI Agent
Hermes Agent
自我进化
记忆架构
Nous Research
技能系统
SQLite
机器学习
Hermes Agent 深度解析:开源自进化 AI 智能体的架构设计与工程实践
编程
Hermes Agent 深度解析:开源自进化 AI 智能体的架构设计与工程实践
2026-04-21 13:52:16 +0800 CST
view 524
深入剖析Hermes Agent的三层记忆系统与自进化闭环设计,探讨开源自进化AI智能体的架构原理与工程实践
AI Agent
Hermes Agent
Nous Research
自进化
记忆系统
Hermes Agent 深度解析:47K Star 的自进化 AI 智能体框架——从 GEPA 进化引擎到跨会话持久记忆的全链路技术实战
编程
Hermes Agent 深度解析:47K Star 的自进化 AI 智能体框架——从 GEPA 进化引擎到跨会话持久记忆的全链路技术实战
2026-05-03 22:57:07 +0800 CST
view 420
深度拆解 Hermes Agent 的六大技术支柱:GEPA 自我进化引擎、FTS5 持久记忆、技能自动学习、200+ 模型零锁定、15+ 平台网关、企业级安全体系,附完整部署教程与生产实践。
Hermes Agent
AI Agent
自进化
Nous Research
GEPA
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 715
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
Django 6.1 深度实战:当二十年老牌框架学会「按需加载」——从 Fetch Mode 到数据库级级联删除、多Mailer 架构与生产级迁移的完全指南(2026)
编程
Django 6.1 深度实战:当二十年老牌框架学会「按需加载」——从 Fetch Mode 到数据库级级联删除、多Mailer 架构与生产级迁移的完全指南(2026)
2026-06-18 07:56:48 +0800 CST
view 127
Django 6.1 三大核心特性深度实战:Fetch Mode 自动消除 N+1 查询、数据库级 on_delete 高效级联删除、MAILERS 多通道邮件架构,含原理剖析、代码实战与生产级迁移指南
Django
Python
ORM
Fetch Mode
on_delete
MAILERS
Web开发
EchoBird百灵鸟:2.2K Star开源AI桌面客户端,一个工具搞定所有AI Agent的安装配置与管理
编程
EchoBird百灵鸟:2.2K Star开源AI桌面客户端,一个工具搞定所有AI Agent的安装配置与管理
2026-06-18 08:34:13 +0800 CST
view 334
EchoBird(百灵鸟)是2200+ Star的开源AI桌面客户端,基于Tauri+Rust,图形界面一键安装管理12+ AI Agent工具(Claude Code/Codex/OpenClaw/Aider等),Model Nexus统一配置模型,内置llama.cpp/vLLM本地推理引擎,一键启动本地大模型。
EchoBird
AI桌面客户端
Agent管理
Tauri
Rust
开源
本地大模型
AI工具管理
百灵鸟
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
编程
Ruflo 深度解析:39K Star 的 AI Agent 编排平台,如何用 Rust + WASM 重塑多智能体协作的工程范式
2026-05-04 16:23:37 +0800 CST
view 644
深度解析 Ruflo Agent 编排平台:100+专业化Agent、SONA自学习神经网络、HNSW向量记忆、Swarm群体协调、零信任联邦协作。从架构设计到代码实战,全面剖析多智能体协作的工程范式。
AI Agent
Rust
WASM
Multi-Agent
Architecture
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
12
13
14
15
16
...
29
下一页