程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
编程
METATRON 深度解析:当 AI 渗透测试在本地跑出「免费版 GPT-4 安全助手」
2026-04-09 07:55:23 +0800 CST
view 790
深度解析 METATRON:如何在本地零成本跑起一个完整的 AI 渗透测试助手,基于 Qwen 微调模型 + Ollama + MariaDB,无需 API Key,数据完全不出本地。
AI渗透测试
Ollama
Qwen
本地大模型
MariaDB
Pentest
安全工具
Agent
AstronClaw 深度解析:科大讯飞如何用软硬一体架构让AI Agent走进物理世界
编程
AstronClaw 深度解析:科大讯飞如何用软硬一体架构让AI Agent走进物理世界
2026-04-19 07:17:09 +0800 CST
view 472
深度解析科大讯飞AstronClaw软硬一体AI Agent架构,从技术原理到应用场景全面剖析,探讨AI Agent如何突破屏幕限制走进物理世界。
AstronClaw
科大讯飞
AI Agent
软硬一体
智能体
星火大模型
Loomy
GlassClaw
SkillHub
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
2026-06-11 03:16:24 +0800 CST
view 123
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
编程
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
2026-06-11 03:17:21 +0800 CST
view 137
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
OpenHarness 深度解析:当 1.1 万行 Python 把闭源巨头的 51.2 万行代码「压缩」成开源自由
编程
OpenHarness 深度解析:当 1.1 万行 Python 把闭源巨头的 51.2 万行代码「压缩」成开源自由
2026-04-11 06:59:04 +0800 CST
view 554
港大开源 OpenHarness,用 1.1 万行 Python 实现 Claude Code 98% 核心能力,体积缩小 44 倍,完全开源免费,模型无关。深度解析其 10 大子系统架构、工具系统、记忆系统、安全治理等核心模块。
AI Agent
开源
Python
Claude Code
香港大学
大模型
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 296
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
编程
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
2026-04-21 07:57:28 +0800 CST
view 478
Kimi K2.6开源发布,SWE-Bench Pro 58.6分超越GPT-5.4和Claude Opus 4.6,300个子Agent并行4000步骤持续5天
Kimi
开源
AI编程
Agent
月之暗面
SWE-Bench
大模型
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 479
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 710
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
微软Build 2026全解析:自研MAI模型矩阵、Scout Agent与Agent优先战略大转身
编程
微软Build 2026全解析:自研MAI模型矩阵、Scout Agent与Agent优先战略大转身
2026-06-05 03:13:37 +0800 CST
view 405
深度解析微软Build 2026开发者大会:7款自研MAI模型矩阵、Scout Agent、Project Solara与Windows Agent优先战略,从开发者视角分析微软分手OpenAI的战略意图。
Microsoft,Build2026,MAI,AI模型,Scout,Agent,GitHubCopilot,VSCode
GPT-Image-2深度解析:让AI先思考再画图,一句话生成专业级视觉内容
编程
GPT-Image-2深度解析:让AI先思考再画图,一句话生成专业级视觉内容
2026-04-23 15:54:58 +0800 CST
view 313
2026年4月22日OpenAI发布GPT-Image-2,以1512分登顶Arena.AI图像榜单,断层领先第二名Google Nano-banana-2达242分。它是全球首个具备思考能力的图像生成模型:联网搜索+规划布局+自我复核,三步智能流水线让AI先想后画。
GPT-Image-2
OpenAI
图像生成
AI绘图
自回归模型
Arena评测
Onyx 深度解析:当开源 AI 平台重新定义企业级智能中台
编程
Onyx 深度解析:当开源 AI 平台重新定义企业级智能中台
2026-04-14 18:24:03 +0800 CST
view 398
深入解析 GitHub 26k Stars 的开源企业级 AI 平台 Onyx,涵盖 LLM-Agnostic 架构设计、混合检索+知识图谱 RAG 系统、定制化 Agent、多数据源连接器、企业级安全等核心能力
AI平台
RAG
开源
企业级
Onyx
Agent
多模型
Kubernetes
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
资讯
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
2026-04-23 21:18:45 +0800 CST
view 564
2026年4月23日,腾讯发布并开源新一代大模型混元Hy3preview,总参数295B、激活参数21B的MoE架构,支持256K超长上下文,推理效率提升40%,API最低1.2元/百万tokens。在复杂推理、代码与Agent能力上表现突出,接近GPT-5.4级别,数学推理创国内最高纪录。已接入腾讯云、元宝等多条产品线,并上架TokenHub。
人工智能
大模型
腾讯
开源
MoE
推理
代码生成
Agent
云计算
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
编程
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
2026-05-14 01:14:23 +0800 CST
view 321
ReAct框架是AI Agent的核心架构范式,通过Thought-Action-Observation循环实现智能推理与行动。本文深度解析其从字符串解析到原生Tool Calling的演进历程、LangGraph状态机架构、代码实战及最佳实践。
ReAct,AI Agent,TAO循环,Function Calling,LangGraph,大语言模型,深度学习,Python,机器学习,智能体
微软 Build 2026 深度实战:当「Agent 优先」时代全面降临——从 MAI 自研模型到 MXC 系统级沙箱的生产级完全指南(2026)
编程
微软 Build 2026 深度实战:当「Agent 优先」时代全面降临——从 MAI 自研模型到 MXC 系统级沙箱的生产级完全指南(2026)
2026-06-06 06:06:41 +0800 CST
view 365
微软Build 2026开发者大会全景深度解析:七款MAI自研模型、Scout智能体、MXC安全沙箱、Surface RTX Spark Dev Box、Project Solara全新设备平台的完整技术分析。
微软
Build 2026
MAI模型
AI Agent
MXC
GitHub Copilot
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
编程
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
2026-06-15 01:18:03 +0800 CST
view 88
2026年6月英伟达发布全球首款全模态物理AI世界模型Cosmos 3。本文从MoT混合架构、代码实战、Agent Skills工作流、性能分析、生产部署五个维度,带你彻底搞懂这个被业界定义为物理AI产业「安卓时刻」的技术突破。
NVIDIA
Cosmos 3
物理AI
世界模型
MoT架构
机器人
自动驾驶
深度学习
AI Agent
仿真
GuaDa AI:功能完备的AI Agent系统,支持MCP、Skills、多平台机器人
案例
GuaDa AI:功能完备的AI Agent系统,支持MCP、Skills、多平台机器人
2026-05-07 22:18:24 +0800 CST
view 372
GuaDa AI开源项目:功能完备的AI Agent系统,支持ReAct Agent、RAG知识库、MCP协议、Skills技能框架热插拔、多平台机器人(QQ/飞书/企业微信)。NestJS+Vue 3全栈TypeScript,SQLite+sqlite-vec轻量级部署
AI Agent
ReAct
MCP
Skills
RAG
多模型
NestJS
Vue 3
开源
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 58
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
GPT-5.5 深度实战:从原生全模态到 Agent 原生训练——OpenAI 两亿美元重跑预训练的架构解密与生产级调用完全指南(2026)
编程
GPT-5.5 深度实战:从原生全模态到 Agent 原生训练——OpenAI 两亿美元重跑预训练的架构解密与生产级调用完全指南(2026)
2026-05-31 08:51:02 +0800 CST
view 216
全面解密GPT-5.5三大核心技术突破:原生全模态架构、硬件协同设计、Agent原生训练目标。从架构原理到API调用,涵盖性能基准、成本分析、安全评估与生产级部署最佳实践。
GPT-5.5
OpenAI
AI大模型
Agent
API
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
编程
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
2026-04-28 08:19:25 +0800 CST
view 427
深度解析 DeepSeek V4:混合注意力机制、MoE 架构、100万token 上下文、Agent 能力,从技术原理到部署实战,全面剖析开源模型新天花板
DeepSeek
AI大模型
开源
长上下文
MoE
混合注意力
Agent
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
编程
微软 Build 2026 全景拆解:从MAI-Thinking-1零蒸馏推理到MXC安全沙箱,Agent优先时代的七款自研模型+量子芯片深度技术指南(2026)
2026-06-10 07:15:42 +0800 CST
view 107
微软Build 2026开发者大会全景技术拆解:MAI-Thinking-1稀疏MoE架构、MAI-Code-1-Flash代码生成、Scout多智能体、MXC内核级安全沙箱、Project Solara Agent Shell、Majorana 2量子芯片,从模型层到硬件层的完整分析
微软
Build 2026
MAI模型
GitHub Copilot
Agent
MXC
Project Solara
量子计算
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
编程
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
2026-04-09 05:15:20 +0800 CST
view 550
2026年4月4日,Anthropic正式封杀OpenClaw,30万虾农遭遇断粮危机。本文深度解析封杀背后的商业逻辑、ClawAegis安全防护体系,以及AI Agent时代的商业模式之争。
AI Agent
OpenClW
ClawAegis
Anthropic
大模型安全
开源智能体
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
2026-05-23 01:16:34 +0800 CST
view 261
2026年Google I/O大会深度解析:Gemini 3.5 Flash以289 tokens/s的输出速度4倍碾压竞品,从基准测试、技术架构到生产级Agent开发实战,全面解读谷歌Agentic AI战略。
Google I/O 2026
Gemini 3.5 Flash
AI编程
Agent开发
基准测试
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 1002
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
36
下一页