程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
微软 Build 2026 深度实战:当「Agent 优先」时代全面降临——从 MAI 自研模型到 MXC 系统级沙箱的生产级完全指南(2026)
编程
微软 Build 2026 深度实战:当「Agent 优先」时代全面降临——从 MAI 自研模型到 MXC 系统级沙箱的生产级完全指南(2026)
2026-06-06 06:06:41 +0800 CST
view 562
微软Build 2026开发者大会全景深度解析:七款MAI自研模型、Scout智能体、MXC安全沙箱、Surface RTX Spark Dev Box、Project Solara全新设备平台的完整技术分析。
微软
Build 2026
MAI模型
AI Agent
MXC
GitHub Copilot
GLM-5.2 深度实战:当国产大模型拿下 Code Arena 全球第一——从 744B MoE 架构到 1M 上下文、从 DSA 稀疏注意力到 Agentic Engineering 的生产级完全指南(2026)
编程
GLM-5.2 深度实战:当国产大模型拿下 Code Arena 全球第一——从 744B MoE 架构到 1M 上下文、从 DSA 稀疏注意力到 Agentic Engineering 的生产级完全指南(2026)
2026-06-19 15:54:07 +0800 CST
view 230
2026年6月17日,智谱AI正式开源GLM-5.2,在Code Arena拿下全球可用模型第一。本文深度解析744B MoE架构、DSA稀疏注意力、1M上下文实现原理,并提供完整代码实战指南。
GLM-5.2
大模型
AI编程
智谱AI
MoE架构
稀疏注意力
CodeArena
OpenAI Jalapeño 芯片深度解析:从"借道英伟达"到"自建帝国",一颗"辣椒"如何重塑 AI 算力格局
编程
OpenAI Jalapeño 芯片深度解析:从"借道英伟达"到"自建帝国",一颗"辣椒"如何重塑 AI 算力格局
2026-06-27 10:43:27 +0800 CST
view 113
2026年6月24日OpenAI发布首款自研AI推理芯片Jalapeño,从架构设计到流片仅用9个月。本文深度解析这颗ASIC的技术架构、数据流设计、AI辅助芯片工程、对英伟达的影响以及整个AI算力产业格局的重塑。
OpenAI,Jalapeño,AI芯片,ASIC,博通,Broadcom,LLM推理,AI基础设施,半导体,大模型
Kimi K2.7 Code 深度实战:当国产开源编程模型把长上下文 Agent 能力拉满——从 1T MoE 架构到 256K 上下文、从 MCP 工具调用到生产级代码助手的完全指南(2026)
编程
Kimi K2.7 Code 深度实战:当国产开源编程模型把长上下文 Agent 能力拉满——从 1T MoE 架构到 256K 上下文、从 MCP 工具调用到生产级代码助手的完全指南(2026)
2026-06-19 16:32:28 +0800 CST
view 256
月之暗面开源 Kimi K2.7 Code 深度解析:1T MoE、256K 上下文、MCP 工具调用、API 与本地部署实战,附完整代码示例。
Kimi
K2.7 Code
Moonshot
代码模型
开源
WebAssembly + WebGPU 深度实战:当浏览器成为高性能计算平台——从 WASM 组件模型到 GPU 通用计算的生产级完全指南(2026)
编程
WebAssembly + WebGPU 深度实战:当浏览器成为高性能计算平台——从 WASM 组件模型到 GPU 通用计算的生产级完全指南(2026)
2026-06-06 07:08:04 +0800 CST
view 383
深度解析 WebAssembly + WebGPU 协同架构,从 WASM 组件模型到 WebGPU Compute Shader,涵盖共享内存通信、性能优化、生产部署完整指南
WebAssembly
WebGPU
WASM
GPU计算
组件模型
WGSL
性能优化
Ollama v0.20 Tool Calling 深度解析:让本地大模型真正「动起手来」——从协议原理到生产级多工具 Agent 系统实战
编程
Ollama v0.20 Tool Calling 深度解析:让本地大模型真正「动起手来」——从协议原理到生产级多工具 Agent 系统实战
2026-07-03 08:43:53 +0800 CST
view 35
深度解析 Ollama v0.20 的 Tool Calling 能力:从 JSON Schema 协议原理、HTTP API 调用循环,到生产级多工具 Agent 系统的完整实战(天气查询/数据库查询/Web搜索),配套 LangChain4j 集成方案与安全防护策略。
Ollama
AI Agent
Tool Calling
本地大模型
LangChain4j
生产级实战
Ollama v0.20 Tool Calling 深度解析:本地 AI Agent 的最后一公里——JSON Schema 协议 × 生产级多工具实战 × 安全防护全指南
编程
Ollama v0.20 Tool Calling 深度解析:本地 AI Agent 的最后一公里——JSON Schema 协议 × 生产级多工具实战 × 安全防护全指南
2026-07-03 08:44:52 +0800 CST
view 36
深度解析 Ollama v0.20 的 Tool Calling 能力,从 JSON Schema 协议原理到生产级多工具 Agent 实战,含安全防护与性能基准测试。
Ollama
AI Agent
Tool Calling
本地大模型
LangChain4j
Ollama Tool Calling × 本地 AI Agent:JSON Schema 协议 × 生产级多工具系统 × 安全防护实战
编程
Ollama Tool Calling × 本地 AI Agent:JSON Schema 协议 × 生产级多工具系统 × 安全防护实战
2026-07-03 08:45:53 +0800 CST
view 31
深度解析 Ollama v0.20 Tool Calling,从协议原理到生产级多工具 Agent 实战,含天气查询、数据库查询、Web搜索三大实战案例与安全防护策略。
Ollama
AI Agent
Tool Calling
本地大模型
综合
Llama 3.1 Omni:颠覆性的文本与语音双输出模型
2024-11-19 09:57:33 +0800 CST
view 1867
Llama3.1Omni模型是一种创新的多模态语言模型,能够同时生成文本和语音,提升用户体验。它适用于客户服务、教育和医疗等多个领域,具有强大的推理能力和生成质量。该模型开源,易于使用,开发者可以根据需求进行定制。Llama3.1Omni的出现为AI应用带来了更智能和多样化的可能性,值得关注和应用。
人工智能
语言模型
多模态交互
开源技术
用户体验
【深度长文】Ollama v0.20 工具调用实战:本地大模型 + JSON Schema + 生产级 Agent 系统搭建指南(2026)
编程
【深度长文】Ollama v0.20 工具调用实战:本地大模型 + JSON Schema + 生产级 Agent 系统搭建指南(2026)
2026-07-03 08:47:18 +0800 CST
view 36
深度长文:Ollama v0.20 Tool Calling 从协议原理到生产级多工具 Agent 实战,含天气查询、数据库操作、Web搜索三大案例与安全防护策略(2026)。
Ollama
AI Agent
Tool Calling
本地大模型
生产级
LangBot:大模型原生IM机器人平台,一套接入QQ/企微/飞书,支持工具调用
编程
LangBot:大模型原生IM机器人平台,一套接入QQ/企微/飞书,支持工具调用
2026-04-16 17:09:50 +0800 CST
view 544
LangBot是开源的大模型原生IM机器人平台,26.3K Star,支持QQ/企微/飞书多平台接入,一次开发多端运行,支持工具调用和多轮对话,适合运营和客服场景。
AI
机器人
聊天机器人
IM
开源
大模型
多平台
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
编程
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
2026-05-19 12:42:27 +0800 CST
view 372
2026年,边缘AI不再只是云端模型的精简版。本文深入剖析DeepSeek-R1 CPU版的技术原理,从模型蒸馏、量化技术的底层原理到生产环境的完整部署方案,提供可直接落地的代码和可量化的性能数据。
DeepSeek
R1
边缘计算
AI推理
模型蒸馏
量化
llama.cpp
Ollama
端侧AI
5ire:MCP原生的跨平台桌面AI助手,支持本地知识库+多模型自由切换
编程
5ire:MCP原生的跨平台桌面AI助手,支持本地知识库+多模型自由切换
2026-04-16 19:04:26 +0800 CST
view 579
5ire是一款开源跨平台桌面AI助手(1.5K Stars),原生支持MCP协议,可接入多模型并构建本地知识库,支持docx/pdf/excel等文档向量化,适合隐私敏感场景。
AI
MCP
桌面助手
开源
知识库
RAG
多模型
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
综合
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
2024-11-18 19:34:19 +0800 CST
view 1974
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程。它提供多种工具,如集成梯度、SaliencyMap和DeepLift,帮助开发者理解模型对输入数据的依赖关系和特征重要性。Captum提升了模型的透明度和可解释性,适用于模型审查、优化和调试等场景。
深度学习
模型解释
机器学习
GLM-5.2 深度解析:百万上下文 + 异步Agent RL + MIT开源,国产大模型里程碑级突破
编程
GLM-5.2 深度解析:百万上下文 + 异步Agent RL + MIT开源,国产大模型里程碑级突破
2026-06-27 18:46:30 +0800 CST
view 169
智谱AI发布GLM-5.2旗舰开源大模型:744B MoE架构+40B激活参数、1M百万Token稳定上下文、异步Agent RL训练、IndexShare稀疏注意力将计算量降低2.9倍。SWE-bench Pro编程能力超越GPT-5.5,MIT协议完全开源。本文深度解析其技术架构、训练方法、性能评测与生产实践。
GLM-5.2
Z.ai
开源大模型
MoE
异步Agent RL
百万上下文
MIT协议
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
编程
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
2026-04-26 08:10:21 +0800 CST
view 572
深度解析DeepSeek-V4的技术突破:百万Token原生上下文、万亿级MoE架构、国产芯片适配。从技术原理到工程实践,全面剖析这场开源AI的革命。
DeepSeek
大模型
MoE
百万上下文
开源AI
ds4 (DwarfStar) 深度实战:当 Redis 之父学会「大模型量化」——从非对称 2-bit 量化到磁盘 KV 缓存的生产级完全指南(2026)
编程
ds4 (DwarfStar) 深度实战:当 Redis 之父学会「大模型量化」——从非对称 2-bit 量化到磁盘 KV 缓存的生产级完全指南(2026)
2026-06-15 00:18:14 +0800 CST
view 271
深度剖析 Redis 之父 antirez 的最新项目 ds4 (DwarfStar),专为 DeepSeek V4 Flash 设计的本地推理引擎。涵盖非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 优化、内置 Coding Agent 等核心技术。
ds4
DwarfStar
antirez
Redis
大模型推理
MoE架构
量化
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
编程
NVIDIA Cosmos 3 深度实战:当世界模型学会「理解、生成、模拟、行动」——从 MoT 混合架构到物理 AI 全链路的生产级完全指南(2026)
2026-06-15 01:18:03 +0800 CST
view 342
2026年6月英伟达发布全球首款全模态物理AI世界模型Cosmos 3。本文从MoT混合架构、代码实战、Agent Skills工作流、性能分析、生产部署五个维度,带你彻底搞懂这个被业界定义为物理AI产业「安卓时刻」的技术突破。
NVIDIA
Cosmos 3
物理AI
世界模型
MoT架构
机器人
自动驾驶
深度学习
AI Agent
仿真
VibeVoice深度实战:微软如何用扩散模型重塑语音合成的技术边界
编程
VibeVoice深度实战:微软如何用扩散模型重塑语音合成的技术边界
2026-05-19 19:14:43 +0800 CST
view 331
深度解析微软开源语音AI框架VibeVoice的技术架构,从双Tokenizer解耦到Next-Token扩散生成,支持90分钟长音频和4说话者。
AI
语音合成
扩散模型
VibeVoice
Kimi K2 系列深度实战:月之暗面开源编码大模型架构解析与生产级部署完全指南
编程
Kimi K2 系列深度实战:月之暗面开源编码大模型架构解析与生产级部署完全指南
2026-06-28 03:15:43 +0800 CST
view 144
深度解析月之暗面Kimi K2系列(K2.5/K2.6/K2.7 Code)的MoE架构、多模态能力、Token优化策略,附Ollama本地部署、OpenRouter API集成、OpenCode实战及Agent工作流完整代码。
Kimi K2
月之暗面
MoE架构
编码大模型
AI编程
Token优化
本地部署
OpenRouter
多模态
Agent工作流
GuaDa AI:功能完备的AI Agent系统,支持MCP、Skills、多平台机器人
案例
GuaDa AI:功能完备的AI Agent系统,支持MCP、Skills、多平台机器人
2026-05-07 22:18:24 +0800 CST
view 493
GuaDa AI开源项目:功能完备的AI Agent系统,支持ReAct Agent、RAG知识库、MCP协议、Skills技能框架热插拔、多平台机器人(QQ/飞书/企业微信)。NestJS+Vue 3全栈TypeScript,SQLite+sqlite-vec轻量级部署
AI Agent
ReAct
MCP
Skills
RAG
多模型
NestJS
Vue 3
开源
OpenSquilla 0.4.0 深度解析:AI 编码自我验证革命——从红绿回归证据链到隔离施工、从 Token 高效路由到生产级 Coding Agent 的完整技术指南(2026)
编程
OpenSquilla 0.4.0 深度解析:AI 编码自我验证革命——从红绿回归证据链到隔离施工、从 Token 高效路由到生产级 Coding Agent 的完整技术指南(2026)
2026-07-04 02:13:02 +0800 CST
view 40
2026年6月30日OpenSquilla 0.4.0发布,核心突破是把「自我验证」塞进AI编码Agent。深度解析红绿回归证据链、隔离施工机制、Token高效微内核架构、多模型路由,含完整实战代码与生产部署指南。
OpenSquilla
AI编码
自我验证
红绿回归
Agent
TDD
微内核
多模型路由
持久化记忆
沙箱隔离
百度 Unlimited OCR 深度解析:端到端长文档 OCR 的新范式——从 R-SWA 机制到 3B 参数模型、从 KV Cache 压缩到生产级部署的完整技术指南(2026)
编程
百度 Unlimited OCR 深度解析:端到端长文档 OCR 的新范式——从 R-SWA 机制到 3B 参数模型、从 KV Cache 压缩到生产级部署的完整技术指南(2026)
2026-07-04 03:13:57 +0800 CST
view 15
2026年6月百度开源Unlimited OCR,5天GitHub Star破1万。深度解析R-SWA机制、3B参数模型架构、KV Cache压缩原理,含完整部署代码与生产级应用案例。
百度
Unlimited OCR
OCR
R-SWA
KV Cache
长文档识别
端到端OCR
多模态模型
国产AI编程的"越级时刻":Qwen3.6-Plus凭什么硬刚Claude?
编程
国产AI编程的"越级时刻":Qwen3.6-Plus凭什么硬刚Claude?
2026-04-08 11:03:41 +0800 CST
view 666
阿里Qwen3.6-Plus发布,编程能力直逼Claude Opus 4.5,调用成本仅五分之一。深度解析国产AI模型的越级突破。
AI编程
大模型
国产AI
Qwen
Claude
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
7
8
9
10
11
下一页