程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
编程
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
2026-04-30 03:22:15 +0800 CST
view 562
深度解析 DeepSeek 开源的高性能 GPU 算子库 TileKernels:基于 TileLang DSL 用 80 行代码实现手写 CUDA 级性能,覆盖 MoE Gating/Routing、FP8/FP4 量化、Engram 门控等七大算子家族,首次原生支持 NVIDIA Blackwell 架构,并通过 TVM 编译器打通昇腾等国产芯片。
DeepSeek
TileKernels
GPU
CUDA
TileLang
MoE
算子优化
英伟达Nemotron 3 Nano Omni:一个模型搞定看听读写,智能体效率狂飙9倍
编程
英伟达Nemotron 3 Nano Omni:一个模型搞定看听读写,智能体效率狂飙9倍
2026-05-01 04:40:16 +0800 CST
view 409
英伟达发布Nemotron 3 Nano Omni开源多模态模型,30B-A3B MoE架构,统一视觉音频语言编码,吞吐量9倍提升,六大排行榜榜首,富士康甲骨文等已采用。
英伟达
多模态
开源
AI智能体
Nemotron
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当离散文本扩散颠覆自回归霸权——从并行去噪原理到 MoE 架构、本地推理优化与混合范式展望的生产级完全指南(2026)
2026-06-17 07:55:50 +0800 CST
view 91
Google开源DiffusionGemma:基于离散文本扩散的26B MoE模型,并行去噪实现4倍推理加速,双向注意力天然支持代码补全与行内编辑
DiffusionGemma
LLM
扩散模型
推理加速
MoE
Kimi K2.7 Code 深度实战:当 1 万亿参数 MoE 架构遇见编码 Agent——从 256K 超长上下文到 thinking-token 暴降 30% 的生产级完全指南(2026)
编程
Kimi K2.7 Code 深度实战:当 1 万亿参数 MoE 架构遇见编码 Agent——从 256K 超长上下文到 thinking-token 暴降 30% 的生产级完全指南(2026)
2026-06-17 08:28:27 +0800 CST
view 85
深度解析月之暗面Kimi K2.7 Code开源编程模型:1T MoE架构、256K超长上下文、thinking-token暴降30%的生产级完全指南。涵盖架构原理、API接入、本地部署、Agent集成、性能优化等全链路实战。
Kimi
K2.7
AI编程
MoE架构
长上下文
Agent
Mojo 深度解析:为 AI 基础而生的下一代系统编程语言——比 Python 快 68000 倍的秘密
编程
Mojo 深度解析:为 AI 基础而生的下一代系统编程语言——比 Python 快 68000 倍的秘密
2026-05-01 09:34:12 +0800 CST
view 391
深度解析 Mojo 语言:基于 MLIR 的 AI 基础设施编程语言,比 Python 快 68000 倍的秘密,从架构设计、编译原理、性能优化到代码实战的完整拆解
Mojo
AI
编译器
性能优化
MLIR
Kimi K2.7 Code 完全指南:当 1 万亿参数 MoE 遇见编码 Agent——256K 上下文×thinking-token 暴降 30% 的生产级实战(2026)
编程
Kimi K2.7 Code 完全指南:当 1 万亿参数 MoE 遇见编码 Agent——256K 上下文×thinking-token 暴降 30% 的生产级实战(2026)
2026-06-17 08:28:57 +0800 CST
view 97
深度解析月之暗面Kimi K2.7 Code开源编程模型:1T MoE架构、256K超长上下文、thinking-token暴降30%的生产级完全指南。涵盖架构原理、API接入、本地部署、Agent集成、性能优化等全链路实战。
Kimi
K2.7
AI编程
MoE架构
长上下文
Agent
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 368
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
Supermemory 深度实战:AI 时代的记忆引擎完全指南——从混合检索到知识图谱的架构全解析(2026)
编程
Supermemory 深度实战:AI 时代的记忆引擎完全指南——从混合检索到知识图谱的架构全解析(2026)
2026-06-03 03:46:07 +0800 CST
view 305
Supermemory 深度实战:从混合检索到知识图谱的架构全解析。GitHub 24,537 ⭐,单日 677 stars,LongMemEval 85.2% SOTA。完整代码示例,生产级部署。
AI Agent
Supermemory
记忆引擎
RAG
知识图谱
TypeScript
生产实战
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 1069
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
编程
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
2026-04-20 22:53:28 +0800 CST
view 949
复旦大学OpenMOSS团队开源的0.1B参数多语言TTS模型,纯CPU运行、支持零样本语音克隆、48kHz双声道、20种语言、流式推理,MacBook Air单核即可流畅运行
TTS
语音合成
语音克隆
AI
开源
CPU推理
OpenMOSS
微信小程序开发资源汇总
编程
微信小程序开发资源汇总
2026-05-11 16:11:29 +0800 CST
view 293
本文档汇总了微信小程序开发的官方资源(设计指南、开发教程、框架、组件、API、开发者工具)以及丰富的第三方工具、插件、组件和后端SDK。
微信小程序
开发资源
前端框架
UI组件
Demo示例
工具插件
DiffusionGemma 深度实战:当谷歌用图像扩散的逻辑重塑文本生成——从离散扩散原理到 4 倍推理加速的生产级完全指南(2026)
编程
DiffusionGemma 深度实战:当谷歌用图像扩散的逻辑重塑文本生成——从离散扩散原理到 4 倍推理加速的生产级完全指南(2026)
2026-06-17 23:28:33 +0800 CST
view 96
2026年6月谷歌开源DiffusionGemma,26B MoE参数仅激活3.8B,通过离散扩散实现4倍推理加速。本文从原理、架构、代码实战、性能优化全面深度解析这一范式级创新。
DiffusionGemma
谷歌
文本扩散
MoE
AI推理
Gemma
开源模型
离散扩散
并行生成
深度学习
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 504
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
Firefox Project Nova 深度实战:当二十五年老牌浏览器决心重做——从界面架构到隐私工程、Multi-Account 容器原生集成与生产级定制开发的完全指南(2026)
编程
Firefox Project Nova 深度实战:当二十五年老牌浏览器决心重做——从界面架构到隐私工程、Multi-Account 容器原生集成与生产级定制开发的完全指南(2026)
2026-06-18 06:59:50 +0800 CST
view 109
2026年6月Mozilla发布Firefox 152并公开Project Nova改版路线图,这是Firefox自Quantum以来最大规模的视觉与功能重塑。本文从架构分析、代码实战、性能优化等角度深入剖析Nova改版的技术细节。
Firefox
Mozilla
浏览器
隐私保护
Project Nova
HarmonyOS 7 深度实战:当操作系统学会「思考」——从Agent亲和架构到HMAF 2.0智能体框架的生产级开发完全指南(2026)
编程
HarmonyOS 7 深度实战:当操作系统学会「思考」——从Agent亲和架构到HMAF 2.0智能体框架的生产级开发完全指南(2026)
2026-06-13 09:54:08 +0800 CST
view 258
深度拆解HarmonyOS 7 Agent亲和架构、HMAF 2.0智能体框架、A2A/A2UI协议、openPangu 2.0大模型,含完整开发实战代码与性能优化指南
HarmonyOS
鸿蒙
Agent
HMAF
A2A
A2UI
MCP
华为
智能体
拒绝劝退!基于pi-mono的轻量级AI Agent学习神器LoongClaw
编程
拒绝劝退!基于pi-mono的轻量级AI Agent学习神器LoongClaw
2026-04-22 13:28:09 +0800 CST
view 564
OpenClaw太重?LoongClaw基于pi-mono架构的轻量级AI Agent学习神器,大道至简,聚焦Agent Loop本质,适合初学者和二次开发。
LoongClaw
pi-mono
AI Agent
开源
OpenClaw
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实战
编程
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实战
2026-04-22 16:02:39 +0800 CST
view 493
Mozilla发布开源AI客户端Thunderbolt,基于Haystack框架,支持ACP/MCP双协议,主打自托管、数据主权与隐私保护。深度解析其架构设计与Docker部署实战。
Mozilla
Thunderbolt
Haystack
ACP
MCP
AI客户端
RAG
开源
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实践
编程
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实践
2026-04-22 16:03:28 +0800 CST
view 489
Mozilla发布开源AI客户端Thunderbolt,基于Haystack框架,支持ACP/MCP双协议,主打自托管、数据主权与隐私保护。深度解析其架构设计与Docker部署实战。
Mozilla
Thunderbolt
Haystack
ACP
MCP
AI客户端
RAG
开源
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 356
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
OpenHuman 深度解析:从 Memory Tree 到 TokenJuice——登顶 GitHub Trending 的个人 AI 超级智能架构内幕
编程
OpenHuman 深度解析:从 Memory Tree 到 TokenJuice——登顶 GitHub Trending 的个人 AI 超级智能架构内幕
2026-05-18 12:14:32 +0800 CST
view 602
深度拆解登顶GitHub Trending的OpenHuman项目:Memory Tree摘要树架构、TokenJuice 80%压缩引擎、模型路由策略、Auto-Fetch自动同步、118+集成、Obsidian双向集成、本地优先隐私设计的完整技术内幕
OpenHuman
AI助手
Memory Tree
TokenJuice
Rust
Tauri
开源项目
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
编程
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
2026-06-13 20:17:57 +0800 CST
view 178
Redis之父antirez新作DwarfStar 4深度解析:专为DeepSeek V4 Flash打造的本地推理引擎,非对称2-bit量化、磁盘KV缓存、Metal图执行、分布式推理、方向引导,MacBook上284B模型跑出26 tok/s的完全指南
ds4
DwarfStar
DeepSeek
本地推理
Metal
MoE
量化
KV缓存
DiffusionGemma 深度实战:当文本生成进入「扩散纪元」——从离散扩散原理到本地高速推理的完全指南(2026)
编程
DiffusionGemma 深度实战:当文本生成进入「扩散纪元」——从离散扩散原理到本地高速推理的完全指南(2026)
2026-06-14 01:18:58 +0800 CST
view 174
2026年6月Google开源DiffusionGemma——基于离散扩散技术的文本生成模型,打破传统自回归范式,实现4倍生成速度提升。本文深入解析其架构原理、性能实测、代码实战与生产落地。
DiffusionGemma
离散扩散
文本生成
AI大模型
Google
并行推理
MoE架构
HarmonyOS 6 深度实战:ArkTS + ArkUI + AI 原生——从架构原理到生产级应用开发完全指南(2026)
编程
HarmonyOS 6 深度实战:ArkTS + ArkUI + AI 原生——从架构原理到生产级应用开发完全指南(2026)
2026-06-05 15:07:15 +0800 CST
view 420
从ArkTS语言设计到ArkUI声明式框架,从Aspect AOP到系统级AI集成,全面解析HarmonyOS 6的生产级应用开发
HarmonyOS
ArkTS
ArkUI
鸿蒙开发
AI原生
方舟编译器
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
资讯
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
2026-04-23 21:18:45 +0800 CST
view 597
2026年4月23日,腾讯发布并开源新一代大模型混元Hy3preview,总参数295B、激活参数21B的MoE架构,支持256K超长上下文,推理效率提升40%,API最低1.2元/百万tokens。在复杂推理、代码与Agent能力上表现突出,接近GPT-5.4级别,数学推理创国内最高纪录。已接入腾讯云、元宝等多条产品线,并上架TokenHub。
人工智能
大模型
腾讯
开源
MoE
推理
代码生成
Agent
云计算
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
25
下一页