程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
MemPalace 深度解析:当 AI 记忆系统终于学会「宫殿记忆法」
编程
MemPalace 深度解析:当 AI 记忆系统终于学会「宫殿记忆法」
2026-04-09 05:52:11 +0800 CST
view 942
MemPalace 以 96.6% LongMemEval 召回率成为目前评分最高的 AI 记忆系统。本文深度解析其宫殿记忆法架构、四层记忆栈、AAAK 压缩方言,以及与 Claude Code 的集成方案。
AI
memory
vector-database
RAG
Claude
open-source
PersonaPlex 深度解析:当 NVIDIA 让全双工语音对话进入「角色扮演」时代
编程
PersonaPlex 深度解析:当 NVIDIA 让全双工语音对话进入「角色扮演」时代
2026-04-09 11:32:36 +0800 CST
view 495
NVIDIA发布的PersonaPlex在Moshi架构基础上增加了角色扮演和语音克隆能力,让AI可以扮演教师、客服等不同身份进行实时语音对话。本文从架构、代码、实战角度全面解析这项技术突破。
PersonaPlex
NVIDIA
Moshi
全双工语音
AI对话
角色扮演
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
编程
NVIDIA PersonaPlex 全双工语音 AI 深度解析:从 Moshi 架构到实时对话的工程实践
2026-04-19 14:16:23 +0800 CST
view 392
深度解析 NVIDIA PersonaPlex:基于 Moshi 架构的 7B 参数全双工语音 AI 模型,170ms 打断延迟,MIT 商用许可,从架构原理到代码实战的完整技术指南。
NVIDIA
PersonaPlex
全双工语音
Moshi
Kyutai
AI语音
实时对话
语音AI
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 318
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
编程
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
2026-04-30 03:22:15 +0800 CST
view 406
深度解析 DeepSeek 开源的高性能 GPU 算子库 TileKernels:基于 TileLang DSL 用 80 行代码实现手写 CUDA 级性能,覆盖 MoE Gating/Routing、FP8/FP4 量化、Engram 门控等七大算子家族,首次原生支持 NVIDIA Blackwell 架构,并通过 TVM 编译器打通昇腾等国产芯片。
DeepSeek
TileKernels
GPU
CUDA
TileLang
MoE
算子优化
英伟达Nemotron 3 Nano Omni:一个模型搞定看听读写,智能体效率狂飙9倍
编程
英伟达Nemotron 3 Nano Omni:一个模型搞定看听读写,智能体效率狂飙9倍
2026-05-01 04:40:16 +0800 CST
view 269
英伟达发布Nemotron 3 Nano Omni开源多模态模型,30B-A3B MoE架构,统一视觉音频语言编码,吞吐量9倍提升,六大排行榜榜首,富士康甲骨文等已采用。
英伟达
多模态
开源
AI智能体
Nemotron
Mojo 深度解析:为 AI 基础而生的下一代系统编程语言——比 Python 快 68000 倍的秘密
编程
Mojo 深度解析:为 AI 基础而生的下一代系统编程语言——比 Python 快 68000 倍的秘密
2026-05-01 09:34:12 +0800 CST
view 258
深度解析 Mojo 语言:基于 MLIR 的 AI 基础设施编程语言,比 Python 快 68000 倍的秘密,从架构设计、编译原理、性能优化到代码实战的完整拆解
Mojo
AI
编译器
性能优化
MLIR
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 229
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
编程
MOSS-TTS-Nano:0.1B参数纯CPU实时语音生成与克隆,MacBook Air单核就能跑
2026-04-20 22:53:28 +0800 CST
view 685
复旦大学OpenMOSS团队开源的0.1B参数多语言TTS模型,纯CPU运行、支持零样本语音克隆、48kHz双声道、20种语言、流式推理,MacBook Air单核即可流畅运行
TTS
语音合成
语音克隆
AI
开源
CPU推理
OpenMOSS
微信小程序开发资源汇总
编程
微信小程序开发资源汇总
2026-05-11 16:11:29 +0800 CST
view 159
本文档汇总了微信小程序开发的官方资源(设计指南、开发教程、框架、组件、API、开发者工具)以及丰富的第三方工具、插件、组件和后端SDK。
微信小程序
开发资源
前端框架
UI组件
Demo示例
工具插件
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
编程
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
2026-05-11 20:48:39 +0800 CST
view 205
深度解析Llama 4 Scout/Maverick的MoE架构、128专家设计、1000万token超长上下文,附本地部署实战与许可证分析
Meta
Llama4
MoE
开源大模型
混合专家架构
Scout
Maverick
iRoPE
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实战
编程
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实战
2026-04-22 16:02:39 +0800 CST
view 354
Mozilla发布开源AI客户端Thunderbolt,基于Haystack框架,支持ACP/MCP双协议,主打自托管、数据主权与隐私保护。深度解析其架构设计与Docker部署实战。
Mozilla
Thunderbolt
Haystack
ACP
MCP
AI客户端
RAG
开源
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实践
编程
Mozilla Thunderbolt 深度解析:Haystack + ACP/MCP 驱动的「主权 AI 客户端」架构设计与工程实践
2026-04-22 16:03:28 +0800 CST
view 372
Mozilla发布开源AI客户端Thunderbolt,基于Haystack框架,支持ACP/MCP双协议,主打自托管、数据主权与隐私保护。深度解析其架构设计与Docker部署实战。
Mozilla
Thunderbolt
Haystack
ACP
MCP
AI客户端
RAG
开源
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 229
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
OpenHuman 深度解析:从 Memory Tree 到 TokenJuice——登顶 GitHub Trending 的个人 AI 超级智能架构内幕
编程
OpenHuman 深度解析:从 Memory Tree 到 TokenJuice——登顶 GitHub Trending 的个人 AI 超级智能架构内幕
2026-05-18 12:14:32 +0800 CST
view 401
深度拆解登顶GitHub Trending的OpenHuman项目:Memory Tree摘要树架构、TokenJuice 80%压缩引擎、模型路由策略、Auto-Fetch自动同步、118+集成、Obsidian双向集成、本地优先隐私设计的完整技术内幕
OpenHuman
AI助手
Memory Tree
TokenJuice
Rust
Tauri
开源项目
Shannon 深度解析:完全自主 AI 黑客的技术内幕——96.15% 成功率的白盒渗透测试革命
编程
Shannon 深度解析:完全自主 AI 黑客的技术内幕——96.15% 成功率的白盒渗透测试革命
2026-05-18 21:19:51 +0800 CST
view 278
Shannon 以 96.15% 的成功率刷新 XBOW 基准测试,成为首个真正可用的自主 AI 黑客工具。本文深入剖析其技术架构、核心算法、实战案例。
AI Security
Penetration Testing
GitHub Trending
Shannon
Autonomous AI
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
编程
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
2026-05-14 03:40:08 +0800 CST
view 159
2026年奇点智能技术大会正式提出AI原生前端开发范式,LLM不再只是辅助工具而是编译过程的一部分。深度解析LLM-as-Compiler、编译时语义理解、声明式UI合成及Vite5.4+插件调用本地MoE模型的技术实现。
AI原生前端,LLM-as-Compiler,编译时语义理解,声明式UI合成,Vite5.4,MoE模型
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
编程
Llama 4 MoE 架构深度解析:从混合专家到万亿参数的技术革命
2026-05-28 16:37:41 +0800 CST
view 55
深入解析 Meta Llama 4 的 MoE 混合专家架构原理,探讨其如何以 17B 激活参数撬动万亿级算力,并提供完整的本地部署实战指南。
Llama4
MoE
混合专家
开源大模型
本地部署
Meta
人工智能
深度学习
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
编程
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
2026-04-24 17:19:28 +0800 CST
view 333
2026年4月24日DeepSeek发布V4预览版,总参1.6T/284B,激活49B/13B,100万Token上下文,DSA稀疏注意力,兼容OpenAI+Anthropic双协议,昇腾与寒武纪Day 0适配,深度解析其架构与API用法。
DeepSeek
V4
MoE
大模型
开源
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
编程
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
2026-04-16 16:42:03 +0800 CST
view 338
RedditVideoMakerBot 是一个将 Reddit 帖子链接自动制作成视频的开源工具,支持语音合成、自动配图、字幕生成和背景音乐。
Reddit
视频自动化
Python
MoviePy
PRAW
内容创作
开源工具
开源MES/MOM系统TMom:用一套系统管好几个厂区的生产,低代码、大屏、移动端全支持
编程
开源MES/MOM系统TMom:用一套系统管好几个厂区的生产,低代码、大屏、移动端全支持
2026-04-16 17:01:13 +0800 CST
view 549
TMom是一款基于.NET 8开源的多厂区多项目级MOM/MES系统,支持计划排程、工艺路线设计、在线低代码报表、大屏看板、移动端和AOT客户端,MIT协议开源。
MES
MOM
.NET
低代码
数字化看板
制造
开源
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
编程
MOSS-TTS-Nano:0.1B 参数的开源语音模型,CPU 直跑,浏览器里都能用
2026-04-25 08:17:20 +0800 CST
view 654
MOSS-TTS-Nano 是模思智能和OpenMOSS团队开源的0.1B参数超小语音合成模型,支持纯CPU推理、ONNX加速、20种语言、零样本语音克隆、流式输出48kHz立体声,还有浏览器插件可直接在Chrome中使用。
AI
开源
语音合成
TTS
MOSS
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
编程
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
2026-04-26 08:10:21 +0800 CST
view 364
深度解析DeepSeek-V4的技术突破:百万Token原生上下文、万亿级MoE架构、国产芯片适配。从技术原理到工程实践,全面剖析这场开源AI的革命。
DeepSeek
大模型
MoE
百万上下文
开源AI
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 271
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
3
4
5
6
7
...
32
下一页