程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
编程
Ollama 0.30 深度实战:当本地 LLM 推理有了双引擎——从 llama.cpp + MLX 双后端到 Gemma 4 QAT、从 Cohere2 MoE 到 ollama launch AI 编程助手生态的生产级完全指南(2026)
2026-06-21 08:54:17 +0800 CST
view 17
Ollama 0.30 深度解析:双引擎推理架构、Gemma 4 QAT、Cohere2 MoE、ollama launch 生态与生产级部署完全指南
Ollama
LLM
本地推理
AI编程
llama.cpp
MLX
Gemma
开源
FreeOcc 深度解析:机器人具身智能的「无监督觉醒」——首个无需训练的开放词汇三维占据预测系统
编程
FreeOcc 深度解析:机器人具身智能的「无监督觉醒」——首个无需训练的开放词汇三维占据预测系统
2026-05-15 21:48:41 +0800 CST
view 311
深度解析港科大开源FreeOcc:首个无需训练的开放词汇三维占据预测系统,无需3D标注即可实现语义占据地图构建,在RSS 2026发表
FreeOcc
RSS2026
3D占据预测
具身智能
三维重建
3DGS
SLAM
VLM
开放词汇
Robotics
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
编程
小米 MiMo UltraSpeed 深度解析:当 SWA 架构重塑 LLM 推理——从 O(n²) 困境到 1000 tokens/s 的极致跨越
2026-06-15 21:20:49 +0800 CST
view 96
深入解析小米MiMo UltraSpeed如何通过SWA架构在通用GPU上突破1000 tokens/s推理速度,从O(n²)困境到极致跨越的完整技术指南。
SWA
Sliding Window Attention
LLM推理
小米MiMo
推理优化
Transformer
PagedAttention
量化推理
端侧AI
2026年4月24日:大模型军备竞赛进入新纪元——DeepSeek V4 与 GPT-5.5 深度技术对比解析
编程
2026年4月24日:大模型军备竞赛进入新纪元——DeepSeek V4 与 GPT-5.5 深度技术对比解析
2026-04-28 08:54:41 +0800 CST
view 698
2026年4月24日,DeepSeek V4与GPT-5.5同日发布。本文从MoE架构、注意力机制、性能基准、Engram记忆模块、mHC超连接、Muon优化器等核心技术点进行硬核深度对比,配大量代码示例,为开发者提供实用的技术选型指南。
AI大模型
LLM
GitHub精选
开源项目
TechNews
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 742
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
Zig 项目宣布反 AI 贡献政策:开源社区最分裂的话题,程序员怎么看?
编程
Zig 项目宣布反 AI 贡献政策:开源社区最分裂的话题,程序员怎么看?
2026-05-31 11:23:49 +0800 CST
view 339
2026年4月,Zig语言官方宣布全面禁止LLM生成的代码贡献,引发开源社区激烈争论。本文从程序员视角深度解析Loris Cro的「Contributor Poker」理论、Bun 4倍提速无法上线的真实案例,以及开源治理的新课题。
Zig
开源
AI编程
LLM
GitHub
社区治理
系统编程
NVIDIA Nemotron-Cascade-2 深度实战:30B MoE 模型如何拿下 IMO/IOI 双料金牌——从稀疏专家架构到生产级部署的完全指南(2026)
编程
NVIDIA Nemotron-Cascade-2 深度实战:30B MoE 模型如何拿下 IMO/IOI 双料金牌——从稀疏专家架构到生产级部署的完全指南(2026)
2026-06-01 12:56:48 +0800 CST
view 169
深度解析NVIDIA Nemotron-Cascade-2-30B-A3B模型:30B总参、3B激活参数的MoE架构,如何拿下IMO/IOI双料金牌,以及如何从HuggingFace加载到vLLM生产部署。
NVIDIA
Nemotron
MoE
AI模型
GPU
深度学习
推理引擎
vLLM
60行配置文件斩获5万星:Karpathy如何用四条原则终结AI编程的混乱时代
编程
60行配置文件斩获5万星:Karpathy如何用四条原则终结AI编程的混乱时代
2026-04-18 14:44:57 +0800 CST
view 851
andrej-karpathy-skills项目60行CLAUDE.md文件斩获54k星标,四条原则Think Before Coding、Simplicity First、Surgical Changes、Goal-Driven Execution如何终结AI编程的混乱时代
AI编程
Claude Code
Prompt Engineering
LLM
软件工程
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
9
10
11
下一页