程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
编程
英伟达 CUDA-Oxide 0.1 深度解析:用 Rust 编写 GPU 内核的破冰之旅
2026-05-10 08:20:42 +0800 CST
view 605
英伟达发布实验性Rust-to-CUDA编译器CUDA-Oxide 0.1,支持用Rust编写SIMT GPU内核并输出标准PTX中间代码。深度解析其架构设计、代码示例与未来展望。
CUDA-Oxide
Rust
GPU编程
NVIDIA
PTX
SIMT
并行计算
高性能计算
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
编程
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
2026-04-30 03:22:15 +0800 CST
view 626
深度解析 DeepSeek 开源的高性能 GPU 算子库 TileKernels:基于 TileLang DSL 用 80 行代码实现手写 CUDA 级性能,覆盖 MoE Gating/Routing、FP8/FP4 量化、Engram 门控等七大算子家族,首次原生支持 NVIDIA Blackwell 架构,并通过 TVM 编译器打通昇腾等国产芯片。
DeepSeek
TileKernels
GPU
CUDA
TileLang
MoE
算子优化
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 1566
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
gsplat深度解析:3D高斯泼溅的CUDA加速革命——从伯克利/英伟达开源库到生产级实时渲染
编程
gsplat深度解析:3D高斯泼溅的CUDA加速革命——从伯克利/英伟达开源库到生产级实时渲染
2026-06-30 15:18:05 +0800 CST
view 39
深度解析UC伯克利/NVIDIA等机构联合开发的gsplat开源库:CUDA加速的3D高斯泼溅渲染引擎,节省4倍显存、缩短15%训练时间,涵盖数学原理、CUDA架构、训练流程、性能优化与生产应用。
gsplat
3D Gaussian Splatting
CUDA
图形渲染
3D重建
NeRF
实时渲染
PyTorch
国产 AI 编程工具深度实战:五巨头正面交锋——从 SPEC 规范驱动到 Agent 自主编码的完全指南(2026)
编程
国产 AI 编程工具深度实战:五巨头正面交锋——从 SPEC 规范驱动到 Agent 自主编码的完全指南(2026)
2026-06-03 08:21:57 +0800 CST
view 494
2026年国产AI编程工具深度对比:腾讯CodeBuddy、字节Trae、阿里Qoder和通义灵码、百度Comate五巨头技术架构拆解与实战评测
AI编程
CodeBuddy
Trae
Qoder
通义灵码
Comate
SPEC
Hermes Agent 深度实战:自进化 AI Agent 的三层记忆架构与 Skill 自动生成完全指南(下篇)
编程
Hermes Agent 深度实战:自进化 AI Agent 的三层记忆架构与 Skill 自动生成完全指南(下篇)
2026-06-04 04:45:35 +0800 CST
view 238
下篇:深入讲解 Nudge Engine 定时复盘、强化学习从经验中学习、完整代码实战(从零搭建自进化 Agent)、与其他框架对比、生产级最佳实践、性能优化策略。
Hermes Agent
自进化
AI Agent
Nudge Engine
强化学习
代码实战
GMSSH:桌面级AI运维终端,零侵入纯SSH隧道
编程
GMSSH:桌面级AI运维终端,零侵入纯SSH隧道
2026-05-24 16:49:36 +0800 CST
view 296
GMSSH是桌面级AI驱动运维终端,零侵入纯SSH隧道,服务器不用装任何Agent,进程隔离+UDS通信,AI通过MCP感知实时状态,50+运维技能包,核心闭源+生态开放。
AI运维
SSH
运维工具
终端工具
桌面级
进程隔离
UDS
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 420
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
DwarfStar 深度解析:antirez 的 DeepSeek V4 Flash 本地推理引擎——Metal 与 CUDA 双轨优化革命(2026 完全指南)
编程
DwarfStar 深度解析:antirez 的 DeepSeek V4 Flash 本地推理引擎——Metal 与 CUDA 双轨优化革命(2026 完全指南)
2026-05-28 19:13:18 +0800 CST
view 345
DwarfStar(ds4)是Redis创始人antirez开发的DeepSeek V4 Flash专用推理引擎,支持Metal与CUDA双轨优化、磁盘KV Cache、imatrix量化和原生Agent集成。本文深入解析其架构设计与性能表现。
DeepSeek
ds4
Metal
CUDA
本地推理
MoE
量化
GGUF
Agent
Python
C
RAG-Anything 深度实战:港大开源全模态 RAG 框架,让知识库真正看懂图片、表格和公式
编程
RAG-Anything 深度实战:港大开源全模态 RAG 框架,让知识库真正看懂图片、表格和公式
2026-04-25 00:31:11 +0800 CST
view 484
深度解析港大开源RAG-Anything框架:从多模态文档解析到跨模态知识图谱构建,包含完整代码实战、自定义模态处理器开发、性能优化与生产部署指南
RAG
多模态
知识图谱
HKUDS
LightRAG
MinerU
VLM
文档理解
bpftime for GPU 深度实战:将 eBPF 带进 GPU Kernel 内部——从 PTX 级插桩到线程级可观测性的全链路架构解析
编程
bpftime for GPU 深度实战:将 eBPF 带进 GPU Kernel 内部——从 PTX 级插桩到线程级可观测性的全链路架构解析
2026-05-07 10:07:31 +0800 CST
view 411
深入解析 bpftime for GPU 如何将 eBPF 的可编程观测能力带入 GPU Kernel 内部,实现 PTX 级插桩、per-thread 粒度观测和零拷贝数据回传,为 AI 训练和高性能计算提供全新的调试与分析范式。
eBPF
GPU
CUDA
PTX
可观测性
性能优化
DeepTutor深度解析:港大HKUDS开源的Agent-Native个性化学习系统,如何用双环推理架构让AI真正懂你在学什么
编程
DeepTutor深度解析:港大HKUDS开源的Agent-Native个性化学习系统,如何用双环推理架构让AI真正懂你在学什么
2026-04-17 18:13:26 +0800 CST
view 1275
港大HKUDS开源的DeepTutor深度解析,探讨其Agent-Native架构、双环协同推理机制、代码实战与未来展望
AI教育
Agent
DeepTutor
HKUDS
Python
Khal 深度实战:一次编写,跨越 WebGPU、CUDA 与 CPU 的 GPU 通用计算新范式(2026)
编程
Khal 深度实战:一次编写,跨越 WebGPU、CUDA 与 CPU 的 GPU 通用计算新范式(2026)
2026-06-15 11:46:16 +0800 CST
view 255
Khal(Kompute Hardware Abstraction Layer)是 Rust 生态的跨平台 GPU 硬件抽象层,让开发者用一门语言编写一次计算着色器,即可部署到 WebGPU、CUDA 和 CPU 所有目标平台。本文深入解析其架构设计、编译流程、标准库与实战代码示例。
Rust
GPU
WebGPU
CUDA
高性能计算
图形编程
OmniVoice 深度实战:当小米 k2-fsa 团队用扩散语言模型重塑语音合成——从零样本克隆到 600 语言高保真 TTS 的生产级完全指南(2026)
编程
OmniVoice 深度实战:当小米 k2-fsa 团队用扩散语言模型重塑语音合成——从零样本克隆到 600 语言高保真 TTS 的生产级完全指南(2026)
2026-06-15 14:21:23 +0800 CST
view 319
深入解析小米 k2-fsa 团队开源的 OmniVoice 单阶段扩散语言模型 TTS 系统,0.8B 参数支持 600+ 语言,零样本克隆仅需 3-10 秒参考音频,RTF 低至 0.025,Apache-2.0 免费商用。
TTS
语音合成
OmniVoice
k2-fsa
扩散模型
零样本克隆
多语言
MachineLearning
Audio
小米
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 420
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
45+在线图片工具+REST API+AI修图:SnapOtter让NAS秒变个人图片处理中心
编程
45+在线图片工具+REST API+AI修图:SnapOtter让NAS秒变个人图片处理中心
2026-04-28 18:27:20 +0800 CST
view 635
基于Docker的自托管图片编辑器SnapOtter:45+工具、REST API接入AI Agent、本地AI修图(OCR/背景移除/高清化)、数据永久存NAS。海康智存部署教程。
Docker
NAS
图片处理
AI修图
本地部署
REST API
OpenClaw
Hermes
.NET 11 CoreCLR on WebAssembly:微软统一运行时帝国最后一块拼图
编程
.NET 11 CoreCLR on WebAssembly:微软统一运行时帝国最后一块拼图
2026-06-29 13:18:32 +0800 CST
view 51
2026年6月.NET 11 Preview 1发布,CoreCLR首次原生运行在WebAssembly之上。本文深度解析这一里程碑式变化:RyuJIT AOT引擎、CoreCLR解释器、ReadyToRun复合模式、WASI生态全景,以及Blazor生产级性能对比实测。
NET
.NET
Blazor
WebAssembly
WASM
CoreCLR
RyuJIT
WASI
Serverless
AOT
Rust 1.96 + .NET 11 双重地震:WebAssembly 生态正在经历一场“去补丁化”革命
编程
Rust 1.96 + .NET 11 双重地震:WebAssembly 生态正在经历一场“去补丁化”革命
2026-04-11 09:55:58 +0800 CST
view 909
2026年4月,Rust官方移除--allow-undefined补丁、.NET 11 Preview1集成CoreCLR on WASM,两大生态同步推进。本文深入解析WebAssembly去补丁化革命的核心原理与实战。
Rust
WebAssembly
.NET
WASM
CoreCLR
OpenClaw 深度实战:从0到24万星——2026年最快增长的个人AI助手完全指南
编程
OpenClaw 深度实战:从0到24万星——2026年最快增长的个人AI助手完全指南
2026-05-25 03:22:41 +0800 CST
view 319
本文深入讲解OpenClaw的核心概念、架构设计、实战安装与技能开发,以及性能优化方法,帮助开发者全面掌握这一2026年最快增长的个人AI助手项目。
OpenClaw
AI助手
开源项目
GitHub Trending
2026
OpenClaw 深度实战:从0到24万星——2026年个人AI助手完全指南(架构+实战+优化)
编程
OpenClaw 深度实战:从0到24万星——2026年个人AI助手完全指南(架构+实战+优化)
2026-05-25 03:23:56 +0800 CST
view 275
本文深入讲解OpenClaw的核心概念、架构设计、实战安装与技能开发,以及性能优化方法,帮助开发者全面掌握这一2026年最快增长的个人AI助手项目。
OpenClaw
AI助手
开源项目
GitHub Trending
2026
2026年OpenClaw实战全解析:架构设计与性能优化指南
编程
2026年OpenClaw实战全解析:架构设计与性能优化指南
2026-05-25 03:25:02 +0800 CST
view 310
本文深入讲解OpenClaw的核心概念、架构设计、实战安装与技能开发,以及性能优化方法,帮助开发者全面掌握这一2026年最快增长的个人AI助手项目。
OpenClaw
AI助手
开源项目
GitHub Trending
2026
从零开始掌握OpenClaw:2026年最火个人AI助手实战手册
编程
从零开始掌握OpenClaw:2026年最火个人AI助手实战手册
2026-05-25 03:26:04 +0800 CST
view 266
本文深入讲解OpenClaw的核心概念、架构设计、实战安装与技能开发,以及性能优化方法,帮助开发者全面掌握这一2026年最火的个人AI助手项目。
OpenClaw
AI助手
开源项目
GitHub Trending
2026
2026年OpenClaw实战:从安装到技能开发全攻略
编程
2026年OpenClaw实战:从安装到技能开发全攻略
2026-05-25 03:27:03 +0800 CST
view 297
本文深入讲解OpenClaw的核心概念、架构设计、实战安装与技能开发,以及性能优化方法,帮助开发者全面掌握这一2026年最火的个人AI助手项目。
OpenClaw
AI助手
开源项目
GitHub Trending
2026
The AI Scientist v2 深度实战:当 AI 开始独立做科研并发表论文——从 Agentic Tree Search 到 ICLR 研讨会录用的完全指南(2026)
编程
The AI Scientist v2 深度实战:当 AI 开始独立做科研并发表论文——从 Agentic Tree Search 到 ICLR 研讨会录用的完全指南(2026)
2026-06-27 06:46:04 +0800 CST
view 73
2026年Sakana AI开发的The AI Scientist v2生成了首篇通过ICLR同行评审的AI论文。本文深度解析其Agentic Tree Search架构、六大核心Agent、代码实战、生产部署与ICLR论文完整生成过程。
AI Scientist v2
Sakana AI
自动化科研
Agentic Tree Search
ICLR
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
26
27
28
29
30
...
45
下一页