程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Open-WebUI 深度实战:当本地大模型遇上生产级 Web 界面——从 RAG 管道到多模型统一编排的完全指南(2026)
编程
Open-WebUI 深度实战:当本地大模型遇上生产级 Web 界面——从 RAG 管道到多模型统一编排的完全指南(2026)
2026-06-10 03:16:35 +0800 CST
view 262
深入剖析 Open-WebUI 架构设计、RAG 实现原理、多模型编排机制,含大量可运行代码示例,覆盖从本地部署到生产级优化的完整流程。
Open-WebUI
本地大模型
RAG
FastAPI
Svelte
WWDC 2026 深度前瞻:从「雪豹式」iOS 27 到 AI 原生 Swift——苹果开发者生态的范式迁移
编程
WWDC 2026 深度前瞻:从「雪豹式」iOS 27 到 AI 原生 Swift——苹果开发者生态的范式迁移
2026-05-22 07:49:46 +0800 CST
view 221
WWDC 2026 前瞻深度解析:iOS 27雪豹式更新、Siri Agent化、Apple Intelligence系统级渗透、Swift 6.2并发模型革新
WWDC
iOS 27
Swift
Apple Intelligence
Siri
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 737
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 343
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
WebAssembly 2.0 深度实战:从 Threads 并发到 Component Model 跨语言协作的生产级完全指南(2026)
编程
WebAssembly 2.0 深度实战:从 Threads 并发到 Component Model 跨语言协作的生产级完全指南(2026)
2026-06-10 06:24:42 +0800 CST
view 189
WebAssembly 2.0 标准正式落地,从 Threads 多线程并发、Component Model 跨语言互操作、GC 提案、Memory64 到 Relaxed SIMD 的全方位深度实战指南
WebAssembly
Wasm
Rust
Component Model
SIMD
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
6
7
8
下一页