程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 684
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
Deno 深度实战:当 JavaScript 运行时遇上 Rust + V8 —— 从安全模型到生产级部署的完全指南(2026)
编程
Deno 深度实战:当 JavaScript 运行时遇上 Rust + V8 —— 从安全模型到生产级部署的完全指南(2026)
2026-06-10 09:22:22 +0800 CST
view 55
Deno 深度实战指南,从架构原理到生产部署,涵盖安全模型、Web标准兼容、TypeScript支持、去中心化模块系统等核心特性,并提供高性能Web API、CLI工具、文件系统操作、WebSocket实时通信等实战代码。
Deno
JavaScript
TypeScript
Rust
安全模型
女娲.skill 深度解析:当造人从神话变成代码,把乔布斯、芒格、马斯克的思维方式变成可运行的AI技能
编程
女娲.skill 深度解析:当造人从神话变成代码,把乔布斯、芒格、马斯克的思维方式变成可运行的AI技能
2026-04-10 02:43:26 +0800 CST
view 2151
女娲skill深度解析:输入人名自动蒸馏认知操作系统,六路Agent Swarm并行采集、三重心智模型验证、表达DNA量化,乔布斯芒格马斯克等13位人物一键生成可运行Skill
AI
Skill
认知蒸馏
心智模型
Claude Code
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
编程
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
2026-05-09 18:51:15 +0800 CST
view 270
腾讯混元开源 HunyuanVideo 1.5 视频生成模型,8.3B 参数 Diffusion Transformer 架构,14G 显存消费级显卡可运行。SSTA 稀疏注意力机制实现推理速度 1.87 倍提升,3D 因果 VAE 实现空间 16 倍、时间 4 倍压缩。
AI视频生成
腾讯混元
HunyuanVideo
Diffusion Transformer
SSTA
开源模型
消费级显卡
GitHub Rubber Duck 深度解析:当 Claude 遇上 GPT-5.4,AI 编程进入「第二意见」时代
编程
GitHub Rubber Duck 深度解析:当 Claude 遇上 GPT-5.4,AI 编程进入「第二意见」时代
2026-04-10 03:24:31 +0800 CST
view 589
GitHub Rubber Duck 实验性功能深度解析:通过跨模型审查机制,Claude Sonnet 4.6 性能提升74.7%,AI编程进入第二意见时代
GitHub
Copilot
Rubber Duck
AI编程
Claude
GPT-5.4
代码审查
跨模型协作
WASI 0.2 与 WebAssembly 组件模型深度实战:2026 年重新定义 serverless 与边缘计算
编程
WASI 0.2 与 WebAssembly 组件模型深度实战:2026 年重新定义 serverless 与边缘计算
2026-06-02 10:54:59 +0800 CST
view 134
深入解析 WASI 0.2 与 WebAssembly 组件模型在 2026 年的最新进展、架构设计、生产级实战部署,涵盖边缘函数、Serverless、插件系统等核心场景的性能对比与工具链指南。
WebAssembly
WASI
组件模型
边缘计算
Serverless
云原生
Rust
Wasmtime
WebAssembly 组件模型深度实战:从 WASI Preview2 到跨语言组件互操作,重新定义一次编译到处运行的真正含义
编程
WebAssembly 组件模型深度实战:从 WASI Preview2 到跨语言组件互操作,重新定义一次编译到处运行的真正含义
2026-04-30 03:54:47 +0800 CST
view 337
深入解析 WebAssembly 组件模型技术体系:WIT接口定义、跨语言组件互操作、WASI Preview2能力安全、Wasm容器化部署、性能优化与生产实战
WebAssembly
Wasm
组件模型
WASI
WIT
跨语言
Deno 2.0 深度实战:当 Node.js 遇见现代化标准库——从权限控制到生产级 Web 开发的完全指南(2026)
编程
Deno 2.0 深度实战:当 Node.js 遇见现代化标准库——从权限控制到生产级 Web 开发的完全指南(2026)
2026-06-11 05:18:56 +0800 CST
view 77
Deno 2.0 重磅发布:从 Ryan Dahl 的「Node.js 十大遗憾」讲起,深度剖析 Deno 的安全模型、TypeScript 原生支持、Web 标准 API 兼容性、架构设计(V8 + Rust + Tokio),通过大量可运行代码示例,带你从零搭建生产级 RESTful API 服务,并对比 Deno vs Node.js vs Bun 的选型建议。
Deno
TypeScript
Web框架
安全模型
RESTful
KV数据库
Fresh框架
MiniCPM-o 2.6 深度解析:8B参数如何在iPad上跑出GPT-4o级全模态性能——端侧多模态大模型的工程化突破
编程
MiniCPM-o 2.6 深度解析:8B参数如何在iPad上跑出GPT-4o级全模态性能——端侧多模态大模型的工程化突破
2026-05-11 01:50:57 +0800 CST
view 309
深入解析MiniCPM-o 2.6:8B参数如何在iPad上实现GPT-4o级全模态性能,时分复用TDM机制、端到端架构、低延迟并发处理的技术内幕,附完整部署代码和性能优化实战
AI,MiniCPM,多模态,端侧模型,面壁智能
Rust在人工智能生成内容(AIGC)领域的应用
编程
Rust在人工智能生成内容(AIGC)领域的应用
2024-11-18 13:48:25 +0800 CST
view 1864
本文探讨了Rust在人工智能生成内容(AIGC)领域的应用,强调其安全性、高性能和并发性等优势。通过介绍Tch-rs和Rust-Bert等库,展示了Rust在深度学习和生成模型中的实际使用案例,包括神经网络和生成对抗网络(GAN)的实现。Rust的特性使其成为开发复杂AIGC项目的理想选择。
编程语言
人工智能
深度学习
生成模型
Rust
Open Notebook 深度实战:当开源替代方案击败 Google Notebook LM——从多模态RAG到自托管部署的生产级完全指南(2026)【下】
编程
Open Notebook 深度实战:当开源替代方案击败 Google Notebook LM——从多模态RAG到自托管部署的生产级完全指南(2026)【下】
2026-06-11 16:21:26 +0800 CST
view 56
Open Notebook 是 Google Notebook LM 的开源替代方案。本文下篇深入实战多模型集成、播客生成、性能调优与安全管控,附真实生产案例。
Open Notebook
Notebook LM 替代品
多模型集成
播客生成
性能优化
生产案例
超越 Docker:WebAssembly Component Model 如何重塑跨语言服务架构
编程
超越 Docker:WebAssembly Component Model 如何重塑跨语言服务架构
2026-04-20 22:48:34 +0800 CST
view 403
深度解析 Wasm 组件模型 + WIT 接口语言 + WASI 2.0 如何在服务端重构跨语言协作范式,含完整 Rust/Go 实战代码
WebAssembly
Wasm
组件模型
跨语言
WASI
WIT
服务端架构
NVIDIA Cosmos 3 深度实战:当世界模型重塑 Physical AI——从 MoT 架构到机器人策略的生产级完全指南(2026)
编程
NVIDIA Cosmos 3 深度实战:当世界模型重塑 Physical AI——从 MoT 架构到机器人策略的生产级完全指南(2026)
2026-06-12 15:50:50 +0800 CST
view 36
深入解析 NVIDIA Cosmos 3 全模态物理 AI 世界模型:MoT 双塔架构、统一动作表征、3D MRoPE 位置编码,以及 Hugging Face 实战代码。适合机器人、自动驾驶、AI 研究者和工程师。
NVIDIA
Cosmos
世界模型
Physical AI
MoT
机器人
Transformer
具身智能
Kairos-HomeWorld 深度实战:当世界模型学会造家——从全屋三维生成到具身智能训练的数据基座完全指南(2026)
编程
Kairos-HomeWorld 深度实战:当世界模型学会造家——从全屋三维生成到具身智能训练的数据基座完全指南(2026)
2026-06-12 21:50:18 +0800 CST
view 28
全球首个全屋三维可交互世界模型 Kairos-HomeWorld 深度解析,从四阶段分层生成架构到具身智能训练数据基座完全指南
Kairos-HomeWorld
具身智能
世界模型
三维生成
仿真训练
RoboTwin
花3块钱、2小时训练一个64M的"小破模型",能干啥?
编程
花3块钱、2小时训练一个64M的"小破模型",能干啥?
2026-04-21 09:05:56 +0800 CST
view 319
MiniMind:从零手写完整LLM训练流水线,64M参数,2小时+3块钱训练完成,支持预训练+SFT+RLHF+工具调用,适合Multi-Agent/自动化/端侧集成
开源
LLM
PyTorch
模型训练
MiniMind
AI
工具调用
RLHF
Python中的shapley-regression库,重点在于如何安装、使用及其在机器学习模型中的应用
综合
Python中的shapley-regression库,重点在于如何安装、使用及其在机器学习模型中的应用
2024-11-19 05:02:08 +0800 CST
view 1634
本文介绍了Python中的shapley-regression库,重点在于如何安装、使用及其在机器学习模型中的应用。通过计算SHAP值,用户可以理解特征对模型预测的贡献,并利用可视化工具展示这些信息。文章涵盖了库的基本用法和高级用法,包括模型训练、SHAP值计算和特征重要性的可视化,适用于房价预测等实际案例。
数据分析
机器学习
模型解释
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
编程
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
2026-05-12 00:20:07 +0800 CST
view 324
深度解析TabPFN如何用Transformer架构重写表格数据机器学习范式:从合成数据预训练、先验数据拟合原理、2.8秒vs4小时性能对比,到TabPFN-2.5的10万行处理能力与SAP收购战略意义,附完整代码示例
TabPFN,表格数据,Transformer,AutoML,机器学习,XGBoost,PriorLabs,深度学习,基础模型,Python
WebAssembly Component Model 深度解析:从理论奠基到生产落地的完整指南
编程
WebAssembly Component Model 深度解析:从理论奠基到生产落地的完整指南
2026-04-21 10:20:21 +0800 CST
view 322
深度解析WebAssembly Component Model的设计理念、WIT接口定义语言、Canonical ABI机制、wit-bindgen实战用法,以及2026年主流运行时生态现状,帮助开发者建立完整的技术认知框架。
WebAssembly
WCM
WIT
wasmtime
跨语言互操作
服务器端Wasm
组件模型
VibeVoice 深度拆解:微软如何用 LLM+扩散模型重新发明语音合成——从双Tokenizer到90分钟超长对话的全链路技术实战
编程
VibeVoice 深度拆解:微软如何用 LLM+扩散模型重新发明语音合成——从双Tokenizer到90分钟超长对话的全链路技术实战
2026-05-02 22:34:34 +0800 CST
view 277
微软开源VibeVoice深度技术拆解:双Tokenizer架构、LLM对话中枢、Next-Token扩散模型、7.5Hz超低帧率,90分钟多角色对话生成的全链路实战
VibeVoice
语音合成
TTS
扩散模型
LLM
微软开源
pycm:一个强大的混淆矩阵库
综合
pycm:一个强大的混淆矩阵库
2024-11-18 16:17:54 +0800 CST
view 1734
pycm是一个用于生成和分析混淆矩阵的Python库,能够自动计算多种评估指标并提供可视化功能。本文介绍了pycm的安装、基本用法和高级用法,包括如何生成混淆矩阵、导出结果以及支持多标签和多类别分类的功能。通过实际案例展示了如何使用pycm评估机器学习模型的性能,是数据科学家和机器学习工程师的重要工具。
机器学习
数据科学
模型评估
工具
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 461
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
9Router 深度解析:开源路由器如何让 AI 编程成本归零,RTK 压缩省 40% Token
编程
9Router 深度解析:开源路由器如何让 AI 编程成本归零,RTK 压缩省 40% Token
2026-05-12 02:44:46 +0800 CST
view 549
深度解析9Router:RTK Token Saver压缩工具输出省20-40% token、Caveman Mode省65%输出token、三层自动降级Subscription→Cheap→Free、40+供应商100+模型、格式转换9种API格式、多账户轮询+OAuth自动刷新
9Router,AI路由器,RTK,Token压缩,ClaudeCode,Cursor,多模型路由,自动降级,KiroAI,免费AI编程,CavemanMode,OpenAI兼容
VibeVoice 深度解析:微软开源语音AI的架构革命,7.5Hz帧率如何重塑长音频处理范式
编程
VibeVoice 深度解析:微软开源语音AI的架构革命,7.5Hz帧率如何重塑长音频处理范式
2026-04-22 01:51:38 +0800 CST
view 308
微软开源VibeVoice语音AI模型家族深度解析,7.5Hz超低帧率连续语音Tokenizer、Next-Token Diffusion架构、ASR长音频识别、TTS多说话人合成、实时流式语音生成,附完整代码实战与生产部署指南
VibeVoice
语音AI
ASR
TTS
微软开源
扩散模型
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 684
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
5
6
7
8
9
下一页