程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
pycm:一个强大的混淆矩阵库
综合
pycm:一个强大的混淆矩阵库
2024-11-18 16:17:54 +0800 CST
view 1665
pycm是一个用于生成和分析混淆矩阵的Python库,能够自动计算多种评估指标并提供可视化功能。本文介绍了pycm的安装、基本用法和高级用法,包括如何生成混淆矩阵、导出结果以及支持多标签和多类别分类的功能。通过实际案例展示了如何使用pycm评估机器学习模型的性能,是数据科学家和机器学习工程师的重要工具。
机器学习
数据科学
模型评估
工具
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 313
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
9Router 深度解析:开源路由器如何让 AI 编程成本归零,RTK 压缩省 40% Token
编程
9Router 深度解析:开源路由器如何让 AI 编程成本归零,RTK 压缩省 40% Token
2026-05-12 02:44:46 +0800 CST
view 287
深度解析9Router:RTK Token Saver压缩工具输出省20-40% token、Caveman Mode省65%输出token、三层自动降级Subscription→Cheap→Free、40+供应商100+模型、格式转换9种API格式、多账户轮询+OAuth自动刷新
9Router,AI路由器,RTK,Token压缩,ClaudeCode,Cursor,多模型路由,自动降级,KiroAI,免费AI编程,CavemanMode,OpenAI兼容
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 394
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
VibeVoice 深度解析:微软开源语音AI的架构革命,7.5Hz帧率如何重塑长音频处理范式
编程
VibeVoice 深度解析:微软开源语音AI的架构革命,7.5Hz帧率如何重塑长音频处理范式
2026-04-22 01:51:38 +0800 CST
view 189
微软开源VibeVoice语音AI模型家族深度解析,7.5Hz超低帧率连续语音Tokenizer、Next-Token Diffusion架构、ASR长音频识别、TTS多说话人合成、实时流式语音生成,附完整代码实战与生产部署指南
VibeVoice
语音AI
ASR
TTS
微软开源
扩散模型
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 446
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
DBCooker深度解析:当大语言模型学会给数据库「写代码」,SIGMOD 2026 论文揭示的自动化革命
编程
DBCooker深度解析:当大语言模型学会给数据库「写代码」,SIGMOD 2026 论文揭示的自动化革命
2026-04-23 03:10:18 +0800 CST
view 191
深度解析SIGMOD 2026论文DBCooker:上交大联合清华等机构提出的AI自动生成数据库原生函数系统,准确率比Claude Code等竞争对手高34.55%,成功为SQLite添加17个新函数。
AI
数据库
大语言模型
PostgreSQL
SQLite
DuckDB
代码生成
SIGMOD
自动化
GitHub Copilot Rubber Duck 深度解析:当"橡皮鸭"成为程序员的跨模型智囊——从单一AI到异构协作的工程革命
编程
GitHub Copilot Rubber Duck 深度解析:当"橡皮鸭"成为程序员的跨模型智囊——从单一AI到异构协作的工程革命
2026-04-14 09:57:18 +0800 CST
view 441
2021年,GitHub Copilot横空出世,程序员们欢呼终于有了"永不疲倦的结对编程伙伴"。四年后的2026年,AI编程助手已进化到能够自主规划任务、执行多步骤复杂工程,但一个根本性的悖论始终如影随形——**单一AI模型再强,它的盲点始终是它自己**。 一个经过海量代码训练的模型,会对自己训练数据中反复出现的模式产生"舒适区依赖";一个擅长生成式创造的模型,可能对边界条件的检查天然迟钝;一个专注于代码质量的模型,可能对性能优化的空间视而不见。这些不是Bug,而是任何单一智能体的固有局限。 4月8日,微
GitHub Copilot
Rubber Duck
AI编程
跨模型协作
代码审查
Claude
GPT
工程实践
VibeVoice 深度解析:微软如何用双分词器与扩散解码器重新定义语音AI的天花板
编程
VibeVoice 深度解析:微软如何用双分词器与扩散解码器重新定义语音AI的天花板
2026-04-14 11:25:32 +0800 CST
view 304
深度解析微软开源的 VibeVoice 语音 AI 框架,涵盖双分词器架构、σ-VAE 声学分词器、语义分词器、扩散解码器、长序列建模等核心技术,配完整代码示例和本地部署教程。
VibeVoice
微软
语音AI
TTS
ASR
扩散模型
tokenizer
开源
GPT-Image-2深度解析:让AI先思考再画图,一句话生成专业级视觉内容
编程
GPT-Image-2深度解析:让AI先思考再画图,一句话生成专业级视觉内容
2026-04-23 15:54:58 +0800 CST
view 176
2026年4月22日OpenAI发布GPT-Image-2,以1512分登顶Arena.AI图像榜单,断层领先第二名Google Nano-banana-2达242分。它是全球首个具备思考能力的图像生成模型:联网搜索+规划布局+自我复核,三步智能流水线让AI先想后画。
GPT-Image-2
OpenAI
图像生成
AI绘图
自回归模型
Arena评测
开源!低代码AI模型训练系统:工业级智能开发平台深度解析
案例
开源!低代码AI模型训练系统:工业级智能开发平台深度解析
2026-05-05 19:05:49 +0800 CST
view 198
开源低代码AI模型训练系统,工业级智能开发平台,图像采集、智能检测、数据标注、模型训练四大模块,单张检测<2秒,字符识别率≥99.5%
AI
深度学习
工业智能
低代码
机器视觉
模型训练
工业质检
百度 ERNIE-Image 文生图模型深度解析:8B参数可商用,24G显卡即可运行
资讯
百度 ERNIE-Image 文生图模型深度解析:8B参数可商用,24G显卡即可运行
2026-04-23 16:22:16 +0800 CST
view 313
百度开源了ERNIE-Image文生图模型,基于DiT架构,仅8B参数,可在24G显存显卡上运行。该模型在GenEval和LongTextBench基准测试中表现优异,尤其擅长文字渲染、指令遵循和结构化生成(如海报、漫画)。提供标准版(50步)和Turbo版(8步),支持Diffusers、SGLang和ComfyUI部署,完全开源可商用。
AI绘画
开源模型
百度
图像生成
文字渲染
海报设计
漫画创作
技术教程
Onyx 深度解析:当开源 AI 平台重新定义企业级智能中台
编程
Onyx 深度解析:当开源 AI 平台重新定义企业级智能中台
2026-04-14 18:24:03 +0800 CST
view 229
深入解析 GitHub 26k Stars 的开源企业级 AI 平台 Onyx,涵盖 LLM-Agnostic 架构设计、混合检索+知识图谱 RAG 系统、定制化 Agent、多数据源连接器、企业级安全等核心能力
AI平台
RAG
开源
企业级
Onyx
Agent
多模型
Kubernetes
Claude Mythos Preview 深度解析:Anthropic 史上最强模型为何被「关进笼子」?
编程
Claude Mythos Preview 深度解析:Anthropic 史上最强模型为何被「关进笼子」?
2026-05-13 21:18:14 +0800 CST
view 121
Claude Mythos Preview是Anthropic史上最强模型,2026年4月发布即被关进笼子——未经专项训练就自主发现数千个零日漏洞。本文深度解析其核心能力、被锁仓原因及对网络安全行业的影响。
Claude
AI模型
零日漏洞
网络安全
Anthropic
GLM-OCR 深度解析:0.9B 参数的文档理解小钢炮,OmniDocBench 拿下 94.62 分的秘密
编程
GLM-OCR 深度解析:0.9B 参数的文档理解小钢炮,OmniDocBench 拿下 94.62 分的秘密
2026-05-13 22:15:56 +0800 CST
view 94
GLM-OCR是智谱AI推出的0.9B参数文档理解多模态模型,凭借布局感知两阶段流水线和GRPO强化学习,在OmniDocBench v1.5以94.62分领先。本文深度解析其CogViT架构、MTP解码加速、印章识别技术及完整部署实战。
GLM-OCR,智谱AI,OCR,多模态模型,文档理解
TimesFM 深度解析:Google Research 的时序预测基础模型,如何让预测速度提升 5 倍
编程
TimesFM 深度解析:Google Research 的时序预测基础模型,如何让预测速度提升 5 倍
2026-05-14 00:45:45 +0800 CST
view 92
TimesFM是Google Research开源的时序预测基础模型,支持Zero-Shot推理,预测速度比LSTM快15倍。本文深度解析其Decoder-Only Transformer架构、Next Patch Prediction预训练目标、代码实战及性能优化技巧。
TimesFM
Google
时序预测
基础模型
Transformer
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
编程
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
2026-05-14 01:14:23 +0800 CST
view 133
ReAct框架是AI Agent的核心架构范式,通过Thought-Action-Observation循环实现智能推理与行动。本文深度解析其从字符串解析到原生Tool Calling的演进历程、LangGraph状态机架构、代码实战及最佳实践。
ReAct,AI Agent,TAO循环,Function Calling,LangGraph,大语言模型,深度学习,Python,机器学习,智能体
Docker AI Toolkit 2026 深度解析:从镜像构建到推理服务,AI 工作流的全链路重构
编程
Docker AI Toolkit 2026 深度解析:从镜像构建到推理服务,AI 工作流的全链路重构
2026-05-14 01:55:02 +0800 CST
view 84
Docker AI Toolkit 2026于2026年3月1日发布,原生支持PyTorch 2.4、TensorFlow 2.17、ONNX Runtime 1.19一键构建,Sigstore签名+OIDC身份绑定防止供应链攻击,docker ai serve --adaptive自适应推理让GPU利用率稳定在80%,LLM微调延迟压至83ms,WASM沙箱让边缘AI应用启动时间<100ms。
Docker,AI Toolkit,PyTorch,TensorFlow,ONNX Runtime,模型签名验证,Sigstore,WASM沙箱,自适应推理
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
编程
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
2026-05-14 03:40:08 +0800 CST
view 107
2026年奇点智能技术大会正式提出AI原生前端开发范式,LLM不再只是辅助工具而是编译过程的一部分。深度解析LLM-as-Compiler、编译时语义理解、声明式UI合成及Vite5.4+插件调用本地MoE模型的技术实现。
AI原生前端,LLM-as-Compiler,编译时语义理解,声明式UI合成,Vite5.4,MoE模型
20行Python代码:构建你的第一个机器学习模型
编程
20行Python代码:构建你的第一个机器学习模型
2024-11-18 14:51:32 +0800 CST
view 1554
本文介绍了如何用20行Python代码构建一个简单的机器学习模型,重点讲解了机器学习的核心概念,如监督学习、特征和标签。通过房价预测的实例,展示了如何使用scikit-learn库进行数据准备、模型训练、预测和评估。最后,讨论了性能优化的注意事项,如特征缩放和正则化,强调了Python在机器学习中的强大和简洁。
机器学习
编程
数据科学
Python
模型构建
综合
Llama 3.1 Omni:颠覆性的文本与语音双输出模型
2024-11-19 09:57:33 +0800 CST
view 1690
Llama3.1Omni模型是一种创新的多模态语言模型,能够同时生成文本和语音,提升用户体验。它适用于客户服务、教育和医疗等多个领域,具有强大的推理能力和生成质量。该模型开源,易于使用,开发者可以根据需求进行定制。Llama3.1Omni的出现为AI应用带来了更智能和多样化的可能性,值得关注和应用。
人工智能
语言模型
多模态交互
开源技术
用户体验
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
编程
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
2026-05-19 12:42:27 +0800 CST
view 69
2026年,边缘AI不再只是云端模型的精简版。本文深入剖析DeepSeek-R1 CPU版的技术原理,从模型蒸馏、量化技术的底层原理到生产环境的完整部署方案,提供可直接落地的代码和可量化的性能数据。
DeepSeek
R1
边缘计算
AI推理
模型蒸馏
量化
llama.cpp
Ollama
端侧AI
5ire:MCP原生的跨平台桌面AI助手,支持本地知识库+多模型自由切换
编程
5ire:MCP原生的跨平台桌面AI助手,支持本地知识库+多模型自由切换
2026-04-16 19:04:26 +0800 CST
view 280
5ire是一款开源跨平台桌面AI助手(1.5K Stars),原生支持MCP协议,可接入多模型并构建本地知识库,支持docx/pdf/excel等文档向量化,适合隐私敏感场景。
AI
MCP
桌面助手
开源
知识库
RAG
多模型
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
综合
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
2024-11-18 19:34:19 +0800 CST
view 1806
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程。它提供多种工具,如集成梯度、SaliencyMap和DeepLift,帮助开发者理解模型对输入数据的依赖关系和特征重要性。Captum提升了模型的透明度和可解释性,适用于模型审查、优化和调试等场景。
深度学习
模型解释
机器学习
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
下一页