程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
OpenHarness 深度解析:当 1.1 万行 Python 把闭源巨头的 51.2 万行代码「压缩」成开源自由
编程
OpenHarness 深度解析:当 1.1 万行 Python 把闭源巨头的 51.2 万行代码「压缩」成开源自由
2026-04-11 06:59:04 +0800 CST
view 467
港大开源 OpenHarness,用 1.1 万行 Python 实现 Claude Code 98% 核心能力,体积缩小 44 倍,完全开源免费,模型无关。深度解析其 10 大子系统架构、工具系统、记忆系统、安全治理等核心模块。
AI Agent
开源
Python
Claude Code
香港大学
大模型
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
编程
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
2026-04-11 10:24:48 +0800 CST
view 543
深度解析 Apple Silicon 上的视觉语言模型推理引擎 MLX-VLM,涵盖架构设计、模型支持、性能优化与实战部署。
Apple Silicon
MLX
视觉语言模型
VLM
Mac本地AI
多模态推理
MiniCPM-o 2.6 深度解析:8B参数如何在iPad上跑出GPT-4o级全模态性能——端侧多模态大模型的工程化突破
编程
MiniCPM-o 2.6 深度解析:8B参数如何在iPad上跑出GPT-4o级全模态性能——端侧多模态大模型的工程化突破
2026-05-11 01:50:57 +0800 CST
view 236
深入解析MiniCPM-o 2.6:8B参数如何在iPad上实现GPT-4o级全模态性能,时分复用TDM机制、端到端架构、低延迟并发处理的技术内幕,附完整部署代码和性能优化实战
AI,MiniCPM,多模态,端侧模型,面壁智能
TurboQuant + RWKV-6:AI 推理效率双重突破——从内存压缩到线性架构,大模型部署范式的革命性重构
编程
TurboQuant + RWKV-6:AI 推理效率双重突破——从内存压缩到线性架构,大模型部署范式的革命性重构
2026-04-20 10:46:48 +0800 CST
view 290
深度解析 2026 年 AI 推理效率的双重突破:Google TurboQuant 实现 6 倍内存压缩与 8 倍速度提升,RWKV-6 以线性复杂度架构打破 Transformer 的二次方魔咒。从数学原理到代码实战,详解这场效率革命的本质。
TurboQuant
RWKV
AI推理
内存压缩
大模型
Rust在人工智能生成内容(AIGC)领域的应用
编程
Rust在人工智能生成内容(AIGC)领域的应用
2024-11-18 13:48:25 +0800 CST
view 1832
本文探讨了Rust在人工智能生成内容(AIGC)领域的应用,强调其安全性、高性能和并发性等优势。通过介绍Tch-rs和Rust-Bert等库,展示了Rust在深度学习和生成模型中的实际使用案例,包括神经网络和生成对抗网络(GAN)的实现。Rust的特性使其成为开发复杂AIGC项目的理想选择。
编程语言
人工智能
深度学习
生成模型
Rust
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 214
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
MCP + A2A 双协议时代:2026 AI Agent 互操作标准全景解析
编程
MCP + A2A 双协议时代:2026 AI Agent 互操作标准全景解析
2026-04-12 02:23:58 +0800 CST
view 770
深度解析2026年AI Agent互操作领域的两大核心协议MCP与A2A的设计理念、核心架构、代码实战与演进方向,探讨多Agent系统从单体走向协作的技术路径。
AI Agent
MCP
A2A
大模型
协议标准
2026技术趋势
Agent互操作
CC Switch:45K Star 的 AI 大模型万能遥控器,让 100+模型说同一种语言
案例
CC Switch:45K Star 的 AI 大模型万能遥控器,让 100+模型说同一种语言
2026-05-01 15:33:28 +0800 CST
view 944
GitHub 45K+ Star 的 CC Switch 是什么?详解这款大模型万能遥控器的核心功能、与 One API 的区别、以及如何配合 OpenClaw 使用。
CC Switch
AI工具
大模型
OpenClaw
Claude Code
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 261
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
超越 Docker:WebAssembly Component Model 如何重塑跨语言服务架构
编程
超越 Docker:WebAssembly Component Model 如何重塑跨语言服务架构
2026-04-20 22:48:34 +0800 CST
view 338
深度解析 Wasm 组件模型 + WIT 接口语言 + WASI 2.0 如何在服务端重构跨语言协作范式,含完整 Rust/Go 实战代码
WebAssembly
Wasm
组件模型
跨语言
WASI
WIT
服务端架构
全球永久免费大模型API盘点 + AI厂商系统提示词泄露项目一览
资讯
全球永久免费大模型API盘点 + AI厂商系统提示词泄露项目一览
2026-04-20 23:01:22 +0800 CST
view 795
2026年最全免费大模型API平台盘点(智谱GLM、Kimi、硅基流动、OpenRouter等10+平台),以及AI厂商系统提示词泄露开源项目一览,含Claude 16700字提示词分析和Claude Code源码泄露事件
AI
大模型
免费API
系统提示词
开源
Prompt
开发者
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
编程
Kimi K2.6 开源了!还附送了 300 个 Agent 员工?
2026-04-21 07:57:28 +0800 CST
view 403
Kimi K2.6开源发布,SWE-Bench Pro 58.6分超越GPT-5.4和Claude Opus 4.6,300个子Agent并行4000步骤持续5天
Kimi
开源
AI编程
Agent
月之暗面
SWE-Bench
大模型
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
编程
170亿参数撬动万亿算力:Llama 4 Scout/Maverick如何用MoE架构重新定义开源大模型
2026-05-11 20:48:39 +0800 CST
view 223
深度解析Llama 4 Scout/Maverick的MoE架构、128专家设计、1000万token超长上下文,附本地部署实战与许可证分析
Meta
Llama4
MoE
开源大模型
混合专家架构
Scout
Maverick
iRoPE
CVE-2026-7482深度剖析:30万台Ollama服务器的内存裸奔危机与防御实战
编程
CVE-2026-7482深度剖析:30万台Ollama服务器的内存裸奔危机与防御实战
2026-06-03 17:44:19 +0800 CST
view 29
Ollama高危漏洞CVE-2026-7482(BLEEDING LLAMA)深度剖析,CVSS 9.1分,攻击者可远程读取30万台服务器内存数据,提供企业级修复方案
安全
Ollama
GGUF
CVE
AI
大模型
漏洞
花3块钱、2小时训练一个64M的"小破模型",能干啥?
编程
花3块钱、2小时训练一个64M的"小破模型",能干啥?
2026-04-21 09:05:56 +0800 CST
view 265
MiniMind:从零手写完整LLM训练流水线,64M参数,2小时+3块钱训练完成,支持预训练+SFT+RLHF+工具调用,适合Multi-Agent/自动化/端侧集成
开源
LLM
PyTorch
模型训练
MiniMind
AI
工具调用
RLHF
Python中的shapley-regression库,重点在于如何安装、使用及其在机器学习模型中的应用
综合
Python中的shapley-regression库,重点在于如何安装、使用及其在机器学习模型中的应用
2024-11-19 05:02:08 +0800 CST
view 1600
本文介绍了Python中的shapley-regression库,重点在于如何安装、使用及其在机器学习模型中的应用。通过计算SHAP值,用户可以理解特征对模型预测的贡献,并利用可视化工具展示这些信息。文章涵盖了库的基本用法和高级用法,包括模型训练、SHAP值计算和特征重要性的可视化,适用于房价预测等实际案例。
数据分析
机器学习
模型解释
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
编程
2.8秒超越4小时调优:TabPFN如何用Transformer重写表格数据机器学习
2026-05-12 00:20:07 +0800 CST
view 259
深度解析TabPFN如何用Transformer架构重写表格数据机器学习范式:从合成数据预训练、先验数据拟合原理、2.8秒vs4小时性能对比,到TabPFN-2.5的10万行处理能力与SAP收购战略意义,附完整代码示例
TabPFN,表格数据,Transformer,AutoML,机器学习,XGBoost,PriorLabs,深度学习,基础模型,Python
WebAssembly Component Model 深度解析:从理论奠基到生产落地的完整指南
编程
WebAssembly Component Model 深度解析:从理论奠基到生产落地的完整指南
2026-04-21 10:20:21 +0800 CST
view 279
深度解析WebAssembly Component Model的设计理念、WIT接口定义语言、Canonical ABI机制、wit-bindgen实战用法,以及2026年主流运行时生态现状,帮助开发者建立完整的技术认知框架。
WebAssembly
WCM
WIT
wasmtime
跨语言互操作
服务器端Wasm
组件模型
VibeVoice 深度拆解:微软如何用 LLM+扩散模型重新发明语音合成——从双Tokenizer到90分钟超长对话的全链路技术实战
编程
VibeVoice 深度拆解:微软如何用 LLM+扩散模型重新发明语音合成——从双Tokenizer到90分钟超长对话的全链路技术实战
2026-05-02 22:34:34 +0800 CST
view 240
微软开源VibeVoice深度技术拆解:双Tokenizer架构、LLM对话中枢、Next-Token扩散模型、7.5Hz超低帧率,90分钟多角色对话生成的全链路实战
VibeVoice
语音合成
TTS
扩散模型
LLM
微软开源
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
编程
Ollama v0.14.3 深度实战:从本地部署到多模态 AI——2026 年私有化大模型工程化完全指南
2026-05-24 12:04:34 +0800 CST
view 108
Ollama v0.14.3 深度实战指南:从架构解析到生产部署,涵盖 GGUF 格式、API 集成、多模态模型、性能优化等核心内容,2026 年私有化大模型首选方案。
Ollama
大模型
本地部署
GGUF
多模态
pycm:一个强大的混淆矩阵库
综合
pycm:一个强大的混淆矩阵库
2024-11-18 16:17:54 +0800 CST
view 1709
pycm是一个用于生成和分析混淆矩阵的Python库,能够自动计算多种评估指标并提供可视化功能。本文介绍了pycm的安装、基本用法和高级用法,包括如何生成混淆矩阵、导出结果以及支持多标签和多类别分类的功能。通过实际案例展示了如何使用pycm评估机器学习模型的性能,是数据科学家和机器学习工程师的重要工具。
机器学习
数据科学
模型评估
工具
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
编程
Kimi K2.6 开源:12小时连续编码,300个Agent并行,4000次工具调用
2026-04-21 11:06:57 +0800 CST
view 405
Kimi K2.6 开源版发布:SWE-Bench Pro 58.6,多项榜单压GPT-5.4和Claude Opus 4.6,支持300个并行sub-agent、12小时持续编码、4000次工具调用,开源SOTA位置稳固
Kimi
K2.6
开源
SWE-Bench
Agent
Swarm
长程编码
AI编程
模型开源
HuggingFace
Moonshot
Gemini 2.5 Pro I/O 版深度实战:从思考模型到 AI 编程之巅——2026 年最强推理大模型工程化完全指南
编程
Gemini 2.5 Pro I/O 版深度实战:从思考模型到 AI 编程之巅——2026 年最强推理大模型工程化完全指南
2026-05-24 14:03:27 +0800 CST
view 173
2026年I/O大会后Gemini 2.5 Pro I/O版深度解析,涵盖动态思考、并行推理、百万token上下文、代码实战、性能优化全链路指南
AI
Gemini
Google
大模型
代码生成
英伟达免费开放H100算力:DeepSeek、Kimi、GLM等主流大模型API免费用
编程
英伟达免费开放H100算力:DeepSeek、Kimi、GLM等主流大模型API免费用
2026-04-21 13:09:34 +0800 CST
view 1324
英伟达Build平台免费开放H100算力和主流大模型API,支持DeepSeek、Kimi、GLM等,3步拿到Key,代码对接OpenAI格式即可使用。
NVIDIA
大模型
免费API
DeepSeek
Kimi
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
7
下一页