程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
案例
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
2026-05-09 07:36:45 +0800 CST
view 552
Google开源AI神器AI Edge Gallery斩获2.2万Star,支持iOS和Android手机离线运行Gemma 4等大模型,提供AI Chat、Ask Image、Audio Scribe、Agent Skills四大功能,消费级入口形态让普通用户轻松体验端侧AI
端侧AI
手机大模型
离线推理
Gemma 4
Google开源
iOS
Android
端侧大模型深度解析:当AI走出云端、住进你的手机——从千亿参数到4B模型的边缘智能革命
编程
端侧大模型深度解析:当AI走出云端、住进你的手机——从千亿参数到4B模型的边缘智能革命
2026-04-15 21:23:26 +0800 CST
view 463
2026年端侧大模型技术深度解析:从千亿参数云端模型到4B端侧模型的工程革命,涵盖量化、蒸馏、架构优化与Mano-P实战案例
端侧大模型
边缘AI
模型量化
知识蒸馏
Mano-P
GUI智能体
TinyML
AI手机
MonkeyCode:免费开云端开发环境,手机也能写代码提GitHub,长亭科技推出的在线AI开发平台
编程
MonkeyCode:免费开云端开发环境,手机也能写代码提GitHub,长亭科技推出的在线AI开发平台
2026-06-17 12:58:35 +0800 CST
view 104
MonkeyCode是长亭科技推出的企业级在线AI开发平台,免费开云端开发环境,手机端也能编程和提GitHub,支持GLM 5.1/Kimi 2.6/GPT-5.5等多模型,内置技能库,开源在GitHub。
MonkeyCode
长亭科技
AI开发平台
云端开发
在线编程
手机编程
开源
Chaitin
云端IDE
联系我们
联系我们
联系我们
2024-11-19 02:17:12 +0800 CST
view 4034
芊诺网络专注于互联网品牌建设与网络营销,提供包括品牌网站建设、移动应用定制、微信开发等服务。我们将策略与执行相结合,通过不断沟通和优化,为客户提供一站式的品牌整合方案。我们与各类企业紧密合作,积累了丰富的经验,致力于为客户带来惊喜与价值。
api接口对接
小程序定制
电脑手机网站开发
MiniCPM-V 4.6 手机实测:1.3B参数跑满端侧推理,输入框还没缩回结果就出来了
编程
MiniCPM-V 4.6 手机实测:1.3B参数跑满端侧推理,输入框还没缩回结果就出来了
2026-05-13 17:56:16 +0800 CST
view 356
MiniCPM-V 4.6手机实测体验:输入框还没缩回结果就出来了。1.3B参数推理版token消耗仅为Qwen3.5-0.8B的1/43,TTFT高清大图75.7ms快2.2倍,LLaVA-UHD v4架构视觉编码运算量降低55.8%。
MiniCPM-V
面壁智能
端侧AI
手机AI
多模态
AI 控制 Mac 电脑和手机的 MCP/Skill 方案全解析
案例
AI 控制 Mac 电脑和手机的 MCP/Skill 方案全解析
2026-04-27 06:46:32 +0800 CST
view 433
盘点 2025-2026 年主流的 AI 控制 Mac 电脑和手机的 MCP/Skill 方案,包括 computer-use-mcp、mobile-mcp、DesktopCommanderMCP 等,附选型建议和安全提醒。
MCP
AI自动化
Mac
手机控制
Computer Use
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
编程
MusaCoder 深度实战:当国产GPU遇见AI驱动的Kernel生成——从PyTorch到CUDA/MUSA原生算子的全栈训练完全指南(2026)
2026-06-16 06:47:47 +0800 CST
view 165
MusaCoder是首个基于国产GPU完成全链路训练的代码大模型,在KernelBench上超越Claude Opus 4.7。从三阶段数据合成、多样性RFT到执行反馈RL,深度解析全栈训练方法论。
MusaCoder
GPU Kernel
摩尔线程
国产GPU
CUDA
MUSA
大模型
强化学习
KernelBench
代码大模型
AI Coding
深度学习
MiniMax M3 开源:当 428B 参数遇见自研 MSA 稀疏注意力——从架构革命到编程超 GPT-5.5 的生产级完全指南(2026)
编程
MiniMax M3 开源:当 428B 参数遇见自研 MSA 稀疏注意力——从架构革命到编程超 GPT-5.5 的生产级完全指南(2026)
2026-06-16 09:47:42 +0800 CST
view 183
MiniMax M3 428B参数开源大模型深度解析:自研MSA稀疏注意力架构、编程能力超越GPT-5.5、1M上下文、原生多模态,从底层原理到生产部署的完全指南
MiniMax M3
MSA稀疏注意力
开源大模型
大模型技术
AI编程
MiniMind-O 深度实战:从0训练0.1B全模态Omni模型——2026年极简大模型工程化完全指南
编程
MiniMind-O 深度实战:从0训练0.1B全模态Omni模型——2026年极简大模型工程化完全指南
2026-05-24 16:30:13 +0800 CST
view 313
MiniMind-O 以仅0.1B参数实现能听能说能看的全模态Omni能力,4张RTX 3090仅需4小时完成训练。本文深入剖析Thinker-Talker双路架构、编码器融合技术,并提供从数据处理到推理部署的完整工程化指南。
MiniMind-O
全模态模型
Omni模型
大模型训练
多模态AI
边缘计算
Kimi K2.6 开源深度测评:国产模型首次登顶全球代码榜首,开发者必须知道的那些事
编程
Kimi K2.6 开源深度测评:国产模型首次登顶全球代码榜首,开发者必须知道的那些事
2026-04-28 15:51:45 +0800 CST
view 818
2026年4月20日月之暗面发布Kimi K2.6,在SWE-Bench Pro拿下58.6分首次超越GPT-5.4和Claude Opus 4.6。本文从技术架构、代码实测、API集成、性能优化、工具链集成等维度进行深度测评。
AI大模型
代码工具
Kimi
月之暗面
开源模型
SWE-Bench
开发者工具
代码审查
Google TimesFM 深度解析:14K Star 的时间序列基础模型如何用 200M 参数颠覆零样本预测
编程
Google TimesFM 深度解析:14K Star 的时间序列基础模型如何用 200M 参数颠覆零样本预测
2026-04-28 18:22:55 +0800 CST
view 426
深度解析 Google TimesFM:200M 参数如何在 1000 亿时间点上预训练后实现零样本超越有监督模型,覆盖架构原理、代码实战、性能对比与生产部署完整指南。
AI大模型
时间序列预测
Google
TimesFM
零样本预测
深度学习
GitHub开源
预训练模型
DeepSeek 专家模式深度解析:当低调更新成为AGI赛道的产品哲学宣言
编程
DeepSeek 专家模式深度解析:当低调更新成为AGI赛道的产品哲学宣言
2026-04-09 10:23:56 +0800 CST
view 540
2026年4月8日,DeepSeek悄然上线「专家模式」,无发布会无公告,却被业内视为V4发布前最有分量的产品预告。本文深度拆解双模式技术架构差异,实测数理推理、专业编程、创意写作三大场景,并解读这一低调更新背后的产品哲学与行业信号。
DeepSeek
AI大模型
V4
专家模式
推理模型
产品设计
国产AI
场景分层
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 488
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
编程
DFlash 深度实战:块扩散模型如何实现 6 倍无损加速——从自回归瓶颈到并行生成的范式跃迁
2026-05-23 11:16:44 +0800 CST
view 281
深度解析UC San Diego Z Lab提出的DFlash(Block Diffusion for Flash Speculative Decoding),详解块扩散草稿模型如何突破自回归瓶颈,在Qwen3-8B上实现6倍无损加速的架构原理、训练方法与生产级实战代码
LLM推理,投机解码,块扩散模型,大模型加速,DFlash,Speculative Decoding,UC San Diego,PyTorch,深度学习,AI推理优化
MiniMax M3 开源旗舰深度实战:当 428B 参数遇上自研 MSA 稀疏注意力——从百万级上下文到 SWE-Bench 超越 GPT-5.5、从 ICLR 论文自主复现到 CUDA 算子 9.4× 加速的生产级完全指南(2026)
编程
MiniMax M3 开源旗舰深度实战:当 428B 参数遇上自研 MSA 稀疏注意力——从百万级上下文到 SWE-Bench 超越 GPT-5.5、从 ICLR 论文自主复现到 CUDA 算子 9.4× 加速的生产级完全指南(2026)
2026-06-22 18:23:16 +0800 CST
view 39
MiniMax M3 是 2026 年首个同时集齐百万级上下文、顶尖编程能力、原生多模态的开源旗舰大模型。本文深度拆解其自研 MSA 稀疏注意力架构、基准测试数据、API 实战调用、本地部署方案,以及三个震撼的真实案例复盘。
MiniMax M3
MSA稀疏注意力
大模型
开源模型
AI编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 312
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
MiniMax M3 深度实战:国产大模型首次在编程能力上超越 GPT-5.5——从 MSA 稀疏注意力架构到百万 Token 生产级部署的完全指南(2026)
编程
MiniMax M3 深度实战:国产大模型首次在编程能力上超越 GPT-5.5——从 MSA 稀疏注意力架构到百万 Token 生产级部署的完全指南(2026)
2026-06-03 05:14:49 +0800 CST
view 455
2026年6月 MiniMax M3 发布,SWE-Bench Pro 59.0% 超越 GPT-5.5。深度解析 MSA 稀疏注意力、百万Token上下文工程实现、原生多模态融合、Computer Use 架构及生产级部署实战。
MiniMax M3
大模型
稀疏注意力
AI编程
开源模型
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
编程
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
2026-06-12 17:21:39 +0800 CST
view 124
2026年6月Google发布DiffusionGemma,首个生产级文本扩散大模型,本地推理速度提升4倍。本文深入剖析其从自回归到并行生成的架构革命,附完整代码实战。
DiffusionGemma
文本扩散
本地AI
Gemma
大模型推理
扩散模型
Python
Ollama
Qwen3.5小模型深度解析:打破参数内卷,十亿级成本实现百亿级性能
编程
Qwen3.5小模型深度解析:打破参数内卷,十亿级成本实现百亿级性能
2026-05-17 20:51:43 +0800 CST
view 399
深度解析Qwen3.5系列小模型的技术架构、性能表现、部署实践和应用场景,涵盖混合注意力、原生多模态、MoE优化等核心技术。
Qwen3.5
小模型
AI
大模型
多模态
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 478
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
MiniMax M3 & MSA 深度实战:当国产大模型用「稀疏注意力」重写 Transformer 规则——从 1M 上下文架构原理到生产级 Agent 部署的完全指南(2026)
编程
MiniMax M3 & MSA 深度实战:当国产大模型用「稀疏注意力」重写 Transformer 规则——从 1M 上下文架构原理到生产级 Agent 部署的完全指南(2026)
2026-06-13 23:46:46 +0800 CST
view 201
深度拆解MiniMax M3的MSA稀疏注意力架构:两级路由原理、MSA vs MoE技术对比、1M上下文实战、Agent部署、性能基准测试、选型决策指南
MiniMax M3
MSA
稀疏注意力
大模型
Agent
AI
Transformer
开源模型
Microsoft BitNet 深度实战:1比特大模型推理框架——让CPU跑起千亿参数模型的技术革命(2026完全指南)
编程
Microsoft BitNet 深度实战:1比特大模型推理框架——让CPU跑起千亿参数模型的技术革命(2026完全指南)
2026-05-26 12:35:43 +0800 CST
view 235
深入解析 Microsoft BitNet 1比特大模型推理框架,从原理到实战,让CPU跑起千亿参数模型。包含完整代码示例、性能优化策略和应用场景分析。
BitNet
模型量化
大模型推理
CPU推理
1-bit LLM
DFlash 深度实战:当扩散模型遇上推测解码——从原理到生产级 LLM 推理加速完全指南(2026)
编程
DFlash 深度实战:当扩散模型遇上推测解码——从原理到生产级 LLM 推理加速完全指南(2026)
2026-06-06 01:38:49 +0800 CST
view 237
DFlash(Block Diffusion for Flash Speculative Decoding)是ZLab于2026年提出的LLM推理加速框架,用块扩散模型替代传统自回归草稿模型,实现6倍以上无损加速。
LLM推理加速
推测解码
扩散模型
块扩散
DFlash
ZLab
大模型优化
Ollama 深度实战:当本地大模型成为生产级基础设施——从模型量化到高并发推理、从 REST API 到 Kubernetes 部署的完全指南(2026)
编程
Ollama 深度实战:当本地大模型成为生产级基础设施——从模型量化到高并发推理、从 REST API 到 Kubernetes 部署的完全指南(2026)
2026-06-20 01:25:22 +0800 CST
view 120
Ollama本地大模型生产级部署完全指南:从GGUF格式原理、INT4/INT8量化实战、REST API集成、多语言SDK(Python/Go/TypeScript)、GPU显存管理、Kubernetes+Helm生产部署、性能调优到RAG知识库构建,全流程深度实战。
Ollama
本地大模型
LLM部署
模型量化
GGUF
llama.cpp
REST API
Kubernetes
GPU
RAG
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
8
下一页