程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Gemma 4 12B 深度实战:当 Google 把多模态 AI「塞进」你的笔记本——从无编码器架构到本地 Agent 工作流的完全指南(2026)
编程
Gemma 4 12B 深度实战:当 Google 把多模态 AI「塞进」你的笔记本——从无编码器架构到本地 Agent 工作流的完全指南(2026)
2026-06-13 12:46:40 +0800 CST
view 8
深度解析 Google DeepMind Gemma 4 12B 无编码器多模态架构,从架构原理到本地部署,从 Agent 工具链集成到生产级实战,5400+ 字完全指南。
Gemma 4 12B
Google DeepMind
多模态模型
本地推理
Agent
Ollama
无编码器架构
AI Agent 沙箱三国杀:OpenSandbox vs CubeSandbox vs E2B,从内核隔离到秒级调度的全链路技术拆解
编程
AI Agent 沙箱三国杀:OpenSandbox vs CubeSandbox vs E2B,从内核隔离到秒级调度的全链路技术拆解
2026-05-02 06:06:14 +0800 CST
view 602
深度拆解阿里OpenSandbox、腾讯CubeSandbox与E2B三大AI Agent沙箱方案,从内核隔离原理、API协议设计、调度架构、性能实测到生产部署全链路技术分析
OpenSandbox
CubeSandbox
E2B
AI Agent
沙箱
KVM
Docker
Kubernetes
eBPF
RustVMM
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 526
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
编程
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
2026-06-12 17:21:39 +0800 CST
view 24
2026年6月Google发布DiffusionGemma,首个生产级文本扩散大模型,本地推理速度提升4倍。本文深入剖析其从自回归到并行生成的架构革命,附完整代码实战。
DiffusionGemma
文本扩散
本地AI
Gemma
大模型推理
扩散模型
Python
Ollama
Lilishop:全开源 Java 多商户商城系统,一套代码通吃 PC、H5 和小程序
编程
Lilishop:全开源 Java 多商户商城系统,一套代码通吃 PC、H5 和小程序
2026-05-12 12:12:44 +0800 CST
view 247
Lilishop是一个全开源的Java B2B2C多商户商城系统,基于SpringBoot+Vue+uni-app,一套代码通吃PC/H5/小程序/APP,支持多商家入驻、分销、秒杀拼团、Elasticsearch搜索、Docker部署。
Lilishop
Java商城
B2B2C
多商户
开源电商
uni-app
Deno 3.0 深度解析:模块系统彻底重构与动态权限沙箱的范式革命
编程
Deno 3.0 深度解析:模块系统彻底重构与动态权限沙箱的范式革命
2026-05-12 15:46:49 +0800 CST
view 176
深度解析Deno 3.0运行时环境核心变化:模块系统彻底重构(支持ESM/CJS/UMD无缝互操作)、动态权限沙箱从默认安全到主动防御、安全令牌临时权限提升、V8 12.8引擎冷启动提升172%、SSPL许可证变更影响。包含架构解析与迁移实战。
Deno3
Deno运行时
JavaScript运行时
V8 12.8
动态权限沙箱
模块系统重构
SSPL许可证
Node.js替代
Go 1.25 GreenTea GC 深度解析:当垃圾回收器学会"批量思维"——从对象级扫描到页级处理的性能革命
编程
Go 1.25 GreenTea GC 深度解析:当垃圾回收器学会"批量思维"——从对象级扫描到页级处理的性能革命
2026-04-15 20:21:19 +0800 CST
view 341
Go 1.25 带来革命性的 GreenTea 垃圾回收器,通过页级处理和 AVX-512 向量指令,将 GC 时间减少 10%-40%。本文深入剖析其设计哲学、核心算法、实现细节和性能影响。
Go
GC
GreenTea
AVX-512
性能优化
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
编程
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
2026-04-09 04:54:56 +0800 CST
view 603
Google于2026年4月发布Gemma 4开源模型系列,首次全面切换Apache 2.0许可证,搭载Per-Layer Embedding架构创新,26B MoE以3.8B激活参数击败Qwen3-235B。本文深度解析PLE架构、稀疏激活机制与全规格产品矩阵。
Gemma 4
Google
开源模型
Apache 2.0
MoE
Per-Layer Embedding
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
编程
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
2026-06-04 21:14:37 +0800 CST
view 102
深入剖析 Google AI Edge Gallery 的技术架构、Gemma 模型家族、端侧部署全流程,并通过完整代码示例,带你从零构建一个生产级本地 AI 应用。
Google AI Edge Gallery
本地AI
Gemma模型
端侧推理
Mac AI
Android AI
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
案例
Google AI Edge Gallery:手机离线跑大模型时代来了,2.2万Star端侧AI神器
2026-05-09 07:36:45 +0800 CST
view 439
Google开源AI神器AI Edge Gallery斩获2.2万Star,支持iOS和Android手机离线运行Gemma 4等大模型,提供AI Chat、Ask Image、Audio Scribe、Agent Skills四大功能,消费级入口形态让普通用户轻松体验端侧AI
端侧AI
手机大模型
离线推理
Gemma 4
Google开源
iOS
Android
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 410
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 418
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
编程
DeepSeek DeepGEMM 2026年4月重磅更新:Mega MoE融合算子、FP4精度与极致性能优化
2026-04-23 08:41:45 +0800 CST
view 298
深度解析DeepSeek DeepGEMM 2026年4月重大更新:Mega MoE融合算子(dispatch+Linear+SwiGLU+Combine五合一,NVLink通信与Tensor Core计算重叠)、FP8xFP4 GEMM、FP4 Indexer、PDL调度优化与JIT加速,附完整代码实战。
DeepGEMM
DeepSeek
GPU优化
CUDA
FP8
FP4
MoE
AI Infra
高性能计算
NVIDIA
Gemma MacOS Tuner 深度解析:在 Apple Silicon 上用 PyTorch 和 MPS 高效微调多模态 Gemma
编程
Gemma MacOS Tuner 深度解析:在 Apple Silicon 上用 PyTorch 和 MPS 高效微调多模态 Gemma
2026-04-09 01:14:39 +0800 CST
view 806
详解 gemma-tuner-multimodal 项目:在 Apple Silicon 上通过 PyTorch MPS 后端对 Google Gemma 系列模型进行 LoRA 微调,支持文本、图像、音频三种模态,完全本地运行,数据不出机器,零 NVIDIA GPU 依赖。
Gemma
Apple Silicon
PyTorch
MPS
LoRA
微调
Machine Learning
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 290
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
编程
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
2026-05-11 09:52:48 +0800 CST
view 363
智谱AI发布GLM-5V-Turbo多模态编程基座模型,从预训练阶段原生融合视觉与语言,在Design2Code基准测试中以94.8分超越所有竞品。本文深度解析CogViT视觉编码器、MMTP多模态多Token预测、多任务RL优化等技术细节,以及如何用API接入实现从设计稿到可运行代码的完整工作流。
GLM-5V-Turbo
视觉编程
Design2Code
多模态
CogViT
MMTP
智谱AI
AI编程
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
编程
Claude Memory Compiler 深度解析:当 AI 编程助手第一次拥有「编译器思维」的记忆系统
2026-04-10 03:35:31 +0800 CST
view 533
claude-memory-compiler 把 AI 对话当作源代码,用 LLM 编译成结构化知识库,让 Claude Code 拥有跨会话记忆能力
Claude Code
AI Agent
Knowledge Management
LLM
Memory System
React Compiler 深度解析:让 React 终于学会「自动优化」的编译器魔法
编程
React Compiler 深度解析:让 React 终于学会「自动优化」的编译器魔法
2026-05-12 02:15:08 +0800 CST
view 258
深度解析React Compiler(React Forget)的工作原理:通过静态分析自动推导依赖关系、自动插入useMemo/useCallback记忆化代码、构建数据流图与活性分析算法、Babel插件实现细节、与手动优化性能对比,附Vite/Next.js集成指南与渐进式迁移策略
React,React Compiler,性能优化,自动记忆化,useMemo,useCallback,React.memo,Babel插件,静态分析,前端性能
MemPalace 深度解析:记忆宫殿架构如何让 AI Agent 告别"金鱼记忆"
编程
MemPalace 深度解析:记忆宫殿架构如何让 AI Agent 告别"金鱼记忆"
2026-06-10 11:48:11 +0800 CST
view 62
深度解析 MemPalace——54k Stars 的开源 AI Agent 记忆系统,用记忆宫殿架构实现 96.6% R@5 召回率,无需 API key 完全本地运行。
AI Agent
MemPalace
记忆系统
MCP
向量检索
LongMemEval
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
编程
ASMR 彻底颠覆 RAG:Supermemory 如何以 99% 准确率重新定义 AI Agent 永久记忆
2026-05-28 15:44:20 +0800 CST
view 215
ASMR(Agentic Search and Memory Retrieval)在 LongMemEval 基准测试中以 99% 准确率刷新世界纪录,彻底颠覆传统 RAG 方案。本文深入解析 ASMR 的 Observer Agents、Search Agents、Memory Graph 三大核心组件,以及无向量数据库的实现原理。
ASMR
AI Agent
永久记忆
LongMemEval
Supermemory
RAG替代
Supermemory 深度实战:AI 时代的 Memory API 完全指南——从记忆引擎架构到生产级集成的完整解析(2026)
编程
Supermemory 深度实战:AI 时代的 Memory API 完全指南——从记忆引擎架构到生产级集成的完整解析(2026)
2026-06-01 19:52:22 +0800 CST
view 170
Supermemory 是 AI 时代的 Memory Engine,自动提取事实、处理矛盾、构建用户画像。本文深入解析其架构原理、API 使用、集成实战(Vercel AI SDK、LangChain、OpenClaw)、性能优化与生产部署,并对比 Mem0、Zep 等竞品。
AI
Memory
Supermemory
LLM
编程
vue-element-admin 深度解析:90K Star 后台管理标杆,MIT 协议接私活首选
编程
vue-element-admin 深度解析:90K Star 后台管理标杆,MIT 协议接私活首选
2026-05-16 18:36:31 +0800 CST
view 254
GitHub 90K Star 的 Vue2 后台管理集成方案深度解析:权限系统、i18n、Mock、布局架构完整拆解,MIT 协议接私活首选。
vue-element-admin
Vue
Element UI
后台管理
开源
MIT
综合
FcDesigner:低代码表单设计平台
2024-11-19 03:50:18 +0800 CST
view 2125
FcDesigner是一个基于Vue和ElementPlus/ElementUI的低代码表单设计平台,支持拖拽操作,适配Vue2和Vue3,内置中英文国际化,提供36种组件和灵活的事件绑定,允许用户无需代码即可可视化编辑表单。该平台支持复杂布局和多种表单配置,适合快速开发和设计表单界面。
低代码
表单设计
前端开发
ElementUI
ElementPlus
vue
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 如何以 4 倍速度颠覆 AI 编程——从基准测试到生产级 Agent 开发完全指南
2026-05-23 01:16:34 +0800 CST
view 234
2026年Google I/O大会深度解析:Gemini 3.5 Flash以289 tokens/s的输出速度4倍碾压竞品,从基准测试、技术架构到生产级Agent开发实战,全面解读谷歌Agentic AI战略。
Google I/O 2026
Gemini 3.5 Flash
AI编程
Agent开发
基准测试
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
29
下一页