程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Chrome DevTools MCP 深度实战:当 AI 学会「看懂」网页——从 CDP 协议到生产级浏览器自动化的完全指南(2026)
编程
Chrome DevTools MCP 深度实战:当 AI 学会「看懂」网页——从 CDP 协议到生产级浏览器自动化的完全指南(2026)
2026-06-14 15:18:38 +0800 CST
view 10
深入剖析 Chrome DevTools MCP 的技术架构、协议设计、实战场景和性能优化,带你从原理到生产级部署,完整掌握这个改变 AI-浏览器交互范式的技术。
Chrome DevTools
MCP
CDP
AI Agent
浏览器自动化
前端调试
Vikusha:用500行Go代码揭开AI智能体的神秘面纱——从Agent Loop到生产级框架的完整实战
编程
Vikusha:用500行Go代码揭开AI智能体的神秘面纱——从Agent Loop到生产级框架的完整实战
2026-05-19 18:16:11 +0800 CST
view 215
深入解析Vikusha框架如何用500行Go代码揭示AI智能体的核心原理Agent Loop,从概念模型到生产级代码的完整实战指南
Go语言
AI Agent
Agent Loop
智能体框架
Vikusha
Google I/O 2026 深度解析:Gemini 3.5 Flash 横空出世,Agent 时代的计算范式革命
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 横空出世,Agent 时代的计算范式革命
2026-05-21 18:57:35 +0800 CST
view 624
2026年5月Google I/O大会发布Gemini 3.5 Flash,输出速度289 token/s达竞品4倍,免费开放,标志AI从被动应答进入Agent自主执行新时代。本文从技术架构、性能基准、工程实践三维度深度解析。
Google I/O 2026
Gemini 3.5 Flash
Agent
AI
大模型
多模态
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
编程
TimesFM 2.5 深度解析:当时间序列预测终于学会零样本
2026-04-08 16:35:10 +0800 CST
view 634
Google TimesFM 2.5 时间序列预测基础模型深度解析:200M参数零样本预测,16k上下文,Decoder-only Transformer架构,Patch分词,Monash基准测试击败监督模型
时间序列
机器学习
Google
Transformer
agent-skills:Google工程师开源20个Skill,强制AI写代码守规矩
编程
agent-skills:Google工程师开源20个Skill,强制AI写代码守规矩
2026-05-15 18:35:28 +0800 CST
view 245
Google Gemini团队工程师Addy Osmani开源agent-skills,20个Skill文件覆盖完整研发生命周期,7个斜杠命令强制工程规范,解决AI写代码四大痛点。
开源项目
AI Agent
编码规范
Google工程实践
Chrome DevTools MCP 深度实战:当浏览器调试遇上 AI 代理——从 CDP 协议到智能调试助手的完全指南(2026)
编程
Chrome DevTools MCP 深度实战:当浏览器调试遇上 AI 代理——从 CDP 协议到智能调试助手的完全指南(2026)
2026-06-09 22:48:53 +0800 CST
view 66
Chrome DevTools Protocol (CDP) 与 Model Context Protocol (MCP) 的深度融合,让 AI Agent 直接操控浏览器、读取 DOM、监控网络,彻底改变前端调试和自动化范式。
Chrome DevTools
MCP协议
CDP
AI调试
浏览器自动化
utoo 深度实战:支付宝 76 倍冷启动加速的 npm 包管理器——从 Rust 多线程架构到三级缓存的全链路解析
编程
utoo 深度实战:支付宝 76 倍冷启动加速的 npm 包管理器——从 Rust 多线程架构到三级缓存的全链路解析
2026-05-09 01:39:21 +0800 CST
view 240
支付宝体验技术部推出的 Rust 版 npm 包管理器 utoo 深度解析,从双运行时架构到三级缓存,全方位拆解 76 倍冷启动加速的技术密码
Rust
npm
utoo
支付宝
前端工具链
Google Antigravity 2.0 深度实战:从 Agent-First 工作平台到本地 SDK 开发——AI 编程工具格局的重构与开发者实践指南
编程
Google Antigravity 2.0 深度实战:从 Agent-First 工作平台到本地 SDK 开发——AI 编程工具格局的重构与开发者实践指南
2026-05-22 07:20:00 +0800 CST
view 595
Google I/O 2026 发布的 Antigravity 2.0 深度解析:从架构设计、Project 模型、SDK 实战、多 Agent 协作到性能优化,全面拆解 AI 编程工具的 Agent 操作系统化演进。
Antigravity
Google
AI Agent
SDK
Python
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
编程
Google Gemma 4 深度解析:当开源AI进入「逐层嵌入平行化」时代
2026-04-09 04:54:56 +0800 CST
view 612
Google于2026年4月发布Gemma 4开源模型系列,首次全面切换Apache 2.0许可证,搭载Per-Layer Embedding架构创新,26B MoE以3.8B激活参数击败Qwen3-235B。本文深度解析PLE架构、稀疏激活机制与全规格产品矩阵。
Gemma 4
Google
开源模型
Apache 2.0
MoE
Per-Layer Embedding
Free Claude Code:让Claude Code接入任意模型,打破Anthropic绑定
编程
Free Claude Code:让Claude Code接入任意模型,打破Anthropic绑定
2026-04-29 12:20:38 +0800 CST
view 791
Free Claude Code是让Claude Code接入任意模型的代理层项目,打破Anthropic绑定,支持NVIDIA NIM/OpenRouter/DeepSeek/Ollama/LM Studio等后端,适合想降成本或本地部署AI编程环境的人。
Claude Code
AI编程
开源工具
OpenRouter
DeepSeek
Ollama
LM Studio
AI Coding
Anthropic
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 终结 GPU 显存浪费——从推理引擎原理到生产级高并发部署的完全指南(2026)
2026-06-11 03:16:24 +0800 CST
view 79
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
编程
vLLM 0.17 深度实战:PagedAttention与连续批处理如何把GPU吞吐量提升4倍——从KV Cache原理到生产级大模型推理部署完全指南(2026)
2026-06-11 03:17:21 +0800 CST
view 93
深度解析vLLM推理引擎的PagedAttention原理、连续批处理、量化优化,以及从零搭建生产级高并发部署的完整实战指南(2026版)
vLLM
PagedAttention
大模型推理
GPU优化
AI部署
Stanford CS336 深度实战:从零实现大语言模型——数据清洗、Transformer 架构、FlashAttention 系统优化到 RL 对齐的完全指南(2026)
编程
Stanford CS336 深度实战:从零实现大语言模型——数据清洗、Transformer 架构、FlashAttention 系统优化到 RL 对齐的完全指南(2026)
2026-06-02 20:14:38 +0800 CST
view 153
Stanford CS336 课程深度解读:从零实现大语言模型,覆盖 Tokenizer、Transformer、FlashAttention-2、FSDP 分布式训练、Scaling Law、Common Crawl 数据清洗去重、SFT 与 GRPO 对齐,配完整代码示例。
LLM
Transformer
Stanford CS336
FlashAttention
PyTorch
AI工程
分布式训练
强化学习
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 275
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
OpenTelemetry 深度实战:从链路追踪到AI可观测,构建生产级可观测性体系的完全指南(2026)
编程
OpenTelemetry 深度实战:从链路追踪到AI可观测,构建生产级可观测性体系的完全指南(2026)
2026-06-13 10:47:34 +0800 CST
view 26
全面解析 OpenTelemetry 生产级部署:从 Traces/Metrics/Logs 三元闭包到 LLM AI 追踪,涵盖 Go/Python 代码实战、Collector 两阶段架构、Tail Sampling 成本控制与 otel-mcp AI 可观测智能体。
OpenTelemetry
可观测性
链路追踪
Go
Python
LLM
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
编程
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
2026-05-14 03:40:08 +0800 CST
view 247
2026年奇点智能技术大会正式提出AI原生前端开发范式,LLM不再只是辅助工具而是编译过程的一部分。深度解析LLM-as-Compiler、编译时语义理解、声明式UI合成及Vite5.4+插件调用本地MoE模型的技术实现。
AI原生前端,LLM-as-Compiler,编译时语义理解,声明式UI合成,Vite5.4,MoE模型
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 430
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
编程
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
2026-05-06 17:37:39 +0800 CST
view 431
深度解析 SGLang 推理框架的 RadixAttention 原理、DSL 编程范式、正则约束解码,以及在 Agent 系统和多轮对话场景的生产部署实践。
SGLang
LLM
推理加速
Agent
RadixAttention
结构化生成
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
编程
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
2026-04-08 12:29:41 +0800 CST
view 432
IBM、红帽、谷歌联合向CNCF捐赠llm-d项目,标志着Kubernetes正式迈入AI原生时代。本文深度解析llm-d架构设计、性能数据及实践建议。
Kubernetes
云原生
AI
大模型
llm-d
CNCF
从购物清单到 AI 编程助手:深度解析 Bubble Tea 架构如何驱动 14 万星开源项目 OpenCode
编程
从购物清单到 AI 编程助手:深度解析 Bubble Tea 架构如何驱动 14 万星开源项目 OpenCode
2026-04-17 21:18:16 +0800 CST
view 378
深度解析 Bubble Tea(基于 Elm 架构的 Go 语言 TUI 框架)如何驱动 GitHub 14.4万星的开源 AI 编程助手 OpenCode,涵盖三层 Agent 架构、Provider-Agnostic 设计、客户端/服务器架构等核心技术。
Bubble Tea
OpenCode
TUI
Go
AI编程助手
Elm架构
2026年4月24日:大模型军备竞赛进入新纪元——DeepSeek V4 与 GPT-5.5 深度技术对比解析
编程
2026年4月24日:大模型军备竞赛进入新纪元——DeepSeek V4 与 GPT-5.5 深度技术对比解析
2026-04-28 08:54:41 +0800 CST
view 665
2026年4月24日,DeepSeek V4与GPT-5.5同日发布。本文从MoE架构、注意力机制、性能基准、Engram记忆模块、mHC超连接、Muon优化器等核心技术点进行硬核深度对比,配大量代码示例,为开发者提供实用的技术选型指南。
AI大模型
LLM
GitHub精选
开源项目
TechNews
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 689
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
编程
Hermes WebUI 深度实战:随时随地用手机/浏览器驱动 Hermes Agent——从 SSE 流式传输到多模型路由的完全指南(2026)
2026-06-02 21:45:53 +0800 CST
view 234
Hermes WebUI 今日飙升 1725 星。本文深度拆解其架构设计、SSE流式传输机制、多模型路由策略、工具调用可视化实现,以及从本地部署到生产级优化的完整指南。
Hermes
WebUI
SSE
LLM
Agent
FastAPI 2026 深度解析:从 CRUD 框架到 AI 基础设施支柱
编程
FastAPI 2026 深度解析:从 CRUD 框架到 AI 基础设施支柱
2026-05-13 17:12:57 +0800 CST
view 273
FastAPI 0.135.x/0.136.x 全面解析:SSE流式推理、MCP协议服务编排、FastAPI+Rust+WASM混合架构、Pydantic v2深度整合,以及构建AI Agent后端的实战指南。
Python,FastAPI,AI,LLM,MCP,Web开发,异步编程
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
16
17
18
19
20
...
48
下一页