程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Google I/O 2026 深度解析:Gemini 3.5 Flash 横空出世,Agent 时代的计算范式革命
编程
Google I/O 2026 深度解析:Gemini 3.5 Flash 横空出世,Agent 时代的计算范式革命
2026-05-21 18:57:35 +0800 CST
view 616
2026年5月Google I/O大会发布Gemini 3.5 Flash,输出速度289 token/s达竞品4倍,免费开放,标志AI从被动应答进入Agent自主执行新时代。本文从技术架构、性能基准、工程实践三维度深度解析。
Google I/O 2026
Gemini 3.5 Flash
Agent
AI
大模型
多模态
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 529
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
编程
DiffusionGemma 深度实战:当文本扩散重新定义本地AI推理——从'打字机'到'印刷机'的4倍速架构革命
2026-06-12 17:21:39 +0800 CST
view 35
2026年6月Google发布DiffusionGemma,首个生产级文本扩散大模型,本地推理速度提升4倍。本文深入剖析其从自回归到并行生成的架构革命,附完整代码实战。
DiffusionGemma
文本扩散
本地AI
Gemma
大模型推理
扩散模型
Python
Ollama
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
编程
Google AI Edge Gallery 深度实战:让 Mac/Android 离线运行 Gemma 3——从原理到生产级本地 AI 部署完全指南(2026)
2026-06-04 21:14:37 +0800 CST
view 106
深入剖析 Google AI Edge Gallery 的技术架构、Gemma 模型家族、端侧部署全流程,并通过完整代码示例,带你从零构建一个生产级本地 AI 应用。
Google AI Edge Gallery
本地AI
Gemma模型
端侧推理
Mac AI
Android AI
IntelliJ IDEA 2026.1 深度解析:IDE 的战略升维——从代码编辑器到 AI Agent 开放平台
编程
IntelliJ IDEA 2026.1 深度解析:IDE 的战略升维——从代码编辑器到 AI Agent 开放平台
2026-05-09 23:43:15 +0800 CST
view 345
IntelliJ IDEA 2026.1深度解析:ACP协议开放AI Agent平台、Codex/Cursor/Claude多Agent协作、Spring运行时洞察、Java 26首日支持、虚拟线程调试工具链等核心新特性全剖析
IntelliJ IDEA
JetBrains
Java
Kotlin
AI Agent
ACP协议
IDE
编程工具
Spring
虚拟线程
Spring AI 1.1 深度解析:从 RAG 到 MCP 协议——Java 开发者构建企业级 AI 应用的工程化实战
编程
Spring AI 1.1 深度解析:从 RAG 到 MCP 协议——Java 开发者构建企业级 AI 应用的工程化实战
2026-05-10 04:41:17 +0800 CST
view 303
Spring AI 1.1 深度解析:Tool Calling 让 AI 真正动手干活、MCP 协议统一工具接入标准、Agent 框架实现自主决策、Memory 让多轮对话成为可能、RAG 构建企业知识库。Java 开发者不容错过的 AI 工程化实战指南。
Spring AI
SpringBoot AI
AI应用
Tool Calling
MCP
Model Context Protocol
Agent
RAG
ChatMemory
Java AI
向量数据库
企业级 AI
DeepSeek-TUI:终端里的 Claude Code,Rust 重写让 AI 编程助手轻到飞起
编程
DeepSeek-TUI:终端里的 Claude Code,Rust 重写让 AI 编程助手轻到飞起
2026-05-11 14:25:25 +0800 CST
view 278
DeepSeek-TUI由美国独立开发者Hunter Bown用Rust编写,是DeepSeek版的Claude Code。支持1M token上下文、流式推理可视化、Plan/Agent/YOLO三种模式、MCP协议、LSP诊断。成本仅为Claude Code的1/10,MIT开源,单二进制无运行时依赖。
DeepSeek-TUI,Hunter Bown,Rust,Claude Code替代,终端AI助手,AI编程,Agent模式,YOLO模式,DeepSeek V4,MCP协议
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 319
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
编程
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
2026-05-02 08:05:40 +0800 CST
view 509
深度拆解 GitHub Trending 开源项目 Context-Mode:通过沙箱隔离、会话连续性、代码思维和输出压缩四维度,实现 AI 编程代理上下文窗口 98% 压缩,支持 14 个平台
AI编程
上下文优化
MCP
Context-Mode
AI Agent
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 275
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
AI-Scientist-v2 深度实战:当AI学会自己做科研——从Agentic Tree Search到Workshop-Level论文全自动生成(2026)
编程
AI-Scientist-v2 深度实战:当AI学会自己做科研——从Agentic Tree Search到Workshop-Level论文全自动生成(2026)
2026-06-12 20:20:27 +0800 CST
view 30
2026年3月,AI生成的论文登上了Nature。本文深度拆解The AI Scientist-v2系统,从Agentic Tree Search算法到端到端智能体架构,结合代码实战,完整讲解AI自主做科研的技术全貌。
AI科研
自动化科研
AI-Scientist
Agentic Tree Search
科研自动化
HuggingFace ml-intern 深度实战:一个命令让 AI 读论文、训模型、推到 Hub——ML 工程自动化的端到端革命(2026)
编程
HuggingFace ml-intern 深度实战:一个命令让 AI 读论文、训模型、推到 Hub——ML 工程自动化的端到端革命(2026)
2026-06-04 08:41:56 +0800 CST
view 196
HuggingFace ml-intern 深度实战解析:从架构原理到代码实战,完整拆解这个能自主读论文、训模型、推送到 Hub 的 AI 实习生项目。
HuggingFace
ml-intern
AI Agent
机器学习
开源项目
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 683
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
Spring AI 2.0 深度解析:Java 开发者终于有了自己的 AI Agent 基础设施
编程
Spring AI 2.0 深度解析:Java 开发者终于有了自己的 AI Agent 基础设施
2026-05-13 18:19:28 +0800 CST
view 387
Spring AI 2.0 核心能力全面解析:统一 ChatClient API、Tool Calling 与 Java 方法打通、结构化输出自动映射、Advisors 切面机制、RAG 企业知识库、MCP 协议集成,以及与 LangChain4j 深度对比选型指南。
Spring AI,Java,AI Agent,ChatClient,Tool Calling,RAG,MCP,LangChain4j
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
编程
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
2026-05-06 17:37:39 +0800 CST
view 425
深度解析 SGLang 推理框架的 RadixAttention 原理、DSL 编程范式、正则约束解码,以及在 Agent 系统和多轮对话场景的生产部署实践。
SGLang
LLM
推理加速
Agent
RadixAttention
结构化生成
JetBrains 2026 全线产品深度解析:ACP 注册表内置 AI 智能体、MCP 服务器、Recap/Insights——传统 IDE 的「绝地反击」
编程
JetBrains 2026 全线产品深度解析:ACP 注册表内置 AI 智能体、MCP 服务器、Recap/Insights——传统 IDE 的「绝地反击」
2026-05-15 09:18:50 +0800 CST
view 342
JetBrains 2026全线IDE发布:ACP注册表让Codex/Claude Agent等智能体内置IDE、MCP服务器暴露IDE代码理解能力、Recap和Insights主动式AI辅助、Git工作树人机并行开发。深度解析6大IDE核心特性与AI时代战略。
JetBrains,IntelliJ IDEA,ACP,MCP,AI Agent,IDE
GitNexus 深度解析:当 AI Agent 终于拥有了自己的「代码神经系统」
编程
GitNexus 深度解析:当 AI Agent 终于拥有了自己的「代码神经系统」
2026-04-09 05:25:32 +0800 CST
view 926
GitNexus 将任意代码库索引为知识图谱,通过 MCP 协议让 AI Agent 拥有代码架构感知能力,解决 AI 编程工具不"看见"代码结构的核心痛点。
AI编程
GitNexus
知识图谱
MCP
代码智能
Agent
字节跳动 DeerFlow 2.0 深度解析:46k Star 的超级智能体框架,让 AI 真正「动手做事」
编程
字节跳动 DeerFlow 2.0 深度解析:46k Star 的超级智能体框架,让 AI 真正「动手做事」
2026-04-28 13:55:13 +0800 CST
view 301
深度解析字节跳动开源的 DeerFlow 2.0 超级智能体框架,46k Star 的核心技术架构、LangGraph 状态机原理、代码实战与性能优化指南。
AI Agent
LangGraph
DeerFlow
字节跳动
多智能体
深度学习
x402 协议深度解析:Linux 基金会如何用 HTTP 原生支付重塑 AI Agent 经济基础设施
编程
x402 协议深度解析:Linux 基金会如何用 HTTP 原生支付重塑 AI Agent 经济基础设施
2026-05-09 07:08:39 +0800 CST
view 510
Linux基金会x402协议深度解析:HTTP 402原生支付如何为AI Agent提供自动化微支付基础设施,含架构分析、代码实战、安全设计与生态全景
x402
HTTP
AI Agent
支付协议
Linux Foundation
Claw Code 深度解析:当韩国开发者用 Rust 重写 Claude Code,GitHub 史上最快 5 万星项目诞生
编程
Claw Code 深度解析:当韩国开发者用 Rust 重写 Claude Code,GitHub 史上最快 5 万星项目诞生
2026-04-09 06:04:37 +0800 CST
view 781
韩国开发者用 Rust 重写 Claude Code,claw-code 项目 2 小时破 5 万星,创下 GitHub 史上最快增速纪录。深度解析其 Python+Rust 混合架构、净室重写工程实践和 Agent Harness 设计理念。
Rust
AI编程
开源项目
Claude Code
Agent Harness
净室重写
GitHub 22k Star 的 Beads:如何用 Dolt 给 AI Agent 装上一个永久记忆大脑
编程
GitHub 22k Star 的 Beads:如何用 Dolt 给 AI Agent 装上一个永久记忆大脑
2026-04-28 14:54:44 +0800 CST
view 359
深度解析 GitHub 22.3k Star 的 Beads 项目:用 Dolt 版本控制数据库为 AI coding agent 构建持久化记忆系统,覆盖架构设计、Dolt 分支模型、代码实战与生产部署指南。
AI编程
Dolt
Agent
GitHub开源
版本控制
SQL数据库
编程工具
长任务追踪
Chrome DevTools MCP 深度实战:让 AI 编程助手真正看懂并操控浏览器的技术革命
编程
Chrome DevTools MCP 深度实战:让 AI 编程助手真正看懂并操控浏览器的技术革命
2026-05-16 04:43:16 +0800 CST
view 247
Chrome DevTools MCP 让 AI 编程助手通过 MCP 协议直接控制浏览器,实现深度调试、性能分析和自动化测试。本文详解架构、实战和性能优化。
Chrome DevTools
MCP
AIAgent
前端调试
自动化测试
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
编程
vLLM 深度实战:当 PagedAttention 遇上生产级 LLM 推理——从内存革命到分布式部署的完全指南(2026)
2026-06-10 10:17:56 +0800 CST
view 61
深度解析 vLLM 的核心架构 PagedAttention 和 Continuous Batching,从内存管理原理到生产级分布式部署的完全指南。
vLLM
LLM推理
PagedAttention
GPU优化
大模型部署
AI推理
Playwright Test Agents深度解析:三个AI Agent帮你全自动写测试
编程
Playwright Test Agents深度解析:三个AI Agent帮你全自动写测试
2026-04-28 16:25:24 +0800 CST
view 829
Playwright官方推出Test Agents,三个AI Agent接力:Planner探索应用生成测试计划、Generator转代码、Healer自动修复失败测试,全程自动化。
Playwright
AI
测试
自动化
Agent
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
23
24
25
26
27
...
41
下一页