程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 93
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
编程
Context-Mode 深度拆解:AI 编程代理的上下文救星——98% 压缩比背后的技术革命
2026-05-02 08:05:40 +0800 CST
view 258
深度拆解 GitHub Trending 开源项目 Context-Mode:通过沙箱隔离、会话连续性、代码思维和输出压缩四维度,实现 AI 编程代理上下文窗口 98% 压缩,支持 14 个平台
AI编程
上下文优化
MCP
Context-Mode
AI Agent
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 96
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
Anthropic官方金融AI方案:Claude for Financial Services如何用10个Agent重新定义华尔街工作流
编程
Anthropic官方金融AI方案:Claude for Financial Services如何用10个Agent重新定义华尔街工作流
2026-05-11 19:21:53 +0800 CST
view 211
Anthropic官方发布金融AI方案,含10个专业Agent、41项技能、11个MCP数据连接器,覆盖投行/PE/财富管理六大场景,效率提升8-72倍。
Anthropic
Claude
金融AI
MCP
华尔街
Agent Skills
投资银行
合规
Claude 顾问策略深度解析:Opus做大脑、Sonnet做手脚的工程哲学
编程
Claude 顾问策略深度解析:Opus做大脑、Sonnet做手脚的工程哲学
2026-04-13 11:23:13 +0800 CST
view 289
2026年3月Anthropic发布Claude顾问策略,彻底颠覆传统AI Agent工作模式。通过让Opus退居幕后当顾问,Sonnet/Haiku冲在前面当执行者,实现性能与成本的最佳平衡。本文深度解析其技术架构、性能数据与工程实践。
Claude
AI Agent
Anthropic
Advisor Strategy
Sonnet
Haiku
Opus
从 MCP 到 A2A:2026 年 AI Agent 协议时代——标准化通信层如何重塑智能体协作范式
编程
从 MCP 到 A2A:2026 年 AI Agent 协议时代——标准化通信层如何重塑智能体协作范式
2026-05-05 14:37:35 +0800 CST
view 231
深度解析 MCP 与 A2A 两大协议的设计哲学、技术架构与工程实践,从 Function Calling 的局限性到协议层的标准化演进,含完整 MCP Server 实战代码
MCP
A2A
AI Agent
协议
Anthropic
Spring AI 2.0 深度解析:Java 开发者终于有了自己的 AI Agent 基础设施
编程
Spring AI 2.0 深度解析:Java 开发者终于有了自己的 AI Agent 基础设施
2026-05-13 18:19:28 +0800 CST
view 159
Spring AI 2.0 核心能力全面解析:统一 ChatClient API、Tool Calling 与 Java 方法打通、结构化输出自动映射、Advisors 切面机制、RAG 企业知识库、MCP 协议集成,以及与 LangChain4j 深度对比选型指南。
Spring AI,Java,AI Agent,ChatClient,Tool Calling,RAG,MCP,LangChain4j
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
编程
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
2026-05-06 17:37:39 +0800 CST
view 255
深度解析 SGLang 推理框架的 RadixAttention 原理、DSL 编程范式、正则约束解码,以及在 Agent 系统和多轮对话场景的生产部署实践。
SGLang
LLM
推理加速
Agent
RadixAttention
结构化生成
AI供应链的「心脏出血」——MCP协议STDIO设计缺陷全解析
编程
AI供应链的「心脏出血」——MCP协议STDIO设计缺陷全解析
2026-04-17 12:45:36 +0800 CST
view 474
2026年4月15日OX Security披露MCP协议STDIO设计缺陷,影响20万台AI服务器。本文深入解析漏洞根因、攻击面、真实场景及修复方案。
MCP
安全漏洞
AI Agent
RCE
Anthropic
协议安全
JetBrains 2026 全线产品深度解析:ACP 注册表内置 AI 智能体、MCP 服务器、Recap/Insights——传统 IDE 的「绝地反击」
编程
JetBrains 2026 全线产品深度解析:ACP 注册表内置 AI 智能体、MCP 服务器、Recap/Insights——传统 IDE 的「绝地反击」
2026-05-15 09:18:50 +0800 CST
view 150
JetBrains 2026全线IDE发布:ACP注册表让Codex/Claude Agent等智能体内置IDE、MCP服务器暴露IDE代码理解能力、Recap和Insights主动式AI辅助、Git工作树人机并行开发。深度解析6大IDE核心特性与AI时代战略。
JetBrains,IntelliJ IDEA,ACP,MCP,AI Agent,IDE
React Doctor 深度解析:当 AI 写的 React 代码比人类还烂,谁来当主治医师
编程
React Doctor 深度解析:当 AI 写的 React 代码比人类还烂,谁来当主治医师
2026-05-12 03:13:55 +0800 CST
view 251
深度解析React Doctor:AI编程助手生成代码质量诊断工具,0-100健康评分、60+Lint规则、死代码检测、AI Agent集成50+工具、oxlint+ESLint双引擎、GitHub Actions CI/CD、框架自动检测、程序化API
ReactDoctor,React代码质量,AI编程,Million.js,oxlint,ESLint,代码健康分,死代码检测,Lint规则,GitHubActions,ClaudeCode,Cursor集成
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
编程
DeepGEMM 深度解析:DeepSeek 开源的 FP8 GEMM 内核如何重塑 AI 推理性能边界
2026-04-21 05:16:09 +0800 CST
view 361
深入剖析 DeepSeek 开源的 DeepGEMM 库:从 FP8 精度革命到 1550 TFLOPS 性能突破,揭秘现代 AI 推理基础设施的底层优化技术
DeepGEMM
FP8
DeepSeek
CUDA
AI推理
GPU优化
GEMM
TensorCore
Chevereto是一个开源的高性能个人图床系统
综合
Chevereto是一个开源的高性能个人图床系统
2024-11-17 04:35:01 +0800 CST
view 1602
Chevereto是一个开源的高性能个人图床系统,支持多种上传方式和图片管理功能,包括用户系统和RESTfulAPI。安装过程简单,基于Laravel框架,具备高效性能和丰富功能。分为免费版和收费版,适用于博客、论坛等多种场景。通过Docker部署,用户可以快速搭建并使用该系统。
开源软件
图像管理
Docker
个人项目
技术支持
综合
PicaComic是一个基于Flutter开发的开源跨平台漫画程序
2024-11-19 06:49:01 +0800 CST
view 5199
PicaComic是一个基于Flutter开发的开源跨平台漫画程序,支持多个操作系统,迅速在GitHub上获得2k星标。它允许用户访问多个漫画源,并支持本地存储和自定义漫画源,提供多样化的选择和良好的用户体验。用户只需下载源码并安装Flutter即可轻松构建应用,是漫画爱好者和开发者的理想选择。
漫画
开源软件
跨平台应用
Flutter
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
编程
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
2026-04-28 21:16:14 +0800 CST
view 199
深度解析 GitHub 19K Star 的 RAG-Anything 多模态 RAG 框架:All-in-One 架构设计、MinerU 文档解析、多模态知识图谱、向量-图谱融合检索,完整覆盖从原理到生产部署的技术细节。
RAG
多模态
知识图谱
LightRAG
MinerU
AI
向量检索
文档处理
Sidecarless服务网格深度解析:Rust+eBPF如何引爆2026年云原生性能革命
编程
Sidecarless服务网格深度解析:Rust+eBPF如何引爆2026年云原生性能革命
2026-05-16 08:17:15 +0800 CST
view 142
深入解析2026年云原生领域最热门的技术趋势——Sidecarless服务网格架构,讲解Rust+eBPF组合如何实现近乎零开销的流量治理,涵盖eBPF内核编程、Cilium/Hubble可观测性、Kmesh双层架构原理,并提供完整的生产环境部署实战代码。
Rust
eBPF
Sidecarless
Kubernetes
云原生
服务网格
Cilium
性能优化
一键式操作以简化Docker的日常管理
代码
一键式操作以简化Docker的日常管理
2024-11-19 07:01:44 +0800 CST
view 1419
本脚本提供一键式操作以简化Docker的日常管理,包括检测Docker安装、启停服务、查看容器和网络模式、批量拉取和删除镜像、配置镜像加速器等功能。用户可以通过简单的菜单选择执行相应操作,提高管理效率。脚本使用Bash编写,适用于Linux环境。
Docker
自动化
脚本
系统管理
开发工具
zero-native 深度实战:Vercel 用 Zig 杀入桌面应用赛道——超轻量原生壳如何颠覆 Electron 生态
编程
zero-native 深度实战:Vercel 用 Zig 杀入桌面应用赛道——超轻量原生壳如何颠覆 Electron 生态
2026-05-16 09:14:57 +0800 CST
view 167
Vercel Labs 开源 zero-native,用 Zig 构建超轻量桌面应用原生壳,挑战 Electron 的臃肿生态。深度解析架构设计、安全模型、双引擎策略,并与 Tauri 进行全面对比。
Zig
桌面开发
Electron
跨平台
zero-native
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
编程
caveman 深度解析:当 Claude Code 用「穴居人语言」砍掉 75% Token 消耗,AI 编程正式进入「极简主义」时代
2026-04-10 00:14:55 +0800 CST
view 616
深度解析 caveman 开源项目:一个让 Claude Code 用「穴居人语言」说话的 skill,砍掉 75% Token 消耗同时保持 100% 技术准确率。
Claude Code
Token优化
AI编程
Prompt Engineering
LLM效率
开源工具
程序员工具
代码审查
Linux 7.0 深度解析:Rust 正式转正,内核开发的下一个十年
编程
Linux 7.0 深度解析:Rust 正式转正,内核开发的下一个十年
2026-04-29 02:41:42 +0800 CST
view 305
深度解析 Linux 7.0 中 Rust 的正式集成:从架构设计、内核模块代码实战、文件系统实现,到 sudo-rs/uutils 生产级实践、调度器性能优化与安全增强
Linux
Rust
内核
Kernel
系统编程
安全
Vercel Claude Code 插件隐私丑闻深度解析:当部署助手变成了全项目监控软件
编程
Vercel Claude Code 插件隐私丑闻深度解析:当部署助手变成了全项目监控软件
2026-04-10 00:55:46 +0800 CST
view 338
深入解析Vercel Claude Code插件的隐私丑闻:从插件架构漏洞到三层遥测系统的代码级分析,以及用户自保指南
隐私安全
Claude Code
Vercel
插件生态
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
编程
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
2026-04-29 05:42:47 +0800 CST
view 183
深度解析开源AI网关LiteLLM:100+大模型统一接入、虚拟密钥体系、负载均衡与故障降级、MCP/A2A网关、生产级Docker部署实战
LiteLLM
AI网关
大模型
LLM
API网关
Python
Docker
云原生
DuckLake v1.0 深度解析:DuckDB 团队如何用关系型数据库颠覆数据湖架构——926 倍性能背后的湖仓一体新范式
编程
DuckLake v1.0 深度解析:DuckDB 团队如何用关系型数据库颠覆数据湖架构——926 倍性能背后的湖仓一体新范式
2026-05-09 13:14:28 +0800 CST
view 295
DuckDB 团队于 2026 年 4 月 13 日发布 DuckLake v1.0——一种用关系型数据库存储元数据的湖仓一体新范式。官方基准显示查询速度比 Iceberg 快 926 倍,数据摄取快 105 倍。本文深入解析其架构原理、数据内联机制、性能差异根因及实战代码。
DuckDB,DuckLake,数据湖,湖仓一体,Apache Iceberg,Delta Lake,Parquet,OLAP
Career-Ops 深度解析:当 AI 把求职变成一场「不对称战争」,候选人终于有了反击的武器
编程
Career-Ops 深度解析:当 AI 把求职变成一场「不对称战争」,候选人终于有了反击的武器
2026-04-10 02:34:39 +0800 CST
view 367
Career-Ops开源项目深度解析:一个把AI编程CLI变成求职指挥中心的系统。27k+ stars,支持14种技能模式、A-F评估系统、ATS优化PDF生成、45+公司门户扫描、Go实现的Dashboard TUI。作者用这套系统评估740+职位、生成100+定制简历,成功获得Head of Applied AI职位。
AI求职
Career-Ops
Claude Code
自动化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
15
16
17
18
19
...
30
下一页