程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
DeerFlow 2.0 深度解析:63K Star 的超级智能体执行底座,从架构哲学到生产实战
编程
DeerFlow 2.0 深度解析:63K Star 的超级智能体执行底座,从架构哲学到生产实战
2026-04-26 13:13:17 +0800 CST
view 570
深度解析字节跳动开源DeerFlow 2.0超级智能体执行底座:63K Star背后的架构设计哲学,从LangGraph编排引擎、渐进式技能加载、隔离式子智能体到Docker/K8s沙箱安全隔离,含完整代码实战与生产部署指南
DeerFlow
AI Agent
字节跳动
LangGraph
超级智能体
沙箱
多智能体编排
Google Antigravity 2.0 深度实战:从 AI IDE 到 Agent 编排平台——Google I/O 2026 最大杀器的全栈指南
编程
Google Antigravity 2.0 深度实战:从 AI IDE 到 Agent 编排平台——Google I/O 2026 最大杀器的全栈指南
2026-05-30 11:39:14 +0800 CST
view 213
深度解析 Google Antigravity 2.0 从 AI IDE 到 Agent 编排平台的全面进化
Google
Antigravity
AI编程
Agent编排
Gemini
Google I/O 2026
开发工具
Kubernetes v1.36 深度解析:代号「晴(Haru)」背后的云原生进化论
编程
Kubernetes v1.36 深度解析:代号「晴(Haru)」背后的云原生进化论
2026-04-27 15:53:35 +0800 CST
view 731
2026年4月Kubernetes v1.36正式发布,代号「晴(Haru)」。本文深度解析44项GA特性、Sidecar容器、DRA动态资源分配、Gateway API等核心能力,并附完整的AI推理服务部署实战代码。
Kubernetes
云原生
Docker
容器编排
AI基础设施
Kubernetes 1.36 深度实战:云原生编排的里程碑式进化——从 DRA 革命到调度器重构的全链路解析
编程
Kubernetes 1.36 深度实战:云原生编排的里程碑式进化——从 DRA 革命到调度器重构的全链路解析
2026-05-08 16:39:08 +0800 CST
view 458
深度剖析 Kubernetes 1.36 版本的核心特性:DRA 动态资源分配、调度器重构、Pod 资源原地调整等里程碑式进化,包含完整代码实战和迁移指南。
Kubernetes
云原生
DRA
调度器
容器编排
当AI Agent学会了操控浏览器——从PilotDeck多Agent编排到Chrome DevTools MCP浏览器自动化的生产级完全指南(2026)
编程
当AI Agent学会了操控浏览器——从PilotDeck多Agent编排到Chrome DevTools MCP浏览器自动化的生产级完全指南(2026)
2026-06-21 03:53:42 +0800 CST
view 98
深度实战PilotDeck(清华开源AI Agent操作系统)和Chrome DevTools MCP(Google官方MCP Server),从架构原理到代码实战,构建生产级Web应用E2E测试系统
AI Agent
PilotDeck
Chrome DevTools MCP
浏览器自动化
多Agent编排
Kubernetes 1.36 全链路深度解析:DRA 异构计算革命与调度器智能化重构实战
编程
Kubernetes 1.36 全链路深度解析:DRA 异构计算革命与调度器智能化重构实战
2026-05-08 16:39:33 +0800 CST
view 358
深度剖析 Kubernetes 1.36 版本的核心特性:DRA 动态资源分配、调度器重构、Pod 资源原地调整等里程碑式进化,包含完整代码实战和迁移指南。
Kubernetes
云原生
DRA
调度器
容器编排
Dockge深度解析:自托管Docker Compose管理工具的革命性设计与工程实践
编程
Dockge深度解析:自托管Docker Compose管理工具的革命性设计与工程实践
2026-04-18 07:13:40 +0800 CST
view 469
深度解析Dockge的设计理念、架构实现与工程实践,探讨文件优先架构、交互式Web终端、多Agent支持等核心特性,以及与Portainer等工具的对比分析。
Docker
容器编排
DevOps
Homelab
开源工具
Kubernetes v1.36 深度实战:当云原生安全与 AI 工作负载遇见「春」之版本——从 User Namespaces GA 到 DRA 增强的生产级完全指南(2026)
编程
Kubernetes v1.36 深度实战:当云原生安全与 AI 工作负载遇见「春」之版本——从 User Namespaces GA 到 DRA 增强的生产级完全指南(2026)
2026-06-15 20:47:01 +0800 CST
view 118
Kubernetes v1.36 代号「Haru」于2026年4月发布,包含71项增强。本文深度解析User Namespaces GA、Mutating Admission Policies、DRA增强等核心特性,并通过完整代码示例带你掌握生产级升级实战。
Kubernetes
云原生
容器编排
AI工作负载
安全加固
GPT-6「土豆」深度解析:当「交响乐」架构敲响AGI大门
编程
GPT-6「土豆」深度解析:当「交响乐」架构敲响AGI大门
2026-04-09 08:47:06 +0800 CST
view 752
深度解析OpenAI GPT-6代号「土豆」的技术突破:Symphony原生多模态统一架构、5-6万亿MoE参数、200万Token上下文窗口、System-2双系统推理引擎。探讨其对AI Agent生态的影响。约12000字。
GPT-6
OpenAI
AGI
Symphony
MoE
多模态
上下文窗口
System-2
Agent
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
编程
RAG-Anything 深度解析:19K Star 的多模态 RAG 终极解决方案,让 AI 真正读懂图文表公式
2026-04-28 21:16:14 +0800 CST
view 447
深度解析 GitHub 19K Star 的 RAG-Anything 多模态 RAG 框架:All-in-One 架构设计、MinerU 文档解析、多模态知识图谱、向量-图谱融合检索,完整覆盖从原理到生产部署的技术细节。
RAG
多模态
知识图谱
LightRAG
MinerU
AI
向量检索
文档处理
编程
RAG-Anything 深度实战:把PDF里的图表公式全塞进知识图谱——港大HKUDS实验室如何重新定义多模态RAG
2026-05-16 12:46:25 +0800 CST
view 318
RAG-Anything是港大HKUDS实验室开源的多模态RAG框架,能把PDF里的文字、图片、表格、公式全部塞进知识图谱。本文深度剖析其核心技术和实战应用。
RAG
多模态
知识图谱
PDF处理
GitHub Trending
英伟达Nemotron 3 Nano Omni:一个模型搞定看听读写,智能体效率狂飙9倍
编程
英伟达Nemotron 3 Nano Omni:一个模型搞定看听读写,智能体效率狂飙9倍
2026-05-01 04:40:16 +0800 CST
view 430
英伟达发布Nemotron 3 Nano Omni开源多模态模型,30B-A3B MoE架构,统一视觉音频语言编码,吞吐量9倍提升,六大排行榜榜首,富士康甲骨文等已采用。
英伟达
多模态
开源
AI智能体
Nemotron
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
编程
视觉即代码:GLM-5V-Turbo 如何用 94.8 分重新定义 Design2Code
2026-05-11 09:52:48 +0800 CST
view 458
智谱AI发布GLM-5V-Turbo多模态编程基座模型,从预训练阶段原生融合视觉与语言,在Design2Code基准测试中以94.8分超越所有竞品。本文深度解析CogViT视觉编码器、MMTP多模态多Token预测、多任务RL优化等技术细节,以及如何用API接入实现从设计稿到可运行代码的完整工作流。
GLM-5V-Turbo
视觉编程
Design2Code
多模态
CogViT
MMTP
智谱AI
AI编程
Open Notebook 深度实战:当开源替代方案击败 Google Notebook LM——从多模态RAG到自托管部署的生产级完全指南(2026)【上】
编程
Open Notebook 深度实战:当开源替代方案击败 Google Notebook LM——从多模态RAG到自托管部署的生产级完全指南(2026)【上】
2026-06-11 16:20:00 +0800 CST
view 184
Open Notebook 是 Google Notebook LM 的开源替代方案,支持18+ AI模型、多模态内容处理、播客生成。本文上篇深度剖析项目背景、架构设计与核心功能实现。
Open Notebook
Notebook LM 替代品
RAG
多模态
自托管
AI笔记工具
Qwen3.7-Plus 深度实战:11 小时自主开发 APP 的多模态智能体——从 Hybrid-Agent 架构到 GUI 自动化闭环的完全指南(2026)
编程
Qwen3.7-Plus 深度实战:11 小时自主开发 APP 的多模态智能体——从 Hybrid-Agent 架构到 GUI 自动化闭环的完全指南(2026)
2026-06-03 11:16:02 +0800 CST
view 319
深入解析阿里Qwen3.7-Plus多模态智能体模型,从Hybrid-Agent架构设计到代码实战,手把手搭建全自主AI开发系统
AI
Qwen
智能体
多模态
Hybrid-Agent
Agent TARS 深度解析:字节跳动开源的「视觉-行动」双引擎 GUI Agent——从 UI-TARS 模型架构到计算机控制的完整技术内幕
编程
Agent TARS 深度解析:字节跳动开源的「视觉-行动」双引擎 GUI Agent——从 UI-TARS 模型架构到计算机控制的完整技术内幕
2026-05-17 14:14:17 +0800 CST
view 446
深入解析字节跳动开源的 Agent TARS / UI-TARS-Desktop 多模态 GUI Agent 技术栈,从底层视觉语言模型到三层感知-规划-执行 Pipeline,配详细代码示例和实战案例。
AI Agent
GUI自动化
字节跳动
多模态
UI-TARS
计算机视觉
VLM
MCP
Python
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
编程
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
2026-06-03 15:17:28 +0800 CST
view 256
深入解析 GetStream 开源的 Vision-Agents 框架,从架构设计、视频处理管道、多模态LLM集成、RAG知识库、MCP工具调用到Kubernetes生产部署的完整实战指南
Vision-Agents
GetStream
多模态AI
视频AI
Agent
WebRTC
低延迟
RAG
Google把操作电脑塞进Gemini 3.5 Flash了
编程
Google把操作电脑塞进Gemini 3.5 Flash了
2026-06-25 20:56:55 +0800 CST
view 24
Google正式将计算机操作能力原生集成进Gemini 3.5 Flash——模型现在可以看屏幕截图、理解当前界面,并给出下一步操作建议(点击按钮、输入文字、滚动页面、完成表单、检查网页流程)。这不是简单的功能更新,而是AI Agent从聊天走向真正干活的关键一步。不依赖固定选择器,像人一样看界面、理解上下文、做出判断。
Gemini 3.5 Flash
Google
AI Agent
计算机操作
自动化测试
浏览器自动化
多模态
UI-TARS-Desktop 深度解析:ByteDance 如何用多模态 AI Agent 重新定义 GUI 自动化
编程
UI-TARS-Desktop 深度解析:ByteDance 如何用多模态 AI Agent 重新定义 GUI 自动化
2026-05-12 04:43:13 +0800 CST
view 731
UI-TARS-Desktop 是 ByteDance 开源的多模态 AI Agent 技术栈,包含 Agent TARS CLI/Web UI 和 UI-TARS-Desktop 原生应用。支持自然语言控制电脑、视觉理解界面、MCP 工具集成、Event Stream 协议驱动的 Context Engineering。本文深入解析其架构设计、核心特性、实战案例、性能基准与部署最佳实践。
UI-TARS
ByteDance
GUI自动化
多模态AI
MCP
MiniCPM-V 4.6:参数砍到1.3B,多模态小钢炮拿下同级第一
编程
MiniCPM-V 4.6:参数砍到1.3B,多模态小钢炮拿下同级第一
2026-05-13 17:38:45 +0800 CST
view 510
面壁智能发布MiniCPM-V 4.6,参数量仅1.3B,1B级多模态评测第一。仅用Qwen3.5-0.8B的2.5%token量即超越对方。LLaVA-UHD v4架构创新,视觉编码运算量降低55.8%,手机断网秒级响应。
MiniCPM-V
面壁智能
多模态
端侧AI
密度定律
MiniCPM-V 4.6 手机实测:1.3B参数跑满端侧推理,输入框还没缩回结果就出来了
编程
MiniCPM-V 4.6 手机实测:1.3B参数跑满端侧推理,输入框还没缩回结果就出来了
2026-05-13 17:56:16 +0800 CST
view 363
MiniCPM-V 4.6手机实测体验:输入框还没缩回结果就出来了。1.3B参数推理版token消耗仅为Qwen3.5-0.8B的1/43,TTFT高清大图75.7ms快2.2倍,LLaVA-UHD v4架构视觉编码运算量降低55.8%。
MiniCPM-V
面壁智能
端侧AI
手机AI
多模态
阿里发布首个「音视频实时交互」模型,实现数字人实时视频聊天
编程
阿里发布首个「音视频实时交互」模型,实现数字人实时视频聊天
2026-06-26 18:16:02 +0800 CST
view 7
阿里发布 Wan-Streamer v0.1,原生流式端到端音视频实时交互多模态模型,同一Transformer内完成感知/理解/生成全流程,响应延迟低至200ms,支持25fps音画同步输出。
AI
多模态
数字人
阿里
实时交互
视频生成
RAG-Anything 深度实战:港大开源全模态 RAG 框架,让知识库真正看懂图片、表格和公式
编程
RAG-Anything 深度实战:港大开源全模态 RAG 框架,让知识库真正看懂图片、表格和公式
2026-04-25 00:31:11 +0800 CST
view 437
深度解析港大开源RAG-Anything框架:从多模态文档解析到跨模态知识图谱构建,包含完整代码实战、自定义模态处理器开发、性能优化与生产部署指南
RAG
多模态
知识图谱
HKUDS
LightRAG
MinerU
VLM
文档理解
Gemma 4 12B 深度实战:当无编码器统一多模态架构走进本地
编程
Gemma 4 12B 深度实战:当无编码器统一多模态架构走进本地
2026-06-14 17:49:21 +0800 CST
view 258
深入解析 Google Gemma 4 12B 的无编码器统一多模态架构,从技术原理到生产部署的完整指南
Gemma4
Google
多模态
本地部署
AI
LLM
Encoder-Free
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
...
11
下一页