程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Nushell 深度解析:为什么 2026 年最值得学习的 Shell 不是 Bash
编程
Nushell 深度解析:为什么 2026 年最值得学习的 Shell 不是 Bash
2026-04-18 00:47:07 +0800 CST
view 160
深入解析 2026 年最值得学习的 Shell 工具 Nushell,从架构设计、管道机制、代码实战多维度剖析,探讨它如何用结构化数据管道取代传统文本流,以及如何在生产环境中落地使用。
Nushell
Rust
Shell
命令行
Linux
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
编程
LiteLLM 深度解析:100+ 大模型统一网关的架构设计与生产实战
2026-04-29 05:42:47 +0800 CST
view 71
深度解析开源AI网关LiteLLM:100+大模型统一接入、虚拟密钥体系、负载均衡与故障降级、MCP/A2A网关、生产级Docker部署实战
LiteLLM
AI网关
大模型
LLM
API网关
Python
Docker
云原生
LiteLLM深度解析:统一调用100+大模型的AI网关SDK架构设计与实战
编程
LiteLLM深度解析:统一调用100+大模型的AI网关SDK架构设计与实战
2026-04-23 21:13:57 +0800 CST
view 196
LiteLLM是一个统一调用100+大模型API的AI网关SDK,旨在解决大模型API碎片化问题。它采用OpenAI格式作为统一接口,支持PythonSDK和ProxyServer双引擎架构。
AI基础设施
大模型开发
API网关
Python开发
系统架构
性能优化
安全防护
开源项目
Hermes Agent 自进化架构全拆解:从 Learning Loop 到工程落地的深度实战
编程
Hermes Agent 自进化架构全拆解:从 Learning Loop 到工程落地的深度实战
2026-04-24 20:03:22 +0800 CST
view 145
深度拆解 Hermes Agent 的自进化架构,从 Learning Loop 闭环、四层记忆系统、Skill 自动创建机制到自训练飞轮,每层配代码详解,包含部署实战和二次开发指南
AI Agent
Hermes
自进化
Learning Loop
开源项目
保护你的 Shell 脚本:Shell 脚本高效加密指南
综合
保护你的 Shell 脚本:Shell 脚本高效加密指南
2024-11-19 07:28:17 +0800 CST
view 1953
本文介绍了两种常见的Shell脚本加密工具:SHC和gzexe。SHC提供高等级的加密,适合需要严格安全性的场景,而gzexe适用于安全性要求不高的情况。文章详细说明了SHC的安装、使用方法及其生成的加密脚本的执行方式,同时也介绍了gzexe的加密和解密操作,帮助用户根据需求选择合适的加密方式。
Shell脚本
安全
加密工具
Hermes Agent 深度解析:当 AI 终于学会「从经验中自己长大」
编程
Hermes Agent 深度解析:当 AI 终于学会「从经验中自己长大」
2026-04-11 07:13:15 +0800 CST
view 484
深入解析 Hermes Agent 的核心机制:KEPA 提示反向传播、四层记忆系统架构、自动技能生成系统。代码级分析,揭示让 AI Agent 真正「长记性」的工程方案。
AI Agent
Hermes
开源
自学习
记忆系统
KEPA
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
编程
2026 大模型推理优化:TensorRT-LLM v0.19 + Blackwell + 低比特量化实战手册
2026-04-09 03:15:44 +0800 CST
view 337
2026年TensorRT-LLM v0.19全面解析:Skip Softmax稀疏注意力、Paged KV Cache显存管理、INT8/INT4低比特量化完整实战,Blackwell架构适配指南,70B模型单卡部署方案
TensorRT-LLM
低比特量化
Blackwell
INT8
INT4
推理优化
NVIDIA
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 202
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
Hermes Agent 深度解析:6.1万Star的自进化AI智能体,如何用闭环学习颠覆传统Agent架构
编程
Hermes Agent 深度解析:6.1万Star的自进化AI智能体,如何用闭环学习颠覆传统Agent架构
2026-04-17 07:14:13 +0800 CST
view 412
Hermes Agent深度技术解析:6.1万Star的自进化AI智能体,三层记忆系统、闭环学习机制、技能自动创建与优化,与传统Agent架构的对比分析及生产部署实践
AI Agent
Hermes
自进化
开源
Nous Research
Hermes Agent 深度解析:Nous Research 如何用「自进化闭环」重新定义 AI Agent 的工程边界
编程
Hermes Agent 深度解析:Nous Research 如何用「自进化闭环」重新定义 AI Agent 的工程边界
2026-04-13 17:26:10 +0800 CST
view 514
深度拆解 Nous Research 开源的 Hermes Agent,从三层记忆系统、自动技能生成、MCP 双向协议等核心机制,探讨自进化 AI Agent 的工程实践与未来方向。
AI Agent
Hermes Agent
Nous Research
自我进化
记忆系统
开源
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
编程
LLM推理引擎终极对决:vLLM vs TensorRT-LLM深度解析与2026生产环境选型指南
2026-04-20 13:45:31 +0800 CST
view 185
深度对比vLLM与TensorRT-LLM两大LLM推理框架,从PagedAttention到Kernel Fusion,从量化技术到生产部署,助你做出正确的技术选型决策
LLM
vLLM
TensorRT-LLM
推理优化
大模型部署
量化技术
AI工程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 292
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
LLM Wiki 深度解析:当 Karpathy 亲手终结 RAG 的草莽时代
编程
LLM Wiki 深度解析:当 Karpathy 亲手终结 RAG 的草莽时代
2026-04-08 19:24:56 +0800 CST
view 1194
Karpathy最新提出的LLM Wiki范式深度解析,从工程实现、架构设计、代码实战等多维度解读这一可能终结RAG的全新知识管理方案。
LLM
RAG
知识管理
Karpathy
Claude
AI
RuView 深度解析:当WiFi信号学会看穿墙壁,4万Star背后的感知革命
编程
RuView 深度解析:当WiFi信号学会看穿墙壁,4万Star背后的感知革命
2026-04-25 06:02:44 +0800 CST
view 311
深度解析GitHub 4万Star开源项目RuView:用WiFi信号实现人体姿态估计、呼吸心率监测、穿墙检测
RuView
WiFi感知
CSI
Rust
开源
DensePose
人体姿态
ESP32
Wasmtime 43.0.0 深度解析:Fuel 机制从「粗粒度熔断」到「Opcode 级成本精算」的工程革命
编程
Wasmtime 43.0.0 深度解析:Fuel 机制从「粗粒度熔断」到「Opcode 级成本精算」的工程革命
2026-04-13 16:26:40 +0800 CST
view 174
深入解析 Wasmtime 43.0.0 引入的细粒度 Fuel Opcode 成本配置机制,从底层原理到生产实战配完整代码示例
WebAssembly
Wasmtime
Fuel机制
Cranelift
WASI
英特尔至强6 + SambaNova RDU:异构AI推理架构如何重新定义Agentic计算
编程
英特尔至强6 + SambaNova RDU:异构AI推理架构如何重新定义Agentic计算
2026-04-13 14:53:38 +0800 CST
view 231
深度解析英特尔与SambaNova联合发布的商用异构AI推理架构,涵盖三阶段分工、至强6 AMX加速向量数据库70%性能提升、LLVM编译50%加速等核心技术创新
AI推理
异构计算
至强6
SambaNova
Agentic
向量数据库
LLVM
性能优化
Shannon 深度解析:当 AI 学会自己当黑客,白盒渗透测试的范式革命
编程
Shannon 深度解析:当 AI 学会自己当黑客,白盒渗透测试的范式革命
2026-04-19 02:46:40 +0800 CST
view 218
Shannon是Keygraph开源的白盒AI渗透测试工具,38K+ Star,XBOW基准96.15%成功率。深度解析其多Agent架构、四阶段工作流、证明式验证机制,以及CI/CD集成实战。
Shannon
AI安全
渗透测试
白盒测试
OWASP
Web安全
DeepRare深度解析:当AI学会像医生一样"慢思考"——全球首个可溯源医疗智能体的技术架构与工程实践
编程
DeepRare深度解析:当AI学会像医生一样"慢思考"——全球首个可溯源医疗智能体的技术架构与工程实践
2026-04-19 10:47:48 +0800 CST
view 150
深度解析上海交大Nature论文DeepRare系统的技术架构,包括System 2慢思考机制、中枢-分身架构、知识图谱构建等核心技术的工程实现
AI
医疗
架构设计
深度学习
Helidon 4.4 深度解析:当 Oracle 把 LangChain4j AI Agent 能力直接内建进 Java 微服务框架
编程
Helidon 4.4 深度解析:当 Oracle 把 LangChain4j AI Agent 能力直接内建进 Java 微服务框架
2026-04-11 11:26:05 +0800 CST
view 441
2026年4月Oracle发布Helidon 4.4,原生集成LangChain4j AI Agent能力。本文深度解析这一重磅更新,从架构演进、代码实战到性能优化,全面展示Java微服务框架如何拥抱AI Agent时代。
Java
Helidon
LangChain4j
AI Agent
微服务
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
编程
Gemma 4 架构解密:MoE 路由 × GQA 注意力 × Thinking Mode——31B 如何击败 20 倍参数对手
2026-04-19 17:47:49 +0800 CST
view 167
深入解析 Google Gemma 4 的核心技术架构:MoE 稀疏专家路由、GQA 分组查询注意力、PLE 逐层嵌入、Thinking Mode 推理机制,详解 31B 模型如何以小博大击败 20 倍参数对手,附全场景部署实战代码。
Gemma
Google
AI
开源大模型
MoE
GQA
Transformer
深度学习
模型架构
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 74
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
编程
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
2026-04-18 12:45:10 +0800 CST
view 221
深度解析MIT/NVIDIA/浙大联合发布的TriAttention技术,用三角函数预测注意力分布,实现KV Cache智能压缩,让超长上下文推理成为可能
大模型
注意力机制
KV缓存
Transformer
深度学习
AI优化
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
编程
Hermes Agent 深度解析:自进化智能体的工程架构与 Skill 生成机制
2026-04-12 05:23:08 +0800 CST
view 576
深入解析 Hermes Agent 的自进化智能体架构:从 Skill 自动生成引擎、三层记忆系统、Tool Router 到 Platform Bridge,源码级别剖析 + 代码示例,对比 OpenClaw
AI Agent
Hermes Agent
Nous Research
自进化
智能体
Skill生成
Memory Hub
Tool Router
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
编程
SKILL0深度解析:当技能不再是外挂——浙大与美团如何用技能内化重新定义小模型智能体
2026-04-13 18:57:15 +0800 CST
view 256
浙江大学联合美团和清华大学发布SKILL0论文,提出技能内化范式,让3B小模型通过上下文强化学习将AI技能内化到模型参数中,推理时零Token开销,在ALFWorld等基准上超越GPT-4o和Gemini。
SKILL0
技能内化
Skill Internalization
AI Agent
强化学习
浙大
美团
小模型
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
...
83
下一页