程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Linux 内核二把手的断网猎手:Greg KH 的离线 AI 漏洞检测革命
编程
Linux 内核二把手的断网猎手:Greg KH 的离线 AI 漏洞检测革命
2026-05-30 16:14:24 +0800 CST
view 184
Linux 内核二把手 Greg KH 开发离线 AI 漏洞检测工具 gregkh_clanker_t1000,使用 AMD 锐龙 AI Max 在断网环境下运行大模型辅助内核补丁审查,已协助合并近 20 个补丁。
Linux
AI安全
模糊测试
AMD锐龙
GregKH
离线大模型
内核漏洞
统一内存
安全审计
oMLX 深度解析:Apple Silicon 原生的本地大模型推理服务器——从分层 KV 缓存到菜单栏级 AI 编码伴侣
编程
oMLX 深度解析:Apple Silicon 原生的本地大模型推理服务器——从分层 KV 缓存到菜单栏级 AI 编码伴侣
2026-05-21 22:30:11 +0800 CST
view 318
深入解析 oMLX 的分层 KV 缓存架构(热 RAM + 冷 SSD)、Copy-on-Write 优化、与 Claude Code 的深度集成,以及 Apple Silicon 原生的推理性能优化。
oMLX
Apple Silicon
本地大模型
KV缓存
MLX
推理服务器
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
编程
LLM 推理的显存战争:从 PagedAttention 到统一内存架构——KV Cache 管理五世代深度解析(2026)
2026-06-15 11:18:23 +0800 CST
view 31
深度解析大模型推理中 KV Cache 管理的五世代演进:从连续分配到 PagedAttention,再到异构缓存、分布式 KV 和统一混合内存架构。结合 vLLM、SGLang、TensorRT-LLM 给出生产环境选型指南。
LLM
大模型
KVCache
PagedAttention
vLLM
SGLang
TensorRT
推理优化
显存管理
分布式
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
编程
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
2026-04-08 15:51:53 +0800 CST
view 1391
深度对比SGLang与vLLM两大LLM推理框架,从架构设计、核心原理、性能实测、适用场景多维度解析,附2026年选型建议
LLM
SGLang
vLLM
推理优化
大模型
DFlash 深度实战:块扩散投机解码革命——让 Qwen3-8B 推理速度暴增 6.17 倍的技术全景(2026 完全指南)
编程
DFlash 深度实战:块扩散投机解码革命——让 Qwen3-8B 推理速度暴增 6.17 倍的技术全景(2026 完全指南)
2026-05-30 20:43:16 +0800 CST
view 213
DFlash 通过将块扩散模型引入投机解码,实现6.17倍无损推理加速。本文从原理、架构、数学推导、代码实战到生产部署,全方位解析这项颠覆性技术。
AI
大模型推理
DFlash
投机解码
块扩散
Qwen3
性能优化
Qwen3.5-Omni 深度解析:当 AI 终于学会用全部感官感知世界
编程
Qwen3.5-Omni 深度解析:当 AI 终于学会用全部感官感知世界
2026-04-08 18:08:20 +0800 CST
view 597
阿里发布新一代全模态大模型Qwen3.5-Omni,支持文本、图像、音频、视频四种模态,256K超长上下文,113种语言识别,215项任务SOTA
AI
大模型
全模态
通义千问
Qwen
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
编程
Ollama 本地大模型部署实战:从零到生产级应用的完全指南(2026)
2026-06-10 01:20:57 +0800 CST
view 142
2026年Ollama本地大模型部署完全指南:从架构原理、GGUF量化、ModelFile自定义、多语言集成(Python/JS/Go)、RAG实战到Docker/K8s生产部署,8500字深度长文。
Ollama
本地部署
大模型
LLM
生产级
GGUF
量化
SubCube 深度实战:亚二次稀疏注意力 SSA 如何打破 Transformer 的 O(n²) 铁律——1200万 Token 时代从架构原理到生产级部署的完全指南(2026)
编程
SubCube 深度实战:亚二次稀疏注意力 SSA 如何打破 Transformer 的 O(n²) 铁律——1200万 Token 时代从架构原理到生产级部署的完全指南(2026)
2026-05-31 08:21:47 +0800 CST
view 182
Subquadratic发布的SubQ模型采用SSA亚二次稀疏注意力架构,实现1200万Token上下文窗口,在MRCR v2基准测试中碾压GPT-5.5。本文从架构原理、基准分析、代码实战到生产部署全面解读这场注意力革命。
SSA
Subquadratic
SubQ
Transformer
注意力机制
长上下文
RAG
稀疏注意力
AI架构
大模型
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
编程
智谱 GLM-5.1 深度解析:当开源模型突破「8小时自治」临界点
2026-04-09 00:53:51 +0800 CST
view 1048
2026年4月8日智谱发布GLM-5.1,744B参数MIT开源,SWE-bench Pro 58.4分超越Claude Opus 4.6,全球首个支持8小时长程自治的开源模型。
GLM-5.1
智谱AI
开源大模型
MoE
SWE-bench
长程自治
LLM
GPT-5.5 深度实战:从原生全模态到 Agent 原生训练——OpenAI 两亿美元重跑预训练的架构解密与生产级调用完全指南(2026)
编程
GPT-5.5 深度实战:从原生全模态到 Agent 原生训练——OpenAI 两亿美元重跑预训练的架构解密与生产级调用完全指南(2026)
2026-05-31 08:51:02 +0800 CST
view 207
全面解密GPT-5.5三大核心技术突破:原生全模态架构、硬件协同设计、Agent原生训练目标。从架构原理到API调用,涵盖性能基准、成本分析、安全评估与生产级部署最佳实践。
GPT-5.5
OpenAI
AI大模型
Agent
API
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
编程
DeepSeek V4 深度解析:百万token上下文的技术革命,让开源模型站上全球之巅
2026-04-28 08:19:25 +0800 CST
view 423
深度解析 DeepSeek V4:混合注意力机制、MoE 架构、100万token 上下文、Agent 能力,从技术原理到部署实战,全面剖析开源模型新天花板
DeepSeek
AI大模型
开源
长上下文
MoE
混合注意力
Agent
Open-WebUI 深度实战:当本地大模型遇上生产级 Web 界面——从 RAG 管道到多模型统一编排的完全指南(2026)
编程
Open-WebUI 深度实战:当本地大模型遇上生产级 Web 界面——从 RAG 管道到多模型统一编排的完全指南(2026)
2026-06-10 03:16:35 +0800 CST
view 178
深入剖析 Open-WebUI 架构设计、RAG 实现原理、多模型编排机制,含大量可运行代码示例,覆盖从本地部署到生产级优化的完整流程。
Open-WebUI
本地大模型
RAG
FastAPI
Svelte
2026年4月24日:大模型军备竞赛进入新纪元——DeepSeek V4 与 GPT-5.5 深度技术对比解析
编程
2026年4月24日:大模型军备竞赛进入新纪元——DeepSeek V4 与 GPT-5.5 深度技术对比解析
2026-04-28 08:54:41 +0800 CST
view 676
2026年4月24日,DeepSeek V4与GPT-5.5同日发布。本文从MoE架构、注意力机制、性能基准、Engram记忆模块、mHC超连接、Muon优化器等核心技术点进行硬核深度对比,配大量代码示例,为开发者提供实用的技术选型指南。
AI大模型
LLM
GitHub精选
开源项目
TechNews
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
编程
MIT黑科技:TriAttention如何用三角函数让大模型「记住」超长上下文
2026-04-18 12:45:10 +0800 CST
view 492
深度解析MIT/NVIDIA/浙大联合发布的TriAttention技术,用三角函数预测注意力分布,实现KV Cache智能压缩,让超长上下文推理成为可能
大模型
注意力机制
KV缓存
Transformer
深度学习
AI优化
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
编程
Anthropic 封杀 OpenClaw 深度解析:从 30 万 Star 的"龙虾"到 AI 生态的成人礼
2026-04-09 05:15:20 +0800 CST
view 545
2026年4月4日,Anthropic正式封杀OpenClaw,30万虾农遭遇断粮危机。本文深度解析封杀背后的商业逻辑、ClawAegis安全防护体系,以及AI Agent时代的商业模式之争。
AI Agent
OpenClW
ClawAegis
Anthropic
大模型安全
开源智能体
2024年9月最新的8个低代码和零代码开源框架
综合
2024年9月最新的8个低代码和零代码开源框架
2024-11-19 06:31:59 +0800 CST
view 2560
本文推荐了2024年9月最新的8个低代码和零代码开源框架,专注于中后台管理系统的开发。这些框架通过减少手动编码,加快应用程序的开发和交付,适合不同类型的开发者。包括Appsmith、LowCodeEngine、Amis等,涵盖了从简单到复杂的多种需求,显著提升开发效率,降低开发成本。
低代码
零代码
开源
开发工具
前端技术
Understand Anything 深度实战:让 AI Agent 把 20 万行代码库变成可交互知识图谱——从 Tree-sitter 静态解析到多智能体流水线的完全指南(2026)
编程
Understand Anything 深度实战:让 AI Agent 把 20 万行代码库变成可交互知识图谱——从 Tree-sitter 静态解析到多智能体流水线的完全指南(2026)
2026-06-02 00:54:58 +0800 CST
view 147
深度解析 Understand Anything 如何用 Tree-sitter 静态解析 + LLM 语义理解双引擎,通过 7 个专业 Agent 流水线将大型代码库转化为可交互知识图谱,包含完整代码实战和性能优化策略。
代码知识图谱
AI Agent
Tree-sitter
代码理解
多智能体
GitNexus 深度实战:从零服务器架构到代码知识图谱——2026 年 AI Agent 代码理解完全指南
编程
GitNexus 深度实战:从零服务器架构到代码知识图谱——2026 年 AI Agent 代码理解完全指南
2026-05-24 21:51:49 +0800 CST
view 188
GitNexus 深度实战:零服务器代码知识图谱引擎,让 AI Agent 真正理解你的代码库。包含架构分析、代码实战、性能优化。
GitNexus
代码知识图谱
AI Agent
Graph RAG
代码理解
阿里开源 Open Code Review 深度实战:当确定性工程遇上 AI Agent——从百万级代码缺陷检测到生产级自动代码审查的完全指南
编程
阿里开源 Open Code Review 深度实战:当确定性工程遇上 AI Agent——从百万级代码缺陷检测到生产级自动代码审查的完全指南
2026-06-13 10:16:34 +0800 CST
view 114
阿里开源 Open Code Review 深度拆解:确定性工程流水线 + LLM 智能 Agent 混合架构,百万级代码缺陷检测验证,从安装配置到生产级 CI/CD 集成的完全实战指南
Open Code Review
阿里开源
AI代码审查
代码质量
CI/CD
AI编程
GitNexus 深度解析:35K Star 的零服务端代码智能引擎——从知识图谱构建到 Graph RAG 的全链路技术实战
编程
GitNexus 深度解析:35K Star 的零服务端代码智能引擎——从知识图谱构建到 Graph RAG 的全链路技术实战
2026-05-04 22:37:35 +0800 CST
view 268
GitNexus 35K Star 开源项目深度解析:12阶段DAG流水线构建代码知识图谱,Graph RAG让AI Agent真正理解代码架构,从符号提取到影响分析的全链路技术实战
GitNexus
知识图谱
代码智能
Graph RAG
MCP
代码分析
双剑合璧:Understand Anything + CodeGraph 如何彻底改变代码理解方式——2026 年 AI 辅助编程的知识图谱革命
编程
双剑合璧:Understand Anything + CodeGraph 如何彻底改变代码理解方式——2026 年 AI 辅助编程的知识图谱革命
2026-05-29 02:35:53 +0800 CST
view 355
深度解析 Understand Anything 和 CodeGraph 两个代码知识图谱工具,探讨它们如何革命性地改变代码理解方式,减少 AI 编码助手的 token 消耗,提升开发效率。
代码知识图谱
AI辅助编程
Claude Code
代码理解
知识图谱
Understand Anything
CodeGraph
双剑合璧:Understand Anything + CodeGraph 彻底改变代码理解——2026 知识图谱革命
编程
双剑合璧:Understand Anything + CodeGraph 彻底改变代码理解——2026 知识图谱革命
2026-05-29 02:36:13 +0800 CST
view 526
深度解析 Understand Anything 和 CodeGraph 两个代码知识图谱工具,探讨它们如何革命性地改变代码理解方式,减少 AI 编码助手的 token 消耗,提升开发效率。
代码知识图谱
AI辅助编程
Claude Code
代码理解
知识图谱
Understand Anything
CodeGraph
JeecgBoot:20K+ Star企业级AI低代码平台,前后端代码一键生成,DeepSeek深度集成
编程
JeecgBoot:20K+ Star企业级AI低代码平台,前后端代码一键生成,DeepSeek深度集成
2026-04-16 19:09:33 +0800 CST
view 447
JeecgBoot是20K+ Stars的Java企业级低代码平台,集成DeepSeek/ChatGPT/Ollama,代码生成器一键生成前后端完整代码,Apache 2.0协议商业友好,适合已有Java技术栈的团队。
Java
SpringBoot
低代码
AI
开源
JeecgBoot
代码生成
企业级
Bun 百万行 Rust 重写背后:AI 代码生成的速度与安全之辩
编程
Bun 百万行 Rust 重写背后:AI 代码生成的速度与安全之辩
2026-06-15 14:50:27 +0800 CST
view 31
Bun 用 Claude Code 9天重写100万行 Rust 代码,99.8%测试通过率背后却有10000+ unsafe块。深度拆解忠实翻译vs惯用重写、代码生成与验证的不对称、AI辅助迁移的正确姿势。
Rust
AI编程
代码迁移
Bun
unsafe
代码安全
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
...
13
下一页