程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
2026年AI架构突破全景解析:从 Kimi Attention Residuals 到存算一体——告别参数内卷,走向效率革命
编程
2026年AI架构突破全景解析:从 Kimi Attention Residuals 到存算一体——告别参数内卷,走向效率革命
2026-05-30 09:40:11 +0800 CST
view 57
深度解析2026年AI架构五大突破:Attention Residuals、存算一体、多模态原生、自我学习、量子AI,从算法到硬件全方位革新
AI架构
Attention Residuals
存算一体
量子AI
多模态原生
DeerFlow 2.0 深度拆解:字节跳动如何用 52k Star 重新定义 AI Agent 工程化范式
编程
DeerFlow 2.0 深度拆解:字节跳动如何用 52k Star 重新定义 AI Agent 工程化范式
2026-04-27 16:22:29 +0800 CST
view 317
深度解析字节跳动开源的DeerFlow 2.0超级智能体框架,从架构设计到代码实战,全面剖析52k Star背后的工程化范式
AI Agent
DeerFlow
字节跳动
LangGraph
智能体
开源项目
GitHub Trending
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
编程
Gemma 4 MoE 架构技术深度解析:Dense MLP + Routed MoE 双路径设计如何重塑开源大模型
2026-04-21 14:22:20 +0800 CST
view 333
深度解析 Google Gemma 4 的 Dual-Path 混合架构设计:Dense MLP 保障通用基座能力,Routed MoE 释放专业化推理效率。一文吃透技术原理、部署实战与选型对比。
Gemma 4
MoE架构
Dense MLP
Routed MoE
Google DeepMind
开源大模型
Transformer
模型部署
混合专家
Flutter 2026 深度解析:Impeller 接管 Android、Wasm 颠覆 Web 端——跨平台框架的底层革命
编程
Flutter 2026 深度解析:Impeller 接管 Android、Wasm 颠覆 Web 端——跨平台框架的底层革命
2026-05-11 07:21:12 +0800 CST
view 297
Flutter 2026深度解析:Impeller渲染引擎全面接管Android解决卡顿,Wasm成为Web默认实现原生性能,AI原生架构重塑跨平台开发
Flutter
Impeller
Wasm
跨平台
渲染引擎
AI原生
OpenTelemetry 深度解析:可观测性终极标准如何重塑云原生监控——从三大支柱到 AI 根因分析的全链路实战
编程
OpenTelemetry 深度解析:可观测性终极标准如何重塑云原生监控——从三大支柱到 AI 根因分析的全链路实战
2026-05-11 05:48:38 +0800 CST
view 246
OpenTelemetry深度解析:可观测性终极标准如何重塑云原生监控,从Traces/Metrics/Logs三大支柱到AI根因分析的全链路实战
OpenTelemetry,可观测性,分布式追踪,Metrics,Logs,OTLP,云原生
Free Claude Code:让Claude Code接入任意模型,打破Anthropic绑定
编程
Free Claude Code:让Claude Code接入任意模型,打破Anthropic绑定
2026-04-29 12:20:38 +0800 CST
view 679
Free Claude Code是让Claude Code接入任意模型的代理层项目,打破Anthropic绑定,支持NVIDIA NIM/OpenRouter/DeepSeek/Ollama/LM Studio等后端,适合想降成本或本地部署AI编程环境的人。
Claude Code
AI编程
开源工具
OpenRouter
DeepSeek
Ollama
LM Studio
AI Coding
Anthropic
OpenHuman 深度解析:从 Memory Tree 到 TokenJuice——登顶 GitHub Trending 的个人 AI 超级智能架构内幕
编程
OpenHuman 深度解析:从 Memory Tree 到 TokenJuice——登顶 GitHub Trending 的个人 AI 超级智能架构内幕
2026-05-18 12:14:32 +0800 CST
view 400
深度拆解登顶GitHub Trending的OpenHuman项目:Memory Tree摘要树架构、TokenJuice 80%压缩引擎、模型路由策略、Auto-Fetch自动同步、118+集成、Obsidian双向集成、本地优先隐私设计的完整技术内幕
OpenHuman
AI助手
Memory Tree
TokenJuice
Rust
Tauri
开源项目
Go 泛型深度解析:从语法设计到高性能实战(2026版)
编程
Go 泛型深度解析:从语法设计到高性能实战(2026版)
2026-05-18 22:47:39 +0800 CST
view 175
Go 1.18 引入泛型是 Go 语言诞生以来最大的语法变革,本文深入剖析其设计哲学、类型推导机制、性能模型,并结合 Go 1.21–1.24 的最新演进,给出生产级实战范式。
Go
泛型
类型系统
单态化
B+Tree
Go标准库
OpenHuman 深度实战:Rust+Tauri 构建本地优先的 AI 桌面助手——Memory Tree 持久记忆与 118+ 集成完全指南(2026)
编程
OpenHuman 深度实战:Rust+Tauri 构建本地优先的 AI 桌面助手——Memory Tree 持久记忆与 118+ 集成完全指南(2026)
2026-05-30 21:11:41 +0800 CST
view 32
OpenHuman 用 Rust+Tauri 构建本地优先的 AI 桌面助手,通过 Memory Tree 持久记忆和 118+ 集成让 Agent 拥有跨会话长期记忆。本文从架构原理到生产级部署完整拆解。
OpenHuman
Rust
Tauri
AI桌面助手
Memory Tree
知识图谱
本地AI
Orca 深度实战:多 Agent 并行开发环境的新范式——从单兵作战到舰队协同的架构革命
编程
Orca 深度实战:多 Agent 并行开发环境的新范式——从单兵作战到舰队协同的架构革命
2026-05-22 11:48:08 +0800 CST
view 113
Orca 是首个真正意义上的多 Agent 并行开发环境(ADE),支持同时运行 Claude Code、Codex、Grok 等多个 AI Agent,每个 Agent 在独立 Git Worktree 中工作。本文深入解析其 Worktree-Native 架构、Agent 协调机制及实际工作流。
AI编程
多Agent
Orca
GitWorktree
ClaudeCode
Codex
AI助手
开发效率
综合
PicaComic是一个基于Flutter开发的开源跨平台漫画程序
2024-11-19 06:49:01 +0800 CST
view 5252
PicaComic是一个基于Flutter开发的开源跨平台漫画程序,支持多个操作系统,迅速在GitHub上获得2k星标。它允许用户访问多个漫画源,并支持本地存储和自定义漫画源,提供多样化的选择和良好的用户体验。用户只需下载源码并安装Flutter即可轻松构建应用,是漫画爱好者和开发者的理想选择。
漫画
开源软件
跨平台应用
Flutter
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
编程
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
2026-05-18 06:15:03 +0800 CST
view 219
Redis之父antirez开源ds4.c项目深度解析:用纯C语言在MacBook上运行284B参数大模型,不对称2-bit量化、KV缓存磁盘化、OpenAI/Anthropic API兼容,打造首个真正的本地Agent推理后端
AI推理
本地大模型
Redis
Apple Silicon
DeepSeek
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
编程
ds4 深度解析:Redis 作者的最后一战?—— DwarfStar 4 本地推理引擎的技术革命
2026-05-15 17:47:40 +0800 CST
view 271
深入解析 antirez(Redis 作者)新开源项目 ds4:DwarfStar 4 本地推理引擎,专门为 DeepSeek V4 Flash 打造,支持 Metal/CUDA 后端,2-bit 量化可在 96GB 内存 MacBook 上运行 284B 参数模型。
AI推理
本地部署
DeepSeek
Redis
Apple Silicon
CUDA
Metal
MoE
量化
Rust 1.95.0 深度解析:cfg_select!、闭包捕获优化、Trait 向上转型——2026 年最重要的 Rust 版本
编程
Rust 1.95.0 深度解析:cfg_select!、闭包捕获优化、Trait 向上转型——2026 年最重要的 Rust 版本
2026-05-14 03:43:00 +0800 CST
view 163
Rust 1.95.0深度解析:cfg_select!宏条件编译新语法、闭包捕获优化更精确的捕获模式减少Clone开销、Trait向上转型Supertrait Upcasting面向对象编程最后一公里、编译器增量编译速度提升20%。
Rust1.95,cfg_select,闭包捕获优化,Trait向上转型,SupertraitUpcasting,编译器优化
Little Snitch for Linux 开源深度解析:当 macOS 传奇防火墙「杀入」Linux 生态
编程
Little Snitch for Linux 开源深度解析:当 macOS 传奇防火墙「杀入」Linux 生态
2026-04-10 00:25:47 +0800 CST
view 421
2026年4月8日Objective Development开源Little Snitch for Linux的eBPF核心代码。本文从源码出发,深度拆解其架构设计、过滤引擎算法、eBPF内核空间实现与用户态程序。
Linux
eBPF
网络安全
Rust
Firewall
Little Snitch
Go 1.26 深度实战:new(expr)、Green Tea GC、SIMD 加速与 runtime/secret 全解析
编程
Go 1.26 深度实战:new(expr)、Green Tea GC、SIMD 加速与 runtime/secret 全解析
2026-04-28 09:50:59 +0800 CST
view 467
Go 1.26 深度解析:new(expr)语法糖、递归泛型约束、Green Tea GC延迟降低40%、SIMD十倍加速、runtime/secret阅后即焚,从底层原理到代码实战,完整覆盖生产环境升级指南
Go
Golang
GC
SIMD
runtime/secret
new(expr)
Green Tea GC
泛型
性能优化
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
编程
vLLM 深度实战:从 PagedAttention 到 Speculative Decoding——2026年大模型推理引擎内核架构完全指南
2026-05-23 18:44:14 +0800 CST
view 178
2026年深度长文,从PagedAttention分页思想、Continuous Batching调度算法、Speculative Decoding并行验证机制到CUDA Kernel底层实现,全面拆解vLLM推理引擎内核架构,附生产级部署实战与框架横向对比。
vLLM
PagedAttention
Continuous Batching
Speculative Decoding
GPU推理
大模型部署
深度学习
CUDA
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
编程
LLM推理引擎全栈优化实战:从PagedAttention到投机解码,榨干GPU的每一滴算力
2026-05-17 10:21:56 +0800 CST
view 223
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
编程
万字深度:PagedAttention、连续批处理与投机解码——LLM推理优化七层实战
2026-05-17 10:22:13 +0800 CST
view 198
深度拆解LLM推理引擎核心技术栈:PagedAttention消除内存碎片、连续批处理榨干GPU算力、NUMA感知调度、混合精度量化、投机解码加速、算子融合、分布式推理架构,附代码示例与性能数据
LLM
vLLM
PagedAttention
推理优化
量化
投机解码
ContinuousBatching
GPU
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
编程
vLLM 深度解析:LLM 推理性能的终极引擎——从 PagedAttention 到生产级部署的完整技术内幕
2026-05-18 08:22:35 +0800 CST
view 274
全面解析 vLLM 推理引擎的核心架构,从 PagedAttention 原理到生产级部署实战,涵盖量化推理、多GPU并行、性能调优等完整技术栈
vLLM
LLM推理
PagedAttention
GPU优化
量化推理
深度解析
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
编程
SGLang 深度实战:新一代 LLM 编程与推理框架——从 RadixAttention 原理到 Agent 系统生产部署
2026-05-06 17:37:39 +0800 CST
view 336
深度解析 SGLang 推理框架的 RadixAttention 原理、DSL 编程范式、正则约束解码,以及在 Agent 系统和多轮对话场景的生产部署实践。
SGLang
LLM
推理加速
Agent
RadixAttention
结构化生成
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
编程
LLM 推理优化全景实战:从 PagedAttention 到投机解码——让大模型推理成本下降 70% 的技术革命(2026)
2026-05-30 15:42:55 +0800 CST
view 40
深度解析 LLM 推理优化的核心技术:PagedAttention 内存管理革命、投机解码加速策略、INT4/FP8 量化技术、MoE 架构优化,从架构原理到代码实战,让大模型推理成本下降 70%。
LLM
推理优化
vLLM
PagedAttention
投机解码
量化
MoE
Trae 深度解析:字节跳动如何用 AI 原生 IDE 重新定义程序员的工作流
编程
Trae 深度解析:字节跳动如何用 AI 原生 IDE 重新定义程序员的工作流
2026-04-27 17:24:18 +0800 CST
view 330
从 MarsCode 到 Trae 2.0,字节跳动的 AI 编程工具经历了怎样的进化?SOLO 模式、Tab-Cue 引擎、多智能体调度——这些底层技术究竟如何运作?本文从架构设计到代码实战,全面拆解这款 2026 年最炙手可热的 AI 原生 IDE。
Trae
AI IDE
字节跳动
AI编程
SOLO模式
Tab-Cue
多智能体
Builder模式
Seed模型
豆包
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
编程
TileKernels 深度解析:DeepSeek 用 80 行代码榨干 GPU,算子开发范式的降维打击
2026-04-30 03:22:15 +0800 CST
view 406
深度解析 DeepSeek 开源的高性能 GPU 算子库 TileKernels:基于 TileLang DSL 用 80 行代码实现手写 CUDA 级性能,覆盖 MoE Gating/Routing、FP8/FP4 量化、Engram 门控等七大算子家族,首次原生支持 NVIDIA Blackwell 架构,并通过 TVM 编译器打通昇腾等国产芯片。
DeepSeek
TileKernels
GPU
CUDA
TileLang
MoE
算子优化
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
32
下一页