程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
编程
1.6万亿参数,1M上下文,仅需27%算力:DeepSeek-V4-Pro 如何重新定义长文本推理
2026-05-11 10:53:54 +0800 CST
view 406
DeepSeek-V4-Pro 以 1.6T 总参数、49B 激活参数的 MoE 架构,原生支持 100 万 token 上下文,同时将推理算力降至 V3.2 的 27%、KV Cache 降至 10%。本文深度解析 CSA/HCA 混合注意力机制、mHC 流形约束超连接、KV Cache 极致优化、Muon 优化器等核心技术创新,以及如何在 Ollama、vLLM、官方 API 三种方式下部署运行。
DeepSeek-V4,MoE架构,CSA注意力,HCA注意力,KV Cache,1M上下文,长文本推理,开源大模型
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
编程
ds4 深度解析:当 Redis 之父用 C 语言手写 AI 推理引擎——从「窄而深」哲学到把 284B 模型塞进一台 MacBook 的技术全拆解
2026-06-12 18:19:08 +0800 CST
view 203
深度解析 Redis 之父 antirez 最新开源项目 ds4(DwarfStar):一个纯 C 语言手写的 DeepSeek V4 Flash 本地推理引擎。从「窄而深」的工程哲学、非对称 2-bit 量化、磁盘 KV 缓存、Metal/CUDA 内核优化到实际部署,完整拆解这个 13K+ Star 项目的技术内幕。
AI推理引擎
DeepSeek
本地推理
系统编程
开源项目
C语言
英伟达免费开放H100算力:DeepSeek、Kimi、GLM等主流大模型API免费用
编程
英伟达免费开放H100算力:DeepSeek、Kimi、GLM等主流大模型API免费用
2026-04-21 13:09:34 +0800 CST
view 1673
英伟达Build平台免费开放H100算力和主流大模型API,支持DeepSeek、Kimi、GLM等,3步拿到Key,代码对接OpenAI格式即可使用。
NVIDIA
大模型
免费API
DeepSeek
Kimi
大模型部署太慢?这个超级引擎帮你搞定!SGLang速通指南
编程
大模型部署太慢?这个超级引擎帮你搞定!SGLang速通指南
2026-04-22 09:27:57 +0800 CST
view 473
DeepSeek官方推荐!SGLang高性能大模型推理框架速通指南,RadixAttention前缀缓存、零开销调度、OpenAI API兼容,性能碾压vLLM。
SGLang
大模型推理
DeepSeek
开源
vLLM
MoE架构深度实战:当模型参数突破万亿——从DeepSeek R2到GPT-5的稀疏激活革命(2026完全指南)
编程
MoE架构深度实战:当模型参数突破万亿——从DeepSeek R2到GPT-5的稀疏激活革命(2026完全指南)
2026-06-26 00:46:56 +0800 CST
view 19
2026年,大语言模型的参数量已经突破1.2万亿(DeepSeek R2),但推理时的计算量只相当于200亿参数的稠密模型。这背后的核心技术就是Mixture of Experts(MoE)架构。本文深度解析MoE的核心原理、工程实现、负载均衡策略,以及DeepSeek R2和GPT-5中的最新优化技巧。包含完整的PyTorch代码实战,从零实现MoE层。
MoE架构
混合专家
DeepSeek R2
稀疏激活
门控网络
负载均衡
大模型推理
细粒度MoE
共享专家
GPT-5
DeepSeek-TUI 深度解析:用 Rust 重塑终端 AI 编程体验——从双二进制架构到 1M 上下文的工程实践
编程
DeepSeek-TUI 深度解析:用 Rust 重塑终端 AI 编程体验——从双二进制架构到 1M 上下文的工程实践
2026-05-18 10:28:09 +0800 CST
view 313
深度解析 DeepSeek-TUI 的架构设计、核心特性与实战应用,一款用 Rust 编写的终端原生 AI 编程代理,支持 1M 上下文、子代理并行执行和 MCP 协议扩展。
AI
编程
Rust
终端
DeepSeek
DeepSeek-TUI 技术解密:Rust 编写的终端 AI 编程助手——双二进制架构与百万 token 上下文实战
编程
DeepSeek-TUI 技术解密:Rust 编写的终端 AI 编程助手——双二进制架构与百万 token 上下文实战
2026-05-18 10:29:38 +0800 CST
view 272
深度解析 DeepSeek-TUI 的架构设计、核心特性与实战应用,一款用 Rust 编写的终端原生 AI 编程代理,支持 1M 上下文、子代理并行执行和 MCP 协议扩展。
AI
编程
Rust
终端
DeepSeek
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
编程
DwarfStar 4 深度实战:当 Redis 之父手写 AI 推理引擎——从 284B MoE 模型塞进 MacBook 到生产级本地 Agent 的完全指南(2026)
2026-06-13 20:17:57 +0800 CST
view 231
Redis之父antirez新作DwarfStar 4深度解析:专为DeepSeek V4 Flash打造的本地推理引擎,非对称2-bit量化、磁盘KV缓存、Metal图执行、分布式推理、方向引导,MacBook上284B模型跑出26 tok/s的完全指南
ds4
DwarfStar
DeepSeek
本地推理
Metal
MoE
量化
KV缓存
GitHub 3.5K Star!DeepSeek TUI:终端中的深度思考编码智能体
案例
GitHub 3.5K Star!DeepSeek TUI:终端中的深度思考编码智能体
2026-05-05 19:10:30 +0800 CST
view 800
GitHub 3.5K Star!DeepSeek TUI把V4模型搬进终端,原生RLM并行推理、实时思考模式展示、1M Token超上下文、三种工作模式,会话保存与工作区回滚
AI编程
DeepSeek
TUI
终端工具
编码智能体
Claude Code平替
1MToken
用AI做失败复盘:一张提示词,让核心问题自动浮现
资讯
用AI做失败复盘:一张提示词,让核心问题自动浮现
2026-04-23 21:28:06 +0800 CST
view 392
本文探讨了失败复盘的正确方法,指出常见复盘误区(归咎外部、情绪化分析),并介绍了一套AI提示词,通过六步结构化流程(接收结果、澄清边界、确认动机、提取核心事实、单线深入、点出核心)引导用户从模糊感受转向具体事实,找到真正导致失败的行为断裂点。提示词设计为中立复盘引导者,不猜测心理,只基于事实链分析。实测在DeepSeek上效果理想,强调信息越具体分析越精准。
提示词工程
AI工具
复盘方法论
DeepSeek
LLM应用
自我提升
结构化思维
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
编程
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
2026-04-24 17:19:28 +0800 CST
view 480
2026年4月24日DeepSeek发布V4预览版,总参1.6T/284B,激活49B/13B,100万Token上下文,DSA稀疏注意力,兼容OpenAI+Anthropic双协议,昇腾与寒武纪Day 0适配,深度解析其架构与API用法。
DeepSeek
V4
MoE
大模型
开源
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
编程
DeepSeek-R1边缘推理实战:从云端独占到本地智能的范式转移
2026-05-19 12:42:27 +0800 CST
view 314
2026年,边缘AI不再只是云端模型的精简版。本文深入剖析DeepSeek-R1 CPU版的技术原理,从模型蒸馏、量化技术的底层原理到生产环境的完整部署方案,提供可直接落地的代码和可量化的性能数据。
DeepSeek
R1
边缘计算
AI推理
模型蒸馏
量化
llama.cpp
Ollama
端侧AI
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
编程
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
2026-04-26 08:10:21 +0800 CST
view 511
深度解析DeepSeek-V4的技术突破:百万Token原生上下文、万亿级MoE架构、国产芯片适配。从技术原理到工程实践,全面剖析这场开源AI的革命。
DeepSeek
大模型
MoE
百万上下文
开源AI
DeepSeek-TUI 深度实战:用 Rust 打造的终端 AI 编程革命——从零构建 DeepSeek V4 驱动的智能开发环境
编程
DeepSeek-TUI 深度实战:用 Rust 打造的终端 AI 编程革命——从零构建 DeepSeek V4 驱动的智能开发环境
2026-05-22 04:22:02 +0800 CST
view 282
深入剖析 DeepSeek-TUI 的技术架构、Rust 实现细节、核心算法,并通过完整可运行的代码示例,教你构建终端 AI 编程助手。
DeepSeek
Rust
终端AI
编程助手
TUI
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
编程
TileLang + TileKernels 深度解析:DeepSeek 如何用 Python 写出让 GPU 逼近理论性能上限的 GPU 内核
2026-04-28 10:55:20 +0800 CST
view 375
深度剖析 DeepSeek 开源的 TileLang DSL 和 TileKernels GPU 内核库:从 GEMM 到 MoE,从 TVM 编译基础设施到生产级量化内核,揭示用 Python 写接近硬件极限性能 GPU 代码的秘密。
TileLang
GPU内核
DeepSeek
高性能计算
CUDA
GEMM
MoE
量化
TVM
开源项目
3.2万Star开源本地AI知识库:Open Notebook支持18家模型+播客生成+MCP集成
编程
3.2万Star开源本地AI知识库:Open Notebook支持18家模型+播客生成+MCP集成
2026-06-21 12:21:16 +0800 CST
view 92
Open Notebook 是3.2万Star的开源本地AI知识库,Google Notebook LM替代品。支持18家AI模型切换、1-4人播客生成、RAG对话+来源标注、MCP集成、REST API。MIT协议,Docker两分钟部署,数据全在本地。
AI知识库
开源
RAG
播客
MCP
Ollama
DeepSeek
本地部署
隐私
PostgreSQL 18深度解析:从WAL延迟检测到Kubernetes原位大版本升级——一次数据库工程能力的大跨越
编程
PostgreSQL 18深度解析:从WAL延迟检测到Kubernetes原位大版本升级——一次数据库工程能力的大跨越
2026-04-12 19:55:15 +0800 CST
view 722
深度解析PostgreSQL 18四大核心新特性:WAL延迟自动检测、LDAP企业级认证、Kubernetes原地大版本升级(GA)、PVC快照备份。包含完整K8s YAML配置、性能优化实战与运维架构演进路线图。
PostgreSQL
Kubernetes
数据库
Percona
WAL
K8s
PostgreSQL18
高可用
PostgreSQL 19 深度解析:原生图查询、内核级 REPACK、异步 I/O——2026 年最值得关注的数据库版本
编程
PostgreSQL 19 深度解析:原生图查询、内核级 REPACK、异步 I/O——2026 年最值得关注的数据库版本
2026-05-14 01:43:40 +0800 CST
view 329
PostgreSQL 19于2026年4月8日进入特性冻结,9月正式发布。本文深度解析其原生图查询(Cypher语法)、内核级REPACK在线表重组、完整异步I/O支持(云上性能提升58%)、pg_plan_advice执行计划提示等重磅新特性。
PostgreSQL19,PostgreSQL,数据库,图查询,REPACK,异步IO,执行计划提示,向量检索
DeerFlow 2.0 深度拆解:字节跳动如何用 52k Star 重新定义 AI Agent 工程化范式
编程
DeerFlow 2.0 深度拆解:字节跳动如何用 52k Star 重新定义 AI Agent 工程化范式
2026-04-27 16:22:29 +0800 CST
view 461
深度解析字节跳动开源的DeerFlow 2.0超级智能体框架,从架构设计到代码实战,全面剖析52k Star背后的工程化范式
AI Agent
DeerFlow
字节跳动
LangGraph
智能体
开源项目
GitHub Trending
eBPF 云原生可观测性实战:从 DeepFlow 零侵扰采集到 GreptimeDB 统一存储、从 Cilium 网络观测到 AI Agent 可观测闭环的完全指南(2026)
编程
eBPF 云原生可观测性实战:从 DeepFlow 零侵扰采集到 GreptimeDB 统一存储、从 Cilium 网络观测到 AI Agent 可观测闭环的完全指南(2026)
2026-06-20 05:53:45 +0800 CST
view 118
基于 eBPF 技术构建零侵扰、低成本、统一存储的云原生可观测性流水线,结合 DeepFlow、Cilium、AutoMQ、GreptimeDB 实现 Metrics/Logs/Traces 全栈关联与 AI Agent 可观测闭环。
eBPF
云原生
可观测性
DeepFlow
Cilium
GreptimeDB
AutoMQ
Linux内核
Rust
PostgreSQL 18 深度实战:当异步 I/O 遇上 UUIDv7 —— 从全新存储引擎到生产级迁移的完全指南(2026)
编程
PostgreSQL 18 深度实战:当异步 I/O 遇上 UUIDv7 —— 从全新存储引擎到生产级迁移的完全指南(2026)
2026-06-09 20:17:52 +0800 CST
view 175
PostgreSQL 18 深度实战指南:涵盖全新异步I/O子系统、UUIDv7原生支持、虚拟生成列、OAuth 2.0认证、Skip Scan索引优化、时间区间约束等核心特性,从架构原理到生产级迁移的完全指南
PostgreSQL
数据库
PostgreSQL18
异步IO
UUIDv7
性能优化
C语言重写 × 知识图谱 × 99% Token节省:codebase-memory-mcp 如何让 AI 编程代理真正「懂」你的代码
编程
C语言重写 × 知识图谱 × 99% Token节省:codebase-memory-mcp 如何让 AI 编程代理真正「懂」你的代码
2026-06-26 16:49:08 +0800 CST
view 12
深入解析 DeusData/codebase-memory-mcp:纯 C 语言重写的代码知识图谱引擎,158 种语言支持,亚毫秒查询,99% Token 节省,零依赖单二进制。涵盖架构设计、与 Sourcegraph/Cursor 的全方位对比、生产实战指南。
codebase-memory-mcp
C
知识图谱
MCP
AI编程
Tree-sitter
代码智能
Token优化
SQLite
代码知识图谱革命:Understand Anything 与 CodeGraph 如何重塑 AI 编程的全局视野
编程
代码知识图谱革命:Understand Anything 与 CodeGraph 如何重塑 AI 编程的全局视野
2026-05-31 09:53:49 +0800 CST
view 427
深度解析 GitHub 热门项目 Understand Anything 与 CodeGraph,揭秘代码知识图谱如何让 AI 编程助手获得全局视野,Token 消耗下降 90%,代码理解效率提升 10 倍。从 Tree-sitter 解析到多 Agent 流水线,从 SQLite 预索引到语义理解双引擎,一篇讲透代码知识图谱的技术原理与实战应用。
AI编程
代码分析
知识图谱
开源项目
Claude Code
Cursor
Tree-sitter
SQLite
性能优化
DeerFlow 2.0 深度实战:字节跳动开源 Super Agent Harness——从 LangGraph 多智能体编排到 18 层中间件责任链的完全指南(2026)
编程
DeerFlow 2.0 深度实战:字节跳动开源 Super Agent Harness——从 LangGraph 多智能体编排到 18 层中间件责任链的完全指南(2026)
2026-06-01 17:52:37 +0800 CST
view 221
2026年2月字节跳动开源 DeerFlow 2.0,从深度研究框架进化为 Super Agent 运行时基础设施。本文深度拆解其四层微服务架构、多智能体协作模型、18层中间件责任链设计,并提供完整的代码实战与生产级部署指南。
DeerFlow
字节跳动
Super Agent
LangGraph
AI Agent
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
...
3
4
5
6
7
...
59
下一页