程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
大模型部署太慢?这个超级引擎帮你搞定!SGLang速通指南
编程
大模型部署太慢?这个超级引擎帮你搞定!SGLang速通指南
2026-04-22 09:27:57 +0800 CST
view 170
DeepSeek官方推荐!SGLang高性能大模型推理框架速通指南,RadixAttention前缀缓存、零开销调度、OpenAI API兼容,性能碾压vLLM。
SGLang
大模型推理
DeepSeek
开源
vLLM
Claude Code 持久记忆实战:从三层压缩机制到 Claude-Mem 的跨会话记忆实现
编程
Claude Code 持久记忆实战:从三层压缩机制到 Claude-Mem 的跨会话记忆实现
2026-04-22 09:32:54 +0800 CST
view 172
深入解析 Claude Code 三层上下文压缩机制的局限,以及开源项目 Claude-Mem 如何通过 SQLite+向量检索双轨架构实现跨会话持久记忆,并探讨记忆插件背后的商业博弈与技术启示。
Claude Code
CIaude-Mem
上下文压缩
AI编程
持久记忆
LLM
向量检索
MarkItDown 深度解析:微软如何用一款工具重塑 RAG 文档处理管线
编程
MarkItDown 深度解析:微软如何用一款工具重塑 RAG 文档处理管线
2026-04-13 12:25:55 +0800 CST
view 507
微软开源的 MarkItDown 如何统一 PDF、Word、Excel、PPT 等格式转换为 Markdown,成为 RAG 数据预处理的事实标准。
RAG
Python
文档处理
Markdown
微软
OpenAI
LLM
性能吊打Flink、55k星:Pathway如何用Python+Rust重构实时数据处理管线
编程
性能吊打Flink、55k星:Pathway如何用Python+Rust重构实时数据处理管线
2026-04-13 14:23:16 +0800 CST
view 210
深度解析GitHub 55k星开源项目Pathway,如何用Python+Rust混合架构重构实时数据处理管线,吊打Flink性能,原生支持LLM管道和RAG应用。
Python
Rust
Pathway
实时数据
ETL
Flink
流处理
LLM
RAG
数据工程
Karpathy 的 AutoResearch 深度实战:630 行代码如何让 AI 自己做研究——从 program.md 编程范式到 Muon 优化器的全链路拆解
编程
Karpathy 的 AutoResearch 深度实战:630 行代码如何让 AI 自己做研究——从 program.md 编程范式到 Muon 优化器的全链路拆解
2026-05-05 06:36:49 +0800 CST
view 31
深度拆解 Karpathy 的 autoresearch 项目:630 行代码如何实现 AI 自主研究循环,从 program.md 编程范式到 Muon 优化器,从 Git 驱动版本控制到多 Agent 协作的全链路实战
AutoResearch
Karpathy
AI自主研究
Muon优化器
LLM训练
MarkItDown深度解析:微软开源的AI文档预处理神器,10万星背后的技术架构与工程实践
编程
MarkItDown深度解析:微软开源的AI文档预处理神器,10万星背后的技术架构与工程实践
2026-04-23 05:40:30 +0800 CST
view 199
深度解析微软开源的MarkItDown文档预处理工具:从架构设计到工程实践,涵盖PDF/Word/Excel/图片/音频等20+格式转换、OCR与LLM Vision集成、RAG管道构建、Docker部署与性能优化
MarkItDown
微软
开源
Markdown
RAG
文档处理
AI
LLM
Python
MCP
AI Hedge Fund 深度解析:当巴菲特遇上大模型——多智能体投资系统的工程革命
编程
AI Hedge Fund 深度解析:当巴菲特遇上大模型——多智能体投资系统的工程革命
2026-04-14 04:53:29 +0800 CST
view 721
深度解析 GitHub 51.7k Star 项目 AI Hedge Fund:如何用 15+ AI Agent 复刻巴菲特、芒格等传奇投资人的思维范式,探索多智能体协作在投资决策中的工程实践。
AI Hedge Fund
多智能体系统
投资Agent
巴菲特
GitHub Trending
Python
LLM应用
Browser-Use 深度解析:当AI学会看网页——79k Stars背后的浏览器自动化革命
编程
Browser-Use 深度解析:当AI学会看网页——79k Stars背后的浏览器自动化革命
2026-04-14 06:26:31 +0800 CST
view 535
Browser-Use是GitHub 79k+ Stars的AI浏览器自动化框架,通过LLM驱动实现自然语言控制浏览器。本文深度解析其架构设计、双模态页面理解、多模型集成机制,并附完整代码实战示例。
Browser-Use
浏览器自动化
AI Agent
Playwright
LLM驱动
用AI做失败复盘:一张提示词,让核心问题自动浮现
资讯
用AI做失败复盘:一张提示词,让核心问题自动浮现
2026-04-23 21:28:06 +0800 CST
view 124
本文探讨了失败复盘的正确方法,指出常见复盘误区(归咎外部、情绪化分析),并介绍了一套AI提示词,通过六步结构化流程(接收结果、澄清边界、确认动机、提取核心事实、单线深入、点出核心)引导用户从模糊感受转向具体事实,找到真正导致失败的行为断裂点。提示词设计为中立复盘引导者,不猜测心理,只基于事实链分析。实测在DeepSeek上效果理想,强调信息越具体分析越精准。
提示词工程
AI工具
复盘方法论
DeepSeek
LLM应用
自我提升
结构化思维
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
编程
FlashPrefill 深度解析:当瞬时注意力遇上 GPU 原语——从 O(N²) 困境到 27 倍速的工程革命
2026-04-15 17:20:25 +0800 CST
view 209
深度解析中科院与腾讯微信联合研发的 FlashPrefill 如何通过即时注意力模式发现和动态阈值筛选,将 25.6 万字符长文本处理速度提升 27.78 倍,同时保持近乎完美的精度。
LLM推理优化
FlashAttention
GPU计算
长文本处理
注意力机制
Transformer
深度学习
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
编程
VibeVoice 深度解析:微软如何用连续语音Tokenizer和Next-Token Diffusion重塑语音AI边界
2026-04-15 22:19:22 +0800 CST
view 171
深度解析微软VibeVoice开源语音AI全家桶:7.5Hz连续Tokenizer如何压缩60分钟音频,Next-Token Diffusion如何驱动90分钟对话合成,附完整代码实战与性能对比。
VibeVoice
微软
语音AI
ASR
TTS
Diffusion
LLM
Docs2KG:用大模型把PDF、邮件、Excel统一建成知识图谱,让企业沉睡知识激活
编程
Docs2KG:用大模型把PDF、邮件、Excel统一建成知识图谱,让企业沉睡知识激活
2026-04-16 19:04:26 +0800 CST
view 182
Docs2KG是AI4WA开源的知识图谱构建框架,用大模型将PDF、邮件、Excel等异构文档统一抽取为知识三元组,构建统一知识图谱,支持问答和推理分析。
知识图谱
AI
LLM
PDF
RAG
知识管理
开源
FastGPT:27.2K Star零代码构建企业级AI知识库,可视化工作流+多模态文档一站搞定
编程
FastGPT:27.2K Star零代码构建企业级AI知识库,可视化工作流+多模态文档一站搞定
2026-04-16 19:06:53 +0800 CST
view 245
FastGPT是环界云团队开源的AI知识库问答系统(27.2K Stars),零代码构建私有知识库,支持可视化工作流编排和多模态文档解析,支持GPT/Claude等任意LLM模型。
AI
知识库
FastGPT
RAG
开源
LLM
工作流
Dify
Dify:92K Star开源LLM应用平台,零代码构建生产级AI工作流,Docker一键部署
编程
Dify:92K Star开源LLM应用平台,零代码构建生产级AI工作流,Docker一键部署
2026-04-16 19:09:32 +0800 CST
view 206
Dify是开源的LLM应用开发平台(92K Stars),零代码构建生产级AI应用,支持可视化工作流编排和知识库管理,服务超过2000个团队,已完成3000万美元融资。
AI
LLM
Dify
工作流
RAG
开源
知识库
可视化编排
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
编程
LangChain4j:把LangChain的能力带入Java世界,一个库搞定LLM集成、RAG、Agent
2026-04-16 19:11:21 +0800 CST
view 186
LangChain4j是Java世界的LangChain,简化Java应用集成大语言模型,支持OpenAI/Claude/DeepSeek等模型,提供RAG、Agent、Tool Calling、Memory等完整能力,Apache 2.0协议。
Java
LangChain
AI
LLM
RAG
Agent
开源
工具调用
编程
MarkItDown 深度解析:微软 AutoGen 团队出品的万能文档转换工具,如何让 RAG 系统真正「吃得好」
2026-04-17 09:15:57 +0800 CST
view 264
微软 AutoGen 团队出品的 MarkItDown 如何解决 RAG 系统中文档预处理的格式地狱,深度解析其架构设计、各格式处理策略与 RAG 实战集成。
Python
Tools
RAG
LLM
AutoGen
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
编程
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
2026-04-08 12:29:41 +0800 CST
view 218
IBM、红帽、谷歌联合向CNCF捐赠llm-d项目,标志着Kubernetes正式迈入AI原生时代。本文深度解析llm-d架构设计、性能数据及实践建议。
Kubernetes
云原生
AI
大模型
llm-d
CNCF
Pathway 深度解析:当 Python 遇上 Rust 引擎,实时 ETL 的性能革命
编程
Pathway 深度解析:当 Python 遇上 Rust 引擎,实时 ETL 的性能革命
2026-04-08 15:34:42 +0800 CST
view 305
Pathway 是一个用 Python 写业务逻辑、用 Rust 执行计算的实时 ETL 框架,基于 Differential Dataflow 实现真正的增量计算。本文深度解析其架构原理、核心用法、LLM xpack 的 RAG 应用,以及在 AI 数据流水线中的独特价值。
Pathway
ETL
Rust
Python
流处理
LLM
RAG
增量计算
编程
MarkItDown 深度解析:微软开源的文档转换神器如何重塑 LLM 时代的知识处理流水线
2026-04-18 06:17:21 +0800 CST
view 158
深度解析微软开源的 MarkItDown 文档转换工具,从架构设计、源码实现到实战应用,揭秘它如何成为 LLM 时代知识处理的基础设施。
MarkItDown
微软开源
文档转换
LLM
RAG
Python工具
Markdown
PDF转换
LLM Wiki 深度解析:当 Karpathy 亲手终结 RAG 的草莽时代
编程
LLM Wiki 深度解析:当 Karpathy 亲手终结 RAG 的草莽时代
2026-04-08 19:24:56 +0800 CST
view 1245
Karpathy最新提出的LLM Wiki范式深度解析,从工程实现、架构设计、代码实战等多维度解读这一可能终结RAG的全新知识管理方案。
LLM
RAG
知识管理
Karpathy
Claude
AI
2026年4月24日:大模型军备竞赛进入新纪元——DeepSeek V4 与 GPT-5.5 深度技术对比解析
编程
2026年4月24日:大模型军备竞赛进入新纪元——DeepSeek V4 与 GPT-5.5 深度技术对比解析
2026-04-28 08:54:41 +0800 CST
view 370
2026年4月24日,DeepSeek V4与GPT-5.5同日发布。本文从MoE架构、注意力机制、性能基准、Engram记忆模块、mHC超连接、Muon优化器等核心技术点进行硬核深度对比,配大量代码示例,为开发者提供实用的技术选型指南。
AI大模型
LLM
GitHub精选
开源项目
TechNews
60行配置文件斩获5万星:Karpathy如何用四条原则终结AI编程的混乱时代
编程
60行配置文件斩获5万星:Karpathy如何用四条原则终结AI编程的混乱时代
2026-04-18 14:44:57 +0800 CST
view 442
andrej-karpathy-skills项目60行CLAUDE.md文件斩获54k星标,四条原则Think Before Coding、Simplicity First、Surgical Changes、Goal-Driven Execution如何终结AI编程的混乱时代
AI编程
Claude Code
Prompt Engineering
LLM
软件工程
Khazix Skills 深度解析:当「数字生命卡兹克」把压箱底的 AI Skills 一字不改开源出来
编程
Khazix Skills 深度解析:当「数字生命卡兹克」把压箱底的 AI Skills 一字不改开源出来
2026-04-10 00:44:17 +0800 CST
view 692
数字生命卡兹克开源的 AI Skills 合集,支持 Claude Code、OpenClaw、Codex 三大平台,包含写作、代码、研究等核心 Skill,实用主义风格,真实生产环境验证。
AI Skills
Khazix
数字生命卡兹克
Agent Skills
开源
10天破3800星!Claude Code Skill一句话生成7种风格技术图表
编程
10天破3800星!Claude Code Skill一句话生成7种风格技术图表
2026-04-21 11:04:25 +0800 CST
view 150
fireworks-tech-graph:10天3800星的Claude Code Skill,用自然语言生成7种风格的技术图表,支持RAG、Mem0、多Agent等架构图,Mermaid画不出来的它能补位
Claude Code
Skill
AI画图
图表生成
Claude Code Skills
技术图
架构图
Mermaid
开源
GitHub
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
6
下一页