程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
Claude Mythos Preview 深度解析:Anthropic 史上最强模型为何被「关进笼子」?
编程
Claude Mythos Preview 深度解析:Anthropic 史上最强模型为何被「关进笼子」?
2026-05-13 21:18:14 +0800 CST
view 38
Claude Mythos Preview是Anthropic史上最强模型,2026年4月发布即被关进笼子——未经专项训练就自主发现数千个零日漏洞。本文深度解析其核心能力、被锁仓原因及对网络安全行业的影响。
Claude
AI模型
零日漏洞
网络安全
Anthropic
BitNet b1.58 深度解析:微软如何用1.58位量化颠覆大模型推理范式
编程
BitNet b1.58 深度解析:微软如何用1.58位量化颠覆大模型推理范式
2026-04-23 19:09:57 +0800 CST
view 204
深度解析微软开源的BitNet b1.58 2B4T模型,从1.58位三值量化原理、架构设计、性能对比到部署实战,全面剖析这个仅需0.4GB内存、在普通CPU上流畅运行的革命性大语言模型。
BitNet
量化
大模型
微软
CPU推理
边缘计算
GLM-OCR 深度解析:0.9B 参数的文档理解小钢炮,OmniDocBench 拿下 94.62 分的秘密
编程
GLM-OCR 深度解析:0.9B 参数的文档理解小钢炮,OmniDocBench 拿下 94.62 分的秘密
2026-05-13 22:15:56 +0800 CST
view 27
GLM-OCR是智谱AI推出的0.9B参数文档理解多模态模型,凭借布局感知两阶段流水线和GRPO强化学习,在OmniDocBench v1.5以94.62分领先。本文深度解析其CogViT架构、MTP解码加速、印章识别技术及完整部署实战。
GLM-OCR,智谱AI,OCR,多模态模型,文档理解
LiteLLM深度解析:统一调用100+大模型的AI网关SDK架构设计与实战
编程
LiteLLM深度解析:统一调用100+大模型的AI网关SDK架构设计与实战
2026-04-23 21:13:57 +0800 CST
view 274
LiteLLM是一个统一调用100+大模型API的AI网关SDK,旨在解决大模型API碎片化问题。它采用OpenAI格式作为统一接口,支持PythonSDK和ProxyServer双引擎架构。
AI基础设施
大模型开发
API网关
Python开发
系统架构
性能优化
安全防护
开源项目
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
资讯
腾讯混元 Hy3 preview 开源:295B 参数、推理提效 40%,姚顺雨首秀交卷
2026-04-23 21:18:45 +0800 CST
view 334
2026年4月23日,腾讯发布并开源新一代大模型混元Hy3preview,总参数295B、激活参数21B的MoE架构,支持256K超长上下文,推理效率提升40%,API最低1.2元/百万tokens。在复杂推理、代码与Agent能力上表现突出,接近GPT-5.4级别,数学推理创国内最高纪录。已接入腾讯云、元宝等多条产品线,并上架TokenHub。
人工智能
大模型
腾讯
开源
MoE
推理
代码生成
Agent
云计算
TimesFM 深度解析:Google Research 的时序预测基础模型,如何让预测速度提升 5 倍
编程
TimesFM 深度解析:Google Research 的时序预测基础模型,如何让预测速度提升 5 倍
2026-05-14 00:45:45 +0800 CST
view 24
TimesFM是Google Research开源的时序预测基础模型,支持Zero-Shot推理,预测速度比LSTM快15倍。本文深度解析其Decoder-Only Transformer架构、Next Patch Prediction预训练目标、代码实战及性能优化技巧。
TimesFM
Google
时序预测
基础模型
Transformer
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
编程
ReAct 框架深度解析:AI Agent 的「思考-行动-观察」循环,从字符串解析到原生 Tool Calling 的演进
2026-05-14 01:14:23 +0800 CST
view 26
ReAct框架是AI Agent的核心架构范式,通过Thought-Action-Observation循环实现智能推理与行动。本文深度解析其从字符串解析到原生Tool Calling的演进历程、LangGraph状态机架构、代码实战及最佳实践。
ReAct,AI Agent,TAO循环,Function Calling,LangGraph,大语言模型,深度学习,Python,机器学习,智能体
Docker AI Toolkit 2026 深度解析:从镜像构建到推理服务,AI 工作流的全链路重构
编程
Docker AI Toolkit 2026 深度解析:从镜像构建到推理服务,AI 工作流的全链路重构
2026-05-14 01:55:02 +0800 CST
view 16
Docker AI Toolkit 2026于2026年3月1日发布,原生支持PyTorch 2.4、TensorFlow 2.17、ONNX Runtime 1.19一键构建,Sigstore签名+OIDC身份绑定防止供应链攻击,docker ai serve --adaptive自适应推理让GPU利用率稳定在80%,LLM微调延迟压至83ms,WASM沙箱让边缘AI应用启动时间<100ms。
Docker,AI Toolkit,PyTorch,TensorFlow,ONNX Runtime,模型签名验证,Sigstore,WASM沙箱,自适应推理
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
编程
AI 原生前端开发 2026 深度解析:LLM-as-Compiler、编译时语义理解、声明式 UI 合成——前端开发的范式革命
2026-05-14 03:40:08 +0800 CST
view 23
2026年奇点智能技术大会正式提出AI原生前端开发范式,LLM不再只是辅助工具而是编译过程的一部分。深度解析LLM-as-Compiler、编译时语义理解、声明式UI合成及Vite5.4+插件调用本地MoE模型的技术实现。
AI原生前端,LLM-as-Compiler,编译时语义理解,声明式UI合成,Vite5.4,MoE模型
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
编程
DeepSeek-V4预览版深度解析:MoE架构+百万上下文+1.6T参数,开源旗舰模型全面升级
2026-04-24 17:19:28 +0800 CST
view 223
2026年4月24日DeepSeek发布V4预览版,总参1.6T/284B,激活49B/13B,100万Token上下文,DSA稀疏注意力,兼容OpenAI+Anthropic双协议,昇腾与寒武纪Day 0适配,深度解析其架构与API用法。
DeepSeek
V4
MoE
大模型
开源
综合
Llama 3.1 Omni:颠覆性的文本与语音双输出模型
2024-11-19 09:57:33 +0800 CST
view 1654
Llama3.1Omni模型是一种创新的多模态语言模型,能够同时生成文本和语音,提升用户体验。它适用于客户服务、教育和医疗等多个领域,具有强大的推理能力和生成质量。该模型开源,易于使用,开发者可以根据需求进行定制。Llama3.1Omni的出现为AI应用带来了更智能和多样化的可能性,值得关注和应用。
人工智能
语言模型
多模态交互
开源技术
用户体验
LangBot:大模型原生IM机器人平台,一套接入QQ/企微/飞书,支持工具调用
编程
LangBot:大模型原生IM机器人平台,一套接入QQ/企微/飞书,支持工具调用
2026-04-16 17:09:50 +0800 CST
view 231
LangBot是开源的大模型原生IM机器人平台,26.3K Star,支持QQ/企微/飞书多平台接入,一次开发多端运行,支持工具调用和多轮对话,适合运营和客服场景。
AI
机器人
聊天机器人
IM
开源
大模型
多平台
5ire:MCP原生的跨平台桌面AI助手,支持本地知识库+多模型自由切换
编程
5ire:MCP原生的跨平台桌面AI助手,支持本地知识库+多模型自由切换
2026-04-16 19:04:26 +0800 CST
view 233
5ire是一款开源跨平台桌面AI助手(1.5K Stars),原生支持MCP协议,可接入多模型并构建本地知识库,支持docx/pdf/excel等文档向量化,适合隐私敏感场景。
AI
MCP
桌面助手
开源
知识库
RAG
多模型
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
综合
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程
2024-11-18 19:34:19 +0800 CST
view 1783
Captum是一个由FacebookResearch开发的开源Python库,专注于分析和解释深度学习模型的决策过程。它提供多种工具,如集成梯度、SaliencyMap和DeepLift,帮助开发者理解模型对输入数据的依赖关系和特征重要性。Captum提升了模型的透明度和可解释性,适用于模型审查、优化和调试等场景。
深度学习
模型解释
机器学习
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
编程
DeepSeek-V4 深度解析:百万Token上下文与MoE架构的技术革命
2026-04-26 08:10:21 +0800 CST
view 288
深度解析DeepSeek-V4的技术突破:百万Token原生上下文、万亿级MoE架构、国产芯片适配。从技术原理到工程实践,全面剖析这场开源AI的革命。
DeepSeek
大模型
MoE
百万上下文
开源AI
GuaDa AI:功能完备的AI Agent系统,支持MCP、Skills、多平台机器人
案例
GuaDa AI:功能完备的AI Agent系统,支持MCP、Skills、多平台机器人
2026-05-07 22:18:24 +0800 CST
view 143
GuaDa AI开源项目:功能完备的AI Agent系统,支持ReAct Agent、RAG知识库、MCP协议、Skills技能框架热插拔、多平台机器人(QQ/飞书/企业微信)。NestJS+Vue 3全栈TypeScript,SQLite+sqlite-vec轻量级部署
AI Agent
ReAct
MCP
Skills
RAG
多模型
NestJS
Vue 3
开源
国产AI编程的"越级时刻":Qwen3.6-Plus凭什么硬刚Claude?
编程
国产AI编程的"越级时刻":Qwen3.6-Plus凭什么硬刚Claude?
2026-04-08 11:03:41 +0800 CST
view 355
阿里Qwen3.6-Plus发布,编程能力直逼Claude Opus 4.5,调用成本仅五分之一。深度解析国产AI模型的越级突破。
AI编程
大模型
国产AI
Qwen
Claude
Ollama + OpenClaw + Claude Code:本地大模型驱动的自动化编程工作流深度解析
编程
Ollama + OpenClaw + Claude Code:本地大模型驱动的自动化编程工作流深度解析
2026-04-17 13:15:36 +0800 CST
view 409
深度解析如何将 Ollama、OpenClaw 和 Claude Code 组合成强大的本地化 AI 编程工作流
Ollama
OpenClaw
Claude Code
AI编程
本地大模型
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
编程
llm-d进入CNCF:Kubernetes正式迈入AI原生时代
2026-04-08 12:29:41 +0800 CST
view 262
IBM、红帽、谷歌联合向CNCF捐赠llm-d项目,标志着Kubernetes正式迈入AI原生时代。本文深度解析llm-d架构设计、性能数据及实践建议。
Kubernetes
云原生
AI
大模型
llm-d
CNCF
Kronos 深度解析:金融市场基础模型的崛起——从120亿K线数据中炼金的AI革命
编程
Kronos 深度解析:金融市场基础模型的崛起——从120亿K线数据中炼金的AI革命
2026-04-17 15:45:39 +0800 CST
view 368
Kronos是首个开源金融K线基础模型,在45个交易所120亿条数据上预训练,零样本价格预测RankIC提升93%。本文深入解析其Tokenizer架构、预训练范式,并提供代码实战指南。
Kronos
金融AI
基础模型
时间序列
K线
量化交易
Trae 深度解析:字节跳动如何用 AI 原生 IDE 重新定义程序员的工作流
编程
Trae 深度解析:字节跳动如何用 AI 原生 IDE 重新定义程序员的工作流
2026-04-27 17:24:18 +0800 CST
view 215
从 MarsCode 到 Trae 2.0,字节跳动的 AI 编程工具经历了怎样的进化?SOLO 模式、Tab-Cue 引擎、多智能体调度——这些底层技术究竟如何运作?本文从架构设计到代码实战,全面拆解这款 2026 年最炙手可热的 AI 原生 IDE。
Trae
AI IDE
字节跳动
AI编程
SOLO模式
Tab-Cue
多智能体
Builder模式
Seed模型
豆包
WebAssembly 组件模型深度实战:跨语言模块化架构的革命性突破
编程
WebAssembly 组件模型深度实战:跨语言模块化架构的革命性突破
2026-05-08 15:07:06 +0800 CST
view 81
从核心概念到生产级部署,带你全面掌握 WASI 0.2.0 时代的组件化开发范式。涵盖 WIT 接口定义、多语言组件实现、性能优化与实战案例。
WebAssembly
Wasm
组件模型
Rust
跨语言
WebAssembly Component Model 深度实战:从 WIT 接口定义到多语言组件协作的生产级全链路解析
编程
WebAssembly Component Model 深度实战:从 WIT 接口定义到多语言组件协作的生产级全链路解析
2026-05-08 15:08:12 +0800 CST
view 121
从核心概念到生产级部署,带你全面掌握 WASI 0.2.0 时代的组件化开发范式。涵盖 WIT 接口定义、多语言组件实现、性能优化与实战案例。
WebAssembly
Wasm
组件模型
Rust
跨语言
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
编程
SGLang vs vLLM:2026年大模型推理框架深度对比与选型指南
2026-04-08 15:51:53 +0800 CST
view 937
深度对比SGLang与vLLM两大LLM推理框架,从架构设计、核心原理、性能实测、适用场景多维度解析,附2026年选型建议
LLM
SGLang
vLLM
推理优化
大模型
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
5
下一页