程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
编程
llama.cpp 深度实战:当端侧 LLM 成为生产级事实标准——从 GGUF 量化到跨平台部署的完全指南(2026)
2026-06-11 00:19:05 +0800 CST
view 204
全面解析 llama.cpp 推理引擎,从 GGUF 格式、量化原理、架构设计到跨平台部署,提供生产级代码实战和性能优化指南。
llama.cpp
GGUF
量化
端侧推理
大语言模型
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
案例
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎,Mac上跑出468 token/s
2026-05-10 08:40:22 +0800 CST
view 606
Redis之父antirez亲自下场!为DeepSeek V4 Flash打造专属推理引擎ds4.c,C+Metal从头编写,Mac Studio M3 Ultra上预填充468 token/s。关键优化:非对称量化(MoE专家层2-bit)、KV缓存搬硬盘、内置OpenAI/Anthropic双API。128GB Mac可跑,专为coding agent优化。
DeepSeek
AI推理
Mac
Redis
antirez
Metal
本地推理
MoE
GGUF
C语言
Apple Silicon
Claude Code
OpenAI API
Anthropic API
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
编程
当 Apple Silicon 遇上视觉大模型:MLX-VLM 如何把「本地多模态推理」变成现实
2026-04-11 10:24:48 +0800 CST
view 709
深度解析 Apple Silicon 上的视觉语言模型推理引擎 MLX-VLM,涵盖架构设计、模型支持、性能优化与实战部署。
Apple Silicon
MLX
视觉语言模型
VLM
Mac本地AI
多模态推理
Obscura 深度实战:从 Rust 无头引擎到 AI Agent 浏览器底座——Headless Chrome 的终结者还是补充者?
编程
Obscura 深度实战:从 Rust 无头引擎到 AI Agent 浏览器底座——Headless Chrome 的终结者还是补充者?
2026-05-23 12:15:52 +0800 CST
view 302
Obscura 是用 Rust 编写的高性能无头浏览器引擎,专为 AI Agent 和网页抓取设计。本文深度解析其架构设计、性能优势、Stealth 反检测机制及生产级实践。
Rust
无头浏览器
AI Agent
Web 抓取
V8
CDP
Playwright
Puppeteer
性能优化
架构设计
Lightpanda 深度实战:当 AI Agent 有了自己的浏览器——从 Zig 零构建引擎到 CDP/MCP 双协议生产级部署完全指南
编程
Lightpanda 深度实战:当 AI Agent 有了自己的浏览器——从 Zig 零构建引擎到 CDP/MCP 双协议生产级部署完全指南
2026-06-11 10:49:09 +0800 CST
view 246
Lightpanda是用Zig从零构建的无头浏览器,专为AI和自动化设计。100并行页面比Chrome快9倍、内存省16倍,支持CDP和MCP双协议
Lightpanda
Zig
Headless Browser
AI Agent
MCP
CDP
Puppeteer
Web Automation
oMLX 深度实战:当 macOS 菜单栏成为本地 LLM 推理的控制中心——从连续批处理到 SSD 分层缓存、从 MLX 后端加速到生产级部署的完全指南(2026)
编程
oMLX 深度实战:当 macOS 菜单栏成为本地 LLM 推理的控制中心——从连续批处理到 SSD 分层缓存、从 MLX 后端加速到生产级部署的完全指南(2026)
2026-06-22 17:24:05 +0800 CST
view 203
oMLX 是专为 Apple Silicon 优化的 LLM 推理服务器,通过连续批处理、分层 KV Cache、MLX 后端加速和 macOS 菜单栏管理,让本地 AI 推理从可用走向实用。
LLM
Apple Silicon
MLX
本地推理
MCP
Apple Container 深度实战:当 Swift 遇见 VM-per-Container——从架构革命到 macOS 原生容器化的生产级完全指南(2026)
编程
Apple Container 深度实战:当 Swift 遇见 VM-per-Container——从架构革命到 macOS 原生容器化的生产级完全指南(2026)
2026-06-17 06:57:55 +0800 CST
view 247
Apple Container v1.0.0 深度实战:VM-per-Container 架构革命、Containerization Swift 包、独立 IP 网络、OCI 兼容、性能优化与生产级部署指南
Apple Container
Swift
容器化
macOS
Virtualization
OCI
VM
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
编程
llama.cpp 深度实战:从 GGUF 量化到 CUDA 内核优化——纯 C/C++ 如何在 CPU/GPU 上榨出 LLM 推理的极限性能
2026-05-23 17:18:22 +0800 CST
view 1509
2026年深度拆解 llama.cpp 的核心架构:GGUF 格式原理、20+量化方法对比、KV Cache 优化、多硬件后端性能实测,与 Ollama/vLLM 完整横评。
llama.cpp
GGUF
量化
CUDA
Metal
LLM推理
C++
本地部署
性能优化
GGML
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
编程
BitNet 1.58-bit:微软如何用三个值就让大模型在 CPU 上飞奔
2026-05-11 13:55:11 +0800 CST
view 355
微软开源BitNet 1.58-bit大模型推理框架,2B参数模型仅需0.4GB内存、29ms/token推理速度。核心创新:训练时量化、-1/0/+1三值权重、位运算加速,精度损失<5%却比INT4表现更好。纯CPU运行,71%能耗降低。
BitNet,1.58bit,微软,大模型量化,1bit LLM,CPU推理,bitnet.cpp,训练时量化,位运算加速,模型压缩
Apple Container 深度实战:当 Swift 遇上轻量虚拟化——从 macOS 原生容器到 Production 部署的完全指南(2026)
编程
Apple Container 深度实战:当 Swift 遇上轻量虚拟化——从 macOS 原生容器到 Production 部署的完全指南(2026)
2026-06-12 14:46:44 +0800 CST
view 339
深入解析苹果官方开源的 macOS 容器工具 apple/container,从架构设计、Virtualization.framework 技术栈、轻量VM模型等维度完整讲解,附实战部署示例。
Swift
Container
macOS
虚拟化
Apple Silicon
OCI
Docker
CloakBrowser 深度解析:49 个 C++ 补丁如何把 Chromium 变成「数字变色龙」——从源码级指纹篡改到 30/30 全通过的隐身浏览器架构内幕
编程
CloakBrowser 深度解析:49 个 C++ 补丁如何把 Chromium 变成「数字变色龙」——从源码级指纹篡改到 30/30 全通过的隐身浏览器架构内幕
2026-05-17 16:15:05 +0800 CST
view 406
深度解析 CloakBrowser 如何在 Chromium C++ 源码层打 49 个补丁,从根本上重写浏览器指纹信息,实现 30/30 检测全通过的反爬绕过方案。
CloakBrowser
Chromium
反爬虫
浏览器指纹
Playwright
Puppeteer
Python
资讯
商城APP开发费用解析:如何判断报价是否合理?
2024-11-19 01:02:48 +0800 CST
view 1695
本文分析了商城APP开发费用的影响因素,包括功能复杂度、开发方式、开发团队选择、设计与用户体验、后期维护等。提供了判断开发报价合理性的参考,强调源码交付和功能扩展的重要性。企业在开发前应明确需求,了解报价细节,以确保合理预算和高质量交付。
APP开发
软件开发
移动互联网
定制软件开发
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
编程
从原理到实战:llama.cpp 与 GGUF 量化格式的工程实践全解
2026-04-12 22:56:41 +0800 CST
view 720
2026年深度解析 llama.cpp 架构设计与 GGUF 量化格式,从底层原理到工程实战,涵盖 K-Quant/IQ 量化、Flash Attention、KV Cache 优化、Intel NPU/GPU 部署全流程。
llama.cpp
GGUF
量化
大模型
C++
本地部署
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
编程
ds4.c 深度解析:Redis之父如何用纯C代码在MacBook上跑通284B大模型——从不对称量化到KV缓存磁盘化的完整技术内幕
2026-05-18 06:15:03 +0800 CST
view 478
Redis之父antirez开源ds4.c项目深度解析:用纯C语言在MacBook上运行284B参数大模型,不对称2-bit量化、KV缓存磁盘化、OpenAI/Anthropic API兼容,打造首个真正的本地Agent推理后端
AI推理
本地大模型
Redis
Apple Silicon
DeepSeek
Nuxt 4 深度解析:全栈框架的新里程碑与开发者体验革命
编程
Nuxt 4 深度解析:全栈框架的新里程碑与开发者体验革命
2026-05-12 13:43:36 +0800 CST
view 617
深度解析Nuxt 4的重大革新:app/目录新结构、useAsyncData/useFetch智能升级、性能提升34%、TypeScript类型系统强化、Vue Router v5集成。
Nuxt4
全栈框架
Vue
VueRouter
app目录
useAsyncData
useFetch
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——从原理到生产级 AI 应用开发(2026)
2026-06-05 04:13:34 +0800 CST
view 236
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
编程
Ollama 完全指南:本地大模型部署的事实标准——架构、实战与生产级部署(2026)
2026-06-05 04:13:52 +0800 CST
view 304
Ollama 本地大模型部署完全指南,从架构原理到生产级部署,涵盖 RAG 集成、性能优化、Docker/K8s 部署等核心内容。
Ollama
本地大模型
AI应用开发
Go语言
llama.cpp
Go 1.26 Goroutine Leak Profiler 深度解析:等了 12 年,一行代码揪出协程泄露
编程
Go 1.26 Goroutine Leak Profiler 深度解析:等了 12 年,一行代码揪出协程泄露
2026-05-05 13:54:01 +0800 CST
view 364
Go 1.26 引入 goroutine leak profiler,通过 GC 可达性分析检测协程泄露。支持 HTTP 端点实时检测、测试自动检测、生产监控告警,由 Uber 工程师贡献提案,等了 12 年终于落地。
Go
Golang
Goroutine
性能优化
pprof
内存泄露
资讯
定制开发一个App到底需要多少钱?
2024-11-19 01:06:47 +0800 CST
view 1759
定制开发App的成本受多种因素影响,包括功能复杂度、设计要求、开发团队、开发周期、测试与质量保证、维护与更新及市场推广。开发流程包括需求分析、UI/UX设计、开发、测试及上线审核。定制开发的优势在于精确满足需求、独特用户体验、性能优化、安全保障、易于维护和高投资回报。团队由营销专家、设计师和工程师组成,致力于提供优质服务。
App开发
定制开发
用户体验
市场推广
技术服务
CloakBrowser 深度实战:当反爬虫战争进入「内核级隐身」——从 C++ 源码补丁到 Browser Fingerprint 完全伪造的生产级完全指南(2026)
编程
CloakBrowser 深度实战:当反爬虫战争进入「内核级隐身」——从 C++ 源码补丁到 Browser Fingerprint 完全伪造的生产级完全指南(2026)
2026-06-14 00:46:29 +0800 CST
view 229
CloakBrowser 深度实战:基于 C++ 源码级修改的隐身 Chromium 浏览器,通过 30+ 个内核级指纹补丁实现对 Cloudflare Turnstile、Akamai Bot Manager 等反爬虫系统的完全绕过。
CloakBrowser
浏览器指纹
反爬虫
Chromium
Playwright
Puppeteer
WebGL
Canvas
Rust 1.95.0 深度实战:cfg_select!、原子更新与 Apple 全生态支持——从语言设计到工程落地的完整指南
编程
Rust 1.95.0 深度实战:cfg_select!、原子更新与 Apple 全生态支持——从语言设计到工程落地的完整指南
2026-04-23 19:41:03 +0800 CST
view 479
深度解析Rust 1.95.0:cfg_select!宏替代cfg-if、Atomic::update告别手写CAS、Apple全生态Tier2支持、core::range嵌入式闭区间、性能优化实战与完整迁移指南
Rust
Rust1.95
cfg_select
原子操作
Apple开发
无锁并发
嵌入式
no_std
Gemma 4 12B 深度实战:当 Google 把「无编码器多模态」塞进 16GB 笔记本——从统一架构原理到生产级本地 Agent 的完全指南(2026)
编程
Gemma 4 12B 深度实战:当 Google 把「无编码器多模态」塞进 16GB 笔记本——从统一架构原理到生产级本地 Agent 的完全指南(2026)
2026-06-14 04:46:45 +0800 CST
view 237
深度解析 Google DeepMind Gemma 4 12B 的无编码器统一多模态架构,从原理到代码实战,涵盖 llama.cpp 部署、量化策略、Agent 工作流和生产级架构设计(2026)。
Gemma 4
Google DeepMind
多模态
本地部署
Agent
llama.cpp
开源大模型
HyperFrames 深度解析:HeyGen 开源的「HTML 写视频」革命——从 FrameAdapter 架构到 AI Agent 驱动的内容生产新范式
编程
HyperFrames 深度解析:HeyGen 开源的「HTML 写视频」革命——从 FrameAdapter 架构到 AI Agent 驱动的内容生产新范式
2026-05-19 00:47:13 +0800 CST
view 637
HeyGen 开源的 HyperFrames 框架深度解析:HTML+GSAP 写视频的革命性技术,FrameAdapter 架构、Puppeteer 逐帧捕获、FFmpeg 编码、AI Agent 自动化生产完整指南,对比 Remotion 与生产级实战
HyperFrames
AI视频
GSAP
Puppeteer
FFmpeg
视频渲染
前端工具
HeyGen
AI Agent
自动化生产
html-ppt-skill:AI原生的HTML演示文稿技能,20天2600+Star
案例
html-ppt-skill:AI原生的HTML演示文稿技能,20天2600+Star
2026-05-06 17:02:28 +0800 CST
view 1057
20天2600+Star的神级skill!html-ppt-skill让AI帮你做PPT,输出纯HTML文件,零构建零依赖。36套主题、15套模板、31种布局、47个动效、像素级演讲者模式
AI PPT
HTML演示
Agent Skill
Claude Code
演示文稿
零依赖
演讲者模式
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
4
...
9
下一页