程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
OpenMontage 深度解析:AI 智能体如何重构视频生产流水线——从三层知识架构到 12 条管道的工程化实践(2026)
编程
OpenMontage 深度解析:AI 智能体如何重构视频生产流水线——从三层知识架构到 12 条管道的工程化实践(2026)
2026-07-01 09:48:15 +0800 CST
view 38
2026年OpenMontage深度解析:全球首个智能体驱动的开源视频生产系统,12条工作流、52个工具、500+技能,从三层知识架构到生产级实战完整指南。
OpenMontage
AI视频
智能体
Agent
Remotion
视频制作
开源项目
Python
自动化
LMG2025大会获奖团队开源!Pixelle-Video让AI视频创作变成一句话的事
编程
LMG2025大会获奖团队开源!Pixelle-Video让AI视频创作变成一句话的事
2026-04-21 13:55:15 +0800 CST
view 671
GitHub热榜AI视频项目!LMG2025大会获奖团队开源,输入主题自动生成完整短视频,含数字人口播、图生视频、动作迁移等功能。
Pixelle-Video
AI视频
开源
短视频
数字人
MoneyPrinterTurbo 深度实战:当AI接管短视频流水线——从关键词到成片的全自动生产指南(2026)
编程
MoneyPrinterTurbo 深度实战:当AI接管短视频流水线——从关键词到成片的全自动生产指南(2026)
2026-06-13 08:51:07 +0800 CST
view 365
86K+ Star开源项目深度实战:从架构分析到代码部署,拆解MoneyPrinterTurbo的LLM文案生成、素材搜索、TTS语音、字幕生成、视频合成全Pipeline,附生产级部署方案与性能优化指南。
AI视频
短视频
Python
开源工具
自动化
HyperFrames 深度解析:HeyGen 开源的「HTML 写视频」革命——从 FrameAdapter 架构到 AI Agent 驱动的内容生产新范式
编程
HyperFrames 深度解析:HeyGen 开源的「HTML 写视频」革命——从 FrameAdapter 架构到 AI Agent 驱动的内容生产新范式
2026-05-19 00:47:13 +0800 CST
view 670
HeyGen 开源的 HyperFrames 框架深度解析:HTML+GSAP 写视频的革命性技术,FrameAdapter 架构、Puppeteer 逐帧捕获、FFmpeg 编码、AI Agent 自动化生产完整指南,对比 Remotion 与生产级实战
HyperFrames
AI视频
GSAP
Puppeteer
FFmpeg
视频渲染
前端工具
HeyGen
AI Agent
自动化生产
OpenMontage 深度实战:全球首个开源 AI Agent 视频制作系统——12条管线、52个工具、500+技能,让 AI 编程助手变身完整视频工作室(2026)
编程
OpenMontage 深度实战:全球首个开源 AI Agent 视频制作系统——12条管线、52个工具、500+技能,让 AI 编程助手变身完整视频工作室(2026)
2026-06-28 09:45:13 +0800 CST
view 128
深度解析全球首个开源 AI Agent 视频制作系统 OpenMontage:12条制作管线、52个工具、500+ Agent技能,支持 AI 图像动画和真实素材剪辑两种路径,成本低至 0.02 美元,附完整代码实战和架构解析。
AI视频,Agent,开源,Remotion,CLIP,FLUX,视频制作,AI编程,自动化
MoneyPrinterTurbo:AI 一键生成高清短视频的终极工具
编程
MoneyPrinterTurbo:AI 一键生成高清短视频的终极工具
2026-05-30 17:06:12 +0800 CST
view 339
MoneyPrinterTurbo 开源项目解析:只需一个关键词,AI自动生成视频文案、素材、配音、字幕,一键合成高清短视频。
AI视频
开源工具
短视频
自动化
从一张产品图到TikTok带货视频:Image2+Seedance 2.0全自动闭环工作流
编程
从一张产品图到TikTok带货视频:Image2+Seedance 2.0全自动闭环工作流
2026-04-28 03:24:00 +0800 CST
view 517
从一张产品图到TikTok带货视频的全自动闭环工作流。Image2锁死画面视觉DNA,Seedance 2.0赋予导演级运动控制。四个实战案例:多宫格分镜TikTok视频、数字人带货、Instagram Live动图、品牌创意短片。
AI视频
Seedance 2.0
Image2
跨境电商
TikTok
视频生成
综合
基于Webcodecs + Vue3实现的Web端剪辑工具
2024-11-19 10:07:35 +0800 CST
view 2318
这是一个基于WebCodecs实现的Web端视频编辑工具,功能类似于剪映Web版。该工具允许用户在线编辑视频,提供了便捷的编辑体验。开源地址为:https://github.com/x007xyz/fly-cut。
视频编辑
Web技术
开源工具
综合
pin.gl是基于WebRTC的屏幕共享工具
2024-11-19 06:38:05 +0800 CST
view 2400
WebRTC是一种开源技术,支持实时音视频通信,允许浏览器和应用程序直接进行P2P连接。pin.gl是基于WebRTC的屏幕共享工具,用户只需输入房间代码即可共享屏幕或摄像头,具有超低延迟和隐私保护的特点,支持多种设备。该工具简单易用,适合现场活动和互动会议,但并不开源。
实时通信
视频技术
网络工具
开源无限时长虚拟人视频生成,1.6K Stars 的 InfiniteTalk 来了
编程
开源无限时长虚拟人视频生成,1.6K Stars 的 InfiniteTalk 来了
2026-04-19 09:44:57 +0800 CST
view 658
InfiniteTalk是美团MeiGen-AI团队开源的音频驱动视频生成框架,基于Wan2.1-14B,支持无限时长生成,嘴唇、头部、身体、表情全同步
开源
AI
视频生成
数字人
Python
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
编程
HunyuanVideo 1.5 深度解析:腾讯 8.3B 参数视频生成模型,消费级显卡的革命性突破
2026-05-09 18:51:15 +0800 CST
view 391
腾讯混元开源 HunyuanVideo 1.5 视频生成模型,8.3B 参数 Diffusion Transformer 架构,14G 显存消费级显卡可运行。SSTA 稀疏注意力机制实现推理速度 1.87 倍提升,3D 因果 VAE 实现空间 16 倍、时间 4 倍压缩。
AI视频生成
腾讯混元
HunyuanVideo
Diffusion Transformer
SSTA
开源模型
消费级显卡
FastRTC:为 Python 开发者打造的实时音视频通信利器
编程
FastRTC:为 Python 开发者打造的实时音视频通信利器
2025-05-15 09:56:44 +0800 CST
view 2069
FastRTC是一个专为Python开发者设计的开源实时通信库,简化了实时音视频应用的开发。它基于WebRTC和WebSocket,支持自动语音检测、UI生成和电话接入等功能。通过简单的API,开发者可以快速构建AI语音助手、实时翻译工具等应用。FastRTC使得实时通信变得更加易用和灵活,适合快速原型开发。
实时通信
Python开发
开源项目
AI技术
音视频应用
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
编程
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
2026-05-16 21:15:15 +0800 CST
view 917
SANA-WM是NVIDIA Lab开源的2.6B参数世界模型视频生成系统,支持1分钟720p视频生成。本文从扩散Transformer底层数学到Flow Matching推理优化,完整解析其Dual-Pathway架构、3D VAE时空压缩、因果注意力掩码等核心技术,并提供完整PyTorch代码示例。
AI视频生成
世界模型
扩散模型
Transformer
Flow Matching
综合
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频
2024-11-19 03:46:15 +0800 CST
view 2653
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频。它结合了Web技术和编程的力量,使得视频制作更加灵活和高效。用户可以利用CSS、Canvas、SVG和WebGL等技术,实时编辑和预览视频效果,并通过API动态生成内容。作为一个开源项目,Remotion提供了丰富的功能和活跃的开发者社区,适合用于制作宣传视频和数据可视化。
前端开发
视频制作
开源工具
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
编程
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
2026-04-21 08:46:51 +0800 CST
view 502
FFmpegFree:Vue3+TypeScript+Go+Wails跨平台桌面工具,支持音视频互转、RTMP/HLS推流、屏幕录制推流、FLV拉流播放、Office转PDF
开源
桌面应用
FFmpeg
音视频
Go
Vue3
Wails
流媒体
RTMP
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
编程
Vision-Agents 深度实战:用Stream构建多模态AI Agent——从实时视频理解到边缘计算低延迟的完全指南(2026)
2026-06-03 15:17:28 +0800 CST
view 296
深入解析 GetStream 开源的 Vision-Agents 框架,从架构设计、视频处理管道、多模态LLM集成、RAG知识库、MCP工具调用到Kubernetes生产部署的完整实战指南
Vision-Agents
GetStream
多模态AI
视频AI
Agent
WebRTC
低延迟
RAG
Seedance 2.0 Skill OS:AI电影制作人的四模态生产流水线,中英日韩多语言支持
编程
Seedance 2.0 Skill OS:AI电影制作人的四模态生产流水线,中英日韩多语言支持
2026-06-25 18:14:15 +0800 CST
view 94
Seedance 2.0 Skill OS:模块化Agent Skill包,让AI像导演一样驾驭Seedance 2.0视频生成。四模态支持(文本/图像/视频/音频),28子技能+57参考文档+114验证用例,中英日韩俄西六语种原生路径,专业电影制作流程(treatment到交付QC),Volcengine/BytePlus/Runway多平台支持。
Seedance 2.0
AI视频生成
开源
Agent Skill
四模态
电影制作
MCP
多语言
前端录屏黑科技:几行 JS 代码实现网页录屏
编程
前端录屏黑科技:几行 JS 代码实现网页录屏
2025-08-15 15:19:33 +0800 CST
view 1195
本文介绍了如何使用MediaRecorderAPI和原生JavaScript实现网页录屏功能。通过简单的几行代码,开发者可以获取用户屏幕流并进行录制,支持音视频捕获。文章详细说明了获取媒体流、创建MediaRecorder实例、开始和停止录制的步骤,并提供了注意事项和最佳实践,强调了浏览器兼容性和用户授权的重要性。
前端开发
Web技术
编程
视频处理
综合
Roop是一款免费开源的AI换脸工具
2024-11-19 08:31:01 +0800 CST
view 2818
Roop是一款免费开源的AI换脸工具,支持图片、视频及直播实时换脸,操作简单,适合创意工作者和普通用户。用户只需上传人脸图片,即可轻松完成换脸。Roop提供批量处理、保持帧率等多种功能,且安装过程简单,支持Windows环境。文章还介绍了报错处理及客户端代码示例,帮助用户更好地使用该工具。
人工智能
开源软件
图像处理
视频编辑
技术教程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 708
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
FFmpeg WebCLI:浏览器中运行完整 FFmpeg,离线处理视频,文件无需上传
编程
FFmpeg WebCLI:浏览器中运行完整 FFmpeg,离线处理视频,文件无需上传
2026-06-13 08:34:10 +0800 CST
view 212
FFmpeg WebCLI基于ffmpeg.wasm构建,通过WebAssembly将完整FFmpeg移植到浏览器中,支持30+操作(GIF/格式转换/压缩/剪辑/滤镜),PWA离线可用,文件全程本地处理无需上传。
FFmpeg
WebAssembly
WebCLI
视频处理
PWA
ffmpeg.wasm
离线工具
GIF制作
格式转换
香港大学开源ViMax多智能体视频生成框架
编程
香港大学开源ViMax多智能体视频生成框架
2026-05-18 06:31:45 +0800 CST
view 639
香港大学HKUDS开源ViMax多智能体视频生成框架,从创意/小说/剧本到完整多镜头视频端到端自动化,支持RAG长文本分析、多机位模拟、一致性校验。
开源项目
AI视频
多智能体
香港大学
Pixelle-Video:阿里开源全自动视频生成,输入一句话串起整条产线,GitHub 2.2万 Star
编程
Pixelle-Video:阿里开源全自动视频生成,输入一句话串起整条产线,GitHub 2.2万 Star
2026-06-13 12:45:50 +0800 CST
view 230
Pixelle-Video是阿里国际AI团队开源的全自动视频生成工具,输入主题自动写文案/生成配图/合成语音/加BGM,支持ComfyUI本地/RunningHub云端/直连API三种配图方案,数字人口播+动作迁移,零成本可选。
Pixelle-Video
阿里开源
视频生成
AI
全自动
ComfyUI
数字人
动作迁移
Streamlit
AIGC
浏览器自动播放策略
编程
浏览器自动播放策略
2024-11-19 08:54:41 +0800 CST
view 2732
随着网络视频和音频内容的普及,浏览器对自动播放实施了不同的策略以改善用户体验。主要策略包括静音播放、用户互动、自动委派和媒体参与度。不同浏览器如Chrome、Firefox、Safari和Edge在自动播放的默认行为上有所不同。设计时需考虑用户体验,避免干扰,并提供控制选项和清晰提示。
浏览器
自动播放
用户体验
网络技术
视频
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
下一页