程序员茄子
全部
编程
代码
资讯
案例
综合
联系我们
html在线编辑
登录注册
AI,自己全程接管维护
php
mysql
shell
go
vue
css
api接口对接
支付接口对接
最新
最热
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
编程
SANA-WM 深度解析:2.6B 参数开源世界模型如何颠覆视频生成——从扩散Transformer到1分钟720p实时渲染的完整技术架构
2026-05-16 21:15:15 +0800 CST
view 189
SANA-WM是NVIDIA Lab开源的2.6B参数世界模型视频生成系统,支持1分钟720p视频生成。本文从扩散Transformer底层数学到Flow Matching推理优化,完整解析其Dual-Pathway架构、3D VAE时空压缩、因果注意力掩码等核心技术,并提供完整PyTorch代码示例。
AI视频生成
世界模型
扩散模型
Transformer
Flow Matching
综合
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频
2024-11-19 03:46:15 +0800 CST
view 2480
Remotion是一个基于React的框架,允许前端工程师以编程方式创建高质量视频。它结合了Web技术和编程的力量,使得视频制作更加灵活和高效。用户可以利用CSS、Canvas、SVG和WebGL等技术,实时编辑和预览视频效果,并通过API动态生成内容。作为一个开源项目,Remotion提供了丰富的功能和活跃的开发者社区,适合用于制作宣传视频和数据可视化。
前端开发
视频制作
开源工具
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
编程
一款开源桌面音视频转换工具,支持RTMP/HLS推流+屏幕录制+FLV拉流
2026-04-21 08:46:51 +0800 CST
view 211
FFmpegFree:Vue3+TypeScript+Go+Wails跨平台桌面工具,支持音视频互转、RTMP/HLS推流、屏幕录制推流、FLV拉流播放、Office转PDF
开源
桌面应用
FFmpeg
音视频
Go
Vue3
Wails
流媒体
RTMP
前端录屏黑科技:几行 JS 代码实现网页录屏
编程
前端录屏黑科技:几行 JS 代码实现网页录屏
2025-08-15 15:19:33 +0800 CST
view 1004
本文介绍了如何使用MediaRecorderAPI和原生JavaScript实现网页录屏功能。通过简单的几行代码,开发者可以获取用户屏幕流并进行录制,支持音视频捕获。文章详细说明了获取媒体流、创建MediaRecorder实例、开始和停止录制的步骤,并提供了注意事项和最佳实践,强调了浏览器兼容性和用户授权的重要性。
前端开发
Web技术
编程
视频处理
综合
Roop是一款免费开源的AI换脸工具
2024-11-19 08:31:01 +0800 CST
view 2655
Roop是一款免费开源的AI换脸工具,支持图片、视频及直播实时换脸,操作简单,适合创意工作者和普通用户。用户只需上传人脸图片,即可轻松完成换脸。Roop提供批量处理、保持帧率等多种功能,且安装过程简单,支持Windows环境。文章还介绍了报错处理及客户端代码示例,帮助用户更好地使用该工具。
人工智能
开源软件
图像处理
视频编辑
技术教程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
编程
Helios深度解析:北大袁粒团队如何用14B参数重塑实时视频生成——从架构革命到工程落地的全解
2026-04-13 05:23:52 +0800 CST
view 369
深入解析北京大学袁粒团队发布的Helios 14B实时长视频生成模型,涵盖三阶段训练流程、统一历史注入、金字塔预测校正器、对抗层次蒸馏等核心技术创新,以及完整部署实战指南
视频生成
Helios
扩散模型
深度学习
实时推理
PyTorch
HuggingFace
香港大学开源ViMax多智能体视频生成框架
编程
香港大学开源ViMax多智能体视频生成框架
2026-05-18 06:31:45 +0800 CST
view 24
香港大学HKUDS开源ViMax多智能体视频生成框架,从创意/小说/剧本到完整多镜头视频端到端自动化,支持RAG长文本分析、多机位模拟、一致性校验。
开源项目
AI视频
多智能体
香港大学
浏览器自动播放策略
编程
浏览器自动播放策略
2024-11-19 08:54:41 +0800 CST
view 2562
随着网络视频和音频内容的普及,浏览器对自动播放实施了不同的策略以改善用户体验。主要策略包括静音播放、用户互动、自动委派和媒体参与度。不同浏览器如Chrome、Firefox、Safari和Edge在自动播放的默认行为上有所不同。设计时需考虑用户体验,避免干扰,并提供控制选项和清晰提示。
浏览器
自动播放
用户体验
网络技术
视频
AI 直播工具:Deep Live Cam 实时换脸效果超乎想象!附安装教程
综合
AI 直播工具:Deep Live Cam 实时换脸效果超乎想象!附安装教程
2024-11-19 08:13:10 +0800 CST
view 4594
DeepLiveCam是一款实时AI换脸工具,支持Windows和Mac,用户只需一张图片即可实现面部替换和视频深度伪造。该工具在GitHub上开源,提供简单的安装步骤,包括GPU和CPU部署方式。用户可以通过一键安装包或源码部署来使用,支持多种操作系统。文中还包含了常见问题的解决方案。
AI工具
深度伪造
开源软件
视频处理
美团开源InfiniteTalk:一张照片生成无限时长AI视频,口型动作完美同步
编程
美团开源InfiniteTalk:一张照片生成无限时长AI视频,口型动作完美同步
2026-04-23 15:49:52 +0800 CST
view 375
美团MeiGen-AI团队开源InfiniteTalk:一张照片+一段音频生成无限时长数字人视频,口型/头部/表情/身体全同步,GitHub 1.6K Stars,HuggingFace月下载6.4万次,完全本地运行隐私安全。
InfiniteTalk
数字人
美团开源
AI视频
无限时长
Wan2.1
MTools:免费开源的本地 AI 工具集,一个顶好几个
编程
MTools:免费开源的本地 AI 工具集,一个顶好几个
2026-05-13 17:55:20 +0800 CST
view 85
MTools是一款完全本地运行的开源AI工具集,集成抠图、证件照制作、人声分离、音频转文字、视频插帧、超分辨率等功能,保护隐私且不限次数使用。
AI工具
本地运行
开源软件
图像处理
音频处理
视频处理
人声分离
抠图工具
综合
MiroTalkC2C是一个基于WebRTC的免费实时视频通话和屏幕共享平台,支持端到端加密,保障用户通信安全
2024-11-19 02:36:33 +0800 CST
view 1815
MiroTalkC2C是一个基于WebRTC的免费实时视频通话和屏幕共享平台,支持端到端加密,保障用户通信安全。用户无需下载或插件,只需一键即可开始通话。平台提供即时消息功能,适用于在线教育、远程医疗、客户服务等场景,灵活性和可扩展性使其成为各种规模企业的理想选择。
通信
开源项目
视频会议
安全
在线服务
Video.js:视频播放的全能解决方案
综合
Video.js:视频播放的全能解决方案
2024-11-18 23:37:03 +0800 CST
view 1229
Video.js是一个强大且灵活的HTML5视频播放器,支持多种视频格式和流媒体协议,适用于视频分享平台、直播应用和教育培训平台。它易于定制,拥有丰富的插件生态,能够满足各种视频播放需求。通过简单的代码引入和初始化,开发者可以快速上手并实现高质量的视频播放体验。
多媒体
网页开发
视频技术
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
编程
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率
2024-11-19 08:26:56 +0800 CST
view 2191
Pion是WebRTCAPI的纯Golang实现,提升了WebRTC应用开发效率。它提供简单易用的API,支持多种创意项目,如视频同步观看、嵌入式设备摄像头传输、数据安全传输等。Pion实现了完整的PeerConnectionAPI,支持多种媒体格式和加密算法,适用于多个操作系统和架构。示例代码展示了如何使用Pion发送视频文件到浏览器。
WebRTC
Golang
视频处理
网络通信
实时应用
HLS视频下载神器:Python实现加密流媒体一键下载与合并
代码
HLS视频下载神器:Python实现加密流媒体一键下载与合并
2025-08-30 19:21:22 +0800 CST
view 1293
本文介绍了一款基于Python的HLS视频下载工具,支持加密流和并行下载,能够自动合并视频片段。工具的设计包括M3U8解析、AES解密和FFmpeg集成,适用于保存在线教育课程、会议录像等流媒体视频。提供了详细的代码实现和使用教程,帮助用户理解HLS协议和视频处理技术。
视频下载
编程
流媒体
技术教程
Python
FFmpeg 编译使用 ffmpeg-gl-transition 以丰富视频特效
综合
FFmpeg 编译使用 ffmpeg-gl-transition 以丰富视频特效
2024-11-19 05:45:47 +0800 CST
view 2452
本文介绍如何在Mac系统上编译支持GLTransitions的FFmpeg,包括安装依赖库、下载源代码、修改代码和编译步骤。通过集成GLTransitions,用户可以在视频中添加炫酷的转场效果。文中详细描述了从源码编译GLEW和GLFW3的过程,以及如何配置和使用gltransition过滤器。
多媒体处理
视频编辑
开源软件
编程
技术文档
告别Pr/AE!用FFCreator这个Node.js神器,编程式自动化批量生成视频
编程
告别Pr/AE!用FFCreator这个Node.js神器,编程式自动化批量生成视频
2025-09-01 06:59:10 +0800 CST
view 795
FFCreator是一个基于Node.js的视频处理库,旨在通过程序化方式自动化批量生成高质量视频。它将视频制作简化为简单的API调用,支持多种元素(图片、视频、音频、文本)的组合,内置丰富的动画效果和高级功能,如文本转语音和虚拟主播,适合电商、新媒体和在线教育等场景。
视频制作
自动化工具
编程
Node.js
多媒体
综合
Plyr.js 播放器介绍
2024-11-18 12:39:35 +0800 CST
view 2110
Plyr.js是一款极简、可定制的HTML5播放器,支持视频和音频,具有响应式设计和丰富的API。用户可以通过CDN或npm/yarn安装,并轻松初始化播放器。Plyr.js还支持音量控制等自定义选项,适合开发者集成音视频播放功能。更多信息请访问Plyr.js官方网站。
播放器
前端开发
音视频技术
如何在Vue3中使用视频库Video.js实现视频播放?
编程
如何在Vue3中使用视频库Video.js实现视频播放?
2024-11-19 07:27:29 +0800 CST
view 2265
本文介绍了如何在Vue3项目中集成Video.js视频播放器,详细步骤包括创建Vue3项目、安装Video.js、创建VideoPlayer组件以及使用该组件。通过代码示例,读者可以学习如何实现基本的视频播放功能,并了解如何扩展Video.js的功能,如自定义控制栏等。
前端开发
视频播放
Vue.js
技术教程
CutClaw 深度解析:开源 AI 智能剪辑师如何"听懂"音乐并剪出电影感大片——多智能体协作的音乐驱动视频剪辑革命
编程
CutClaw 深度解析:开源 AI 智能剪辑师如何"听懂"音乐并剪出电影感大片——多智能体协作的音乐驱动视频剪辑革命
2026-04-16 08:48:53 +0800 CST
view 515
深度解析开源项目CutClaw的技术架构、多智能体协作机制、音乐驱动剪辑原理。由大湾区大学GVC实验室和北京交通大学团队联合腾讯ARC实验室开源,能将几小时素材自动剪成电影感大片。
CutClaw
AI剪辑
开源
视频剪辑
多智能体
音乐驱动
智能剪辑师
EchoChat:Go语言音视频会议直播系统,控制面与媒体面分离架构设计
编程
EchoChat:Go语言音视频会议直播系统,控制面与媒体面分离架构设计
2026-05-14 08:41:45 +0800 CST
view 65
EchoChat是基于Go语言开发的实时音视频会议直播系统,控制面与媒体面分离架构,Go处理信令+mediasoup C++ SFU转发媒体流,uniapp多端适配,支持即时聊天、多人会议、互动直播。
音视频
开源项目
Go
mediasoup
SFU
直播
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
编程
RedditVideoMakerBot 深度解析:一个帖子链接,如何变成一条成品视频?
2026-04-16 16:42:03 +0800 CST
view 254
RedditVideoMakerBot 是一个将 Reddit 帖子链接自动制作成视频的开源工具,支持语音合成、自动配图、字幕生成和背景音乐。
Reddit
视频自动化
Python
MoviePy
PRAW
内容创作
开源工具
AI漫剧运镜万能提示词完全指南:如何用文字实现电影级镜头感
资讯
AI漫剧运镜万能提示词完全指南:如何用文字实现电影级镜头感
2026-04-27 06:07:58 +0800 CST
view 226
系统梳理AI漫剧运镜万能提示词词库,涵盖万能结构公式、镜头类型、景别切换、光影氛围、音频设计、场景化模板、高阶控制指令等完整体系,让创作者复制粘贴就能用。
AI视频
运镜
提示词
漫剧创作
social-auto-upload 深度解析:11K Stars 的 Python 脚本,一键发布视频到抖音/快手/视频号
编程
social-auto-upload 深度解析:11K Stars 的 Python 脚本,一键发布视频到抖音/快手/视频号
2026-05-15 10:08:49 +0800 CST
view 77
深入解析 11K Stars 的 social-auto-upload:基于 Playwright 的 Python 自动化脚本,一键发布视频到抖音、快手、视频号、小红书、B站、TikTok 等平台,支持多账号矩阵管理、定时发布、批量上传,自媒体效率神器。
social-auto-upload
抖音
视频号
Python自动化
自媒体工具
Playwright
大家都在搜索什么?
devops
易支付
一个官网+多少钱
统一接受回调
统一回调
sub
node
宝塔日志
mysql
shell
ElasticSearch
css
vue
api接口对接
2025
支付接口对接
go
php
php回调
回调
上一页
1
2
3
下一页