Shotcut 25.10 版本新增本地 AI、HTML 和原生录制功能。

  • 使用 KokoroDoki 实现本地文本转语音,并通过 Docker 支持 CPU/GPU。
  • HTML 生成器和“打字机”滤镜,带有预设、透明度和 15 FPS 限制。
  • 使用原生环境(FFmpeg、GNOME、Spectacle 或 OBS)进行屏幕录制。
  • 更新至 FFmpeg 8,改进了库并修复了几个关键问题。

切入点25.10

Linux桌面上最知名的开源视频编辑器 他又采取了行动。. 切入点25.10 它已经面世,并配备了许多直接针对生产力的功能:本地人工智能、用于生成时尚标题的 HTML 生成器,以及无需依赖外部实用程序的本地屏幕录制功能。

经过一段时间的测试,稳定版本的发布证实了该项目正按照其路线图稳步推进。 最引人注目的创新是文本转语音(TTS)技术。 新增了注释和字幕功能,以及打字机滤镜、HTML图像/视频生成器和FFmpeg 8更新,此外还有一系列修复和兼容性改进。

概述:Shotcut 25.10 版本有哪些变化

该团队近期一直在整合人工智能功能:首先是与 Whisper(语音转文本)合作推出的转录功能,现在又完成了这一循环。 集成式本地文本转语音这种组合为旁白、字幕制作和内容访问提供了非常强大的工作流程,无需离开编辑器即可完成。

除了人工智能之外,本期节目还引入了…… HTML支持的创意工具 并新增了社区要求的功能,例如跨平台屏幕录制。此次发布还通过更新 FFmpeg 8 和关键库,增强了技术基础。

Shotcut 25.10 为注释和字幕引入了本地文本转语音功能

Shotcut 中 TTS 的实现依赖于 KokoroDoki 和 Kokoro 82M 型号这是一个开源的实时语音合成引擎。值得注意的是,25.07 版本整合了一个模型…… 语音到文本最显著的特点是所有操作都在您的计算机上进行:无需传输到云端,因此可以保证隐私和项目控制权。

为了加快处理速度, KokoroDoki 可以使用支持 CUDA 的 NVIDIA CPU 或 GPU。在配备兼容显卡的机器上,你会注意到生成时间大大缩短,这在处理大量字幕或准备较长的配音时非常有用。

就语音方面而言,目前的语音包在英语方面更加完善。 美式英语有二十多种不同的语体。英国版提供约八种语言,其他语言的覆盖范围目前较为有限。预计未来版本将扩大语言范围,但目前英文版的内容已足以满足模型、原型和最终项目的需求。

需要注意一个技术细节: 集成是通过 Docker 实现的。与其他功能相比,这增加了一个额外的设置步骤,尤其对于之前从未接触过容器的用户而言。虽然这并非不可克服的障碍,但还是值得花几分钟时间进行一些微调。

Shotcut 25.10,由 HTML 和打字机效果生成

创造力的扩展离不开两个相辅相成的贡献:一个新的 “从 HTML 生成图像/视频” 以及模拟打字机的文字特效。其思路很明确:将浏览器功能引入时间轴,无需任何特殊插件即可生成带有透明背景的标题、说明文字和动画。

HTML生成器创建 默认情况下,图像或视频片段带有透明度。为了保证视频流畅,生成的视频帧率限制为每秒 15 帧,这个帧率足以满足图形和叠加层的需求,避免出现瓶颈。效果立竿见影。 它会在 Origin 查看器中自动打开。 以及它的 HTML 代码,因此您可以随时查看或调整代码。

“文本:打字机”效果包含可直接使用的预设以及其他可供自定义的预设。其中包含的配置文件有: 3D图像、弹性笔触、折叠、金色金属 o 晚会时间这些工具涵盖了从专业的图像处理到趣味十足的视频动画等各种功能。如果您熟悉 CSS 和 JS,您将有机会创作出非常优秀的作品。

  • 与...的兼容性 代码编译自 CodePen非常适合重复利用你已有的素材和设计。
  • 渲染限制为 15 FPS 保证稳定性 在基于浏览器的生成中。
  • 创意可能性 透明背景 没有复杂的成分。

原生和跨平台屏幕录制

又一个经典的社区请求终于来了: 集成屏幕录制具体实现方式因环境而异,但所有情况下都力求采用最可靠的原生后端,以减少摩擦。

  • X11- 使用 FFmpeg 作为主要后端。
  • Wayland(GNOME):与原生捕获/屏幕录制工具集成。
  • KDE等离子:支持 Spectacle 进行画面捕捉。
  • 替代如果以上情况均不存在,则诉诸于…… OBS工作室 作为一张王牌。

这样在大多数情况下可以避免安装额外的实用程序,而且 统一工作流程您可以在同一个应用程序中完成录制、编辑和导出所有操作。对于教程、软件评测或培训课程的创作者来说,这项改进从第一天起就能明显感受到。

Shotcut 25.10 更新了多媒体引擎:FFmpeg 8 和库

底层也有变化。应用程序切换到 ffmpeg 8这意味着编码/解码性能的提升、新增的滤镜以及与现代格式更广泛的兼容性。在实际应用中,这意味着导出效果更加稳定,复杂项目的播放也更加流畅。

一些关键组件也在进行更新,例如 SVT-AV1、libaom、dav1d、libvpx、libwebp y 耳语.cpp这些组件会影响 AV1、VP9、WebP 编解码器或 AI 转录本身,从而形成更强大的工作流程。

Shotcut 25.10 界面和工作流程改进

细节决定成败:这些选项现在可以在“属性”面板中使用。 “以……开启”和“充电”当您需要刷新外部编辑的媒体或使用系统应用程序快速启动它时,这些都是适度但实用的更改。

“从 HTML 生成图像/视频” 它与“文本:打字机”过滤器共存,因此您可以 将 HTML 生成合并到时间线之外 (作为媒体素材)将打字机动画应用于已插入的视频片段。根据具体使用场景,可实现完全的灵活性。

Shotcut 25.10 错误修复和稳定性改进

此次发布修复了之前报告的几个恼人问题,类似于…… 更新25.08。 例如, 当名称或路径包含 & 符号时,导出失败。在共享项目中,这是一个比看起来更常见的问题。

它还解决了一个问题 Linux 系统上启动 AppImage 时出现问题 安装 AppImageLauncher 时出现此问题,并且已修复。 《富文本》中的高级关键帧 他们的行为并不恰当。最后, 解码 Ut 视频时 alpha 通道出错对于那些在专业流程中以透明方式工作的人来说,这一点至关重要。

安装和兼容性

为了让Linux用户的生活更轻松,该项目分发了一个 通用应用映像 您可以下载并运行它,无需安装任何依赖项。实际上,只需赋予它执行权限即可。

兼容性方面,已确认支持 Ubuntu 22.04 LTS 上的 glibc 2.35因此,该 LTS 版本包含在内。任何现代发行版均适用。 内核版本高于 5.10 应该会很顺利,但在较旧的系统上,您可能需要调整库。

使用案例:从创作者到教育者和开发者

对于那些在社交媒体或 YouTube 上创作内容的人来说,这套方案堪称完美。 无需离开编辑器即可录制屏幕。您可以应用时尚的文字特效,并生成合成语音用于介绍、解释或行动号召,而无需为每次更改配音。

  • 影片教学:集成录音 + TTS 动态节奏注释。
  • Presentaciones无需付费插件即可获得专业动画标题。
  • 无障碍结合 Whisper(语音转文本)和 TTS,可以改善字幕和旁白效果。

在教育和培训领域,其价值显而易见: 录播课程、视频教程 以及配有本地化标签和配音的辅助材料。多种英语配音模式可根据受众调整语气。

  • 软件演示无需依赖外部工具即可捕获原生应用程序。
  • 可视化文档带有技术注释和易读文字说明的视频。
  • 接口测试记录和审查工作流程,以便快速获得反馈。

与先前版本快速比较

与之前的版本相比,改进幅度很大。 本地录音 它消除了大多数桌面系统对额外解决方案的需求,而 HTML+打字机组合则为标题和下方三分之一字幕提供了更多选择。

  • 集成录音 无需通过 OBS(除非在其他特殊情况下)。
  • 高级文字效果 支持HTML/CSS和高质量预设。
  • 文字转语音 用于在 Shotcut 内部添加注释和字幕。
  • ffmpeg 8 为了获得更好的性能和最新的格式。
  • 增强稳定性 修复了常见极端情况。

要求和推荐配置

为了保证一切顺利进行,最好组建一支平衡的团队。 配备 8 GB 内存,你可以工作但如果你从事中型/大型项目,你会很感激拥有 16 GB 的存储空间。

  • 中央处理器:至少需要 4 个核心用于特效和宽松编码。
  • 内存最低 8 GB,建议 16 GB。
  • GPU:兼容 OpenGL 3.3+;如果您使用 CUDA,它将使用 KokoroDoki 加速 TTS。
  • 存储SSD 用于媒体和缓存,尤其是在使用大量编解码器的项目中。

在项目设置中,这是一个好主意 匹配帧率和分辨率 为避免不必要的缩放,请将图像传输到最终目的地。维护代理并优化预览可以防止在添加滤镜和多个轨道时出现延迟。

使用 HTML、CodePen 和打字机的工作流程

如果你真的想充分发挥HTML生成器的作用, 你可以在编辑器或 CodePen 上进行设计。将资源编译/打包并粘贴到 Shotcut 模板中。这样可以确保字体、样式和脚本无需外部调用即可解析。

对于文本动画,交替使用 筛选“文本:打字机” 外部生成:如果您想要速度和轻量级的东西,过滤器可以帮您摆脱困境;如果您需要复杂的效果,HTML 流程将为您提供更多控制(和原生透明度)。

关于性能、隐私和限制的说明

本地化的TTS方案有两个主要优势: 保护您的内容 它避免了延迟和在线服务费用。但作为回报,它需要 Docker 配置,并且为了获得最佳速度,需要配备支持 CUDA 的 NVIDIA GPU。

极限 HTML 生成速度为 15 FPS 这并非一时兴起:当浏览器引擎生成带有透明度和图层的视频或图像时,它可以稳定渲染。实际上,对于标题、过渡效果和叠加层来说,它已经绰绰有余了。

小细节成就大不同

选择 属性中的“打开方式” 它可以加快在外部工具中编辑片段的速度,并且能够返回编辑而不会丢失之前的思路,同时 “充电” 如果磁盘上的文件发生更改,它可以强制更新媒体文件。这两个快捷键,再加上可以自动打开 HTML 生成内容的源文件查看器,让日常任务变得更加轻松。

总数是 FFmpeg 8 和改进后的库 这也意味着安心:导入/导出时更少出现意外,更好地处理 AV1 等最新格式,以及更精细的解码。

从早期版本升级的用户会发现一个编辑器, 它成熟了,却没有失去其本质。它免费、跨平台,并且其技术设计选择有利于本地开发。感觉这个项目正在关键领域全力以赴:性能、实用的人工智能以及学习曲线平缓的创意工具。

切入点25.05
相关文章:
Shotcut 25.05 在将 Qt 升级到 6.8.3 版本的同时增加了 HDR 改进