PyVideoTrans是一款功能全面的视频翻译配音工具。它专为视频内容创作者设计,能够将视频中的语言翻译成多种语言,并自动生成与之匹配的字幕和配音。这款工具支持包括中文(简繁体)、英语、韩语、日语、俄语、法语、德语、西班牙语等在内的多种语言,适用于广泛的视频内容处理场景。PyVideoTrans不仅具备高效的语音识别能力,能够精准捕捉视频中的对话内容,还拥有强大的文字翻译功能,支持多种主流翻译引擎,确保翻译的准确性和自然度。此外,软件内置高质量的语音合成技术,能将翻译后的文字转换为流畅自然的配音,完美适配视频原声。它还提供了音视频字幕合并、音频分离和视频下载等丰富功能,满足用户在视频制作过程中的多样化需求。
简单易用
我们的目标是为用户提供一个操作简便/解压即用的视频翻译工具,尤其适合技术小白或对技术了解有限的用户。为此,软件在功能实现上尽量简化,比如,虽然 Whisperx 在语音识别和角色区分方面更强,但由于其安装复杂且容易出错,我们选择了更容易使用的方案,确保用户能够轻松上手。
功能多样
除了支持多语言间的视频翻译,软件还集成了语音转录、文字配音和字幕翻译等功能。对于只需要语音转录或配音的用户,也可以单独使用这些功能,无需完整翻译视频,避免了额外下载其他软件的麻烦。
跨平台支持
软件支持多平台,Windows 用户可以直接下载解压使用,而 MacOS 和 Linux 用户可以通过一键安装源码方便快捷地启动。
丰富的第三方接口支持
视频翻译分为语音识别、字幕翻译、文字配音三个阶段,软件在每个阶段都支持多种第三方接口。
例如,语音识别阶段可以选择使用 faster-whisper 或 openai-whisper,也可以选择在线 API 接口或自建的语音识别服务;
字幕翻译阶段支持 Google 翻译、ChatGPT、或本地大模型等方式。
配音阶段也同样灵活,用户可以选择默认的 edgetts 配音,或集成其他 API,例如 OpenAI、ElevenLabs、Azure 等。
每个阶段可支持使用自己的api接口,如果你有自己开发的api服务的话。
高度自定义
软件提供几十项自定义选项,用户可以根据需求调整翻译渠道、配音方式、语音识别引擎、音调、语速、字幕样式(字体、颜色、大小)、视频输出质量等。支持对翻译和配音任务的并发量控制,实现高度个性化的翻译体验。
支持完全离线使用
如果你需要离线处理,软件支持完全本地运行,语音识别可以使用 faster-whisper 或 openai-whisper,配音可以通过 Clone-voice 或 GPT-SoVITS 等工具,无需联网即可完成所有操作。
免费与商业 API 灵活结合
软件默认提供完全免费的方案,所有核心功能均不需要任何费用。语音识别、翻译和配音均有免费选项,如 faster-whisper 和 Edge-TTS。而对于有更高需求的用户,软件同样支持三方商业 API,例如 ChatGPT、Azure 以及其他高级语音合成服务,提供更高质量的翻译和配音。
API 集成支持
软件提供便捷的 API 调用功能,方便开发者将其集成到其他工具或流程中使用。
软件官方项目开源地址 https://github.com/jianchang512/pyvideotrans
https://cn.pyvideotrans.com/
下载地址
为避免压缩包体积过大,预打包版只内置最小模型 tiny和中等模型medium,识别效果不佳
效果更好的模型请点击下载 https://github.com/jianchang512/stt/releases/tag/0.0
下载后解压,将压缩包内的”models–Systran–faster-xx”文件夹复制到models目录内
解压复制后 models 目录下,另外models目录直接复制到软件里面替换即可
城通网盘:https://url95.ctfile.com/d/22064395-63394966-6d5088?p=YPOJIE (访问密码:YPOJIE)
百度网盘:https://pan.baidu.com/s/1Gm9kEJkgadLyXYq7qdTBaw?pwd=yvba 提取码: yvba
Github:https://github.com/jianchang512/pyvideotrans/releases