VOICEVOX:修订间差异

来自Vocawiki
跳转到导航 跳转到搜索
无编辑摘要
 
文字替换 -“{{ACG软件}}”替换为“{{音声合成引擎}}”
 
(未显示另一用户的1个中间版本)
第124行: 第124行:


{{VOICEVOX}}
{{VOICEVOX}}
{{ACG软件}}
{{音声合成引擎}}


== 注释及外部链接 ==
== 注释及外部链接 ==

2025年9月14日 (日) 15:37的最新版本

Vocawiki欢迎您参与完善本条目☆Kira~
欢迎正在阅读这个条目的您协助编辑本条目。编辑前请阅读Wiki入门条目编辑规范,并查找相关资料。Vocawiki祝您在本站度过愉快的时光。
基本资料
软件名 VOICEVOX
其他名字 ボイボ
开发者 ヒホ(ヒロシバ)
操作系统 Windows、Mac、Linux
语言 日语
软件类型 语音合成、歌声合成
首次发布 0.2.0(2021/08/01)
当前版本 0.19.2(2024/05/30)

VOICEVOX是由ヒホ(ヒロシバ)基于深度学习技术开发的开源、免费的文字朗读软件及歌声合成软件。

软件简述

VOICEVOX使用界面

VOICEVOX自称“免费使用的中等品质文字朗读软件·歌声合成软件”(無料で使える中品質なテキスト読み上げソフトウェア・歌声合成ソフトウェア),有着以下特点:

  1. 商业或非商业都能免费使用(具体参照各个角色的使用规约);
  2. 在所有电脑平台都可以使用(Windows、Mac、Linux);
  3. 可以对语调(intonation)等做详细调整;
  4. 歌声合成也有可以调整的GUI(注)图形用户界面

除此之外,软件本体开源(包括编辑器UI、引擎、内核),其他开发者可以按照开源条例使用、开发新的软件或者内嵌至其他软件。

官方简称为「ボイボ」。

系统需求

OS:

  • Windows: Windows 10 / Windows 11
  • Mac: macOS Catalina 或以上
  • Linux: Ubuntu 18.04 / Ubuntu 20.04

GPU: Nvidia

使用

语音合成

VOICEVOX的使用界面说明

在VOICEVOX中,点击界面中角色形象右边带下划线的方框即可输入文本,输入之后下面的调整框便会有片假名注音。点击左下角的播放按钮便可以播放选择的语句。

点击右边的加号可以新增语句,点击角色形象可以更换所选语句的朗读角色。

点击“一つ書く出し”便可将所选语句的音频输出成wav文件。

可以通过右边及下面的调整栏调整所选语句,例如整体的语速或词的读法与断词。

歌声合成

在钢琴卷帘点击即可创建音符,单击即可选择该音符,双击音符可修改发音。(发音只支持输入平假名与片假名)

支持导入MIDI、MusicXML、UST格式文件。

点击“ファイル-音声を出力”即可导出wav文件。

声库

ボイボ寮

某个世界里的不可思议建筑,ボイボ寮。
在这里有着性格各异的住民。

“ボイボ寮”是VOICEVOX官方给出的设定,在设定中是VOICEVOX的角色所居住的地方。目前的住民(实装的角色声库)有31位:


官网的《ボイボ寮の住民たち》页面给出了每位角色的设定资料以及对其他住民的称呼。不过官方也同时表示“ボイボ寮的设定只是制作视频时供参考用的世界观”“不需要严格遵守设定,随意改变也没有问题”。

VOICEVOX Nemo

VOICEVOX Nemo是没有角色形象的声库系列,使用时也无需标记CV名。

Nemo的由来为德语的Nobody。

关于开发者ヒホ

开发者ヒホ(ヒロシバ)本职是Dwango Media Village的工程师。因为头像是Windows7回收站的图标,也有个“垃圾桶头”的外号。他曾使用深度学习技术开发了变声工具《yukarinライブラリ》及变声器《Seiren Voice》。VOICEVOX也同样使用了深度学习技术。

派生软件

虽然是不同的合成引擎,但都使用了VOICEVOX的框架(操作界面),界面颜色不同。

  • COEIROINK

由シロワニさん开发,特点是允许用户自行制作并上传朗读声库。

  • LMROID
  • SHAREVOX

注释及外部链接