テキスト読み上げ&台本から一括音声作成ソフト
ScenarioVoiceは、字幕ファイルから音声(wav)を作成するアプリケーションです。
主に動画編集で音声を付けたい方やオーディオブックを作りたい方、テキスト文章や長文を読み上げたい方向けのアプリです。
バージョン毎に追加した機能を以下に示します。
バージョン | 追加機能 |
---|---|
1.0 | 新規作成 |
1.1 | 音声合成の各設定値(話速など)の初期設定を行える機能追加 |
1.2 | ゆっくりボイスの音程変更機能追加 |
1.3 | 音量調整機能追加 / テキスト読み上げに対応 |
1.4 | 音声プリセット機能追加 |
1.5 | フリーテキスト読み込みに対応、連続再生機能追加 |
1.6 | 連続再生機能修正、wavファイル結合機能追加 |
1.6.1 | 字幕一覧とテキスト読み上げ画面をカスタマイズ可能に修正 |
1.7 | エコー機能追加 |
1.8 | ゆっくりボイスの音声記号変換機能追加 |
1.9 | 音声合成速度アップ対応 |
2.0 | アクセント・イントネーション編集機能追加 |
2.1 | 文章の読み修正機能、句読点の長さ調整機能追加 |
2.2 | AquesTalkの音声記号編集画面を追加 |
2.3 | 字幕読み込み機能にアクセント変更機能を追加 / プロジェクトファイル保存・読み込み機能追加 |
2.4 | テキスト読み上げ機能に無音時間編集機能を追加 |
2.5 | ログ出力機能追加 / 一括音声作成後、総再生時間表示機能追加 |
2.6 | srt出力機能、srt解析機能追加 / 無音時間一括設定機能を追加 / 字幕一覧に無音時間編集機能を追加 |
2.7 | 長文合成時のバグ修正 / VOICEVOX辞書編集時のバグ修正 / お問合せフォーム追加 |
2.8 | VOICEVOXプロジェクトファイル読み込み機能追加 / VOICEVOXの母音、子音編集機能追加 イントネーションの調整可能範囲修正 / 字幕一覧に追加・削除メニュー追加 / 字幕一覧に保存フォルダ削除機能追加 |
・音声ファイル、字幕ファイルを作りゆっくりムービーメーカー、AviUtlなどの動画編集ソフトと連携したい。
・YouTubeなどの動画にあてる音声を作りたい。
・大量のテキストから一気に音声を作りたい。
・長文のテキストを読み上げたい。
・テキストから文章を読み上げたい。
・srt字幕ファイル、ゆっくりムービーメーカーの台本(csv)、VOICEVOXテキスト、フリーテキスト、プロジェクトファイル、VOICEVOXプロジェクトファイル読み込みに対応。
・音声と字幕テキストが完全同期するsrtファイルを作成可能。
・VOICEVOX系全ての音声作成に対応。
・ゆっくりボイスの音声作成に対応。
・VOICEVOXの音声を作成できます。
・AquesTalk1の合成音声を作成できます。
・ゆっくりムービーメーカー、AviUtl、PowerDirectorとの音声、字幕の連携に対応。
・読み込んだファイルを各形式で出力可能(csv、VOICEVOXテキスト、srtファイル、プロジェクトファイル)。
対応OS | Windows 10/11 |
---|---|
.NetFramework | 4.7.2以降 |
字幕フォーマット | 読み出しは自動判別、書き出しはUTF-8 |
事前準備 | VOICEVOXのインストールが必要 |
本ソフトは、(株)アクエストの音声合成ライブラリAquesTalkを使用しており、著作権は同社に帰属します。
営利目的での使用は当該ライブラリの使用ライセンスが必要です。
AquesTalk1:女性1
AquesTalk1:女性2
VOICEVOX:ずんだもん
VOICEVOX:四国めたん
srt、csv、txt、xml、vvprojの5種類のファイル形式から一気に複数のwavファイルを作成する時に利用します。
(0) VOICEVOXを起動しておきます。
(1) アプリを起動します。
(2) 字幕ファイルを選択します。
(右下のプルダウンからsrt字幕ファイル、YMM台本、VOICEVOXテキスト、フリーテキスト、プロジェクトファイル、VOICEVOXプロジェクトファイル形式を選択できます。)
(3) 音声保存先を選択します。
(4) 音声を選択します。(srt、フリーテキストの場合)
(5) ゆっくりムービーメーカー等へ音声と一緒に字幕ファイルを連携したい場合は、「字幕ファイル出力」をチェックします。
(6) 次へをクリックします。
(7) 字幕一覧画面が表示されます。
(8) 全て合成をクリックすると、音声ファイルと字幕ファイルが出力されます。
(9) 合成した音声を連続再生したいは、Playをクリックします。
(10) 合成した音声を結合したい場合は、wav結合をクリックします。
(11) 編集したい場合は、テキストをダブルクリックします。
音声パラメータや声、字幕等を修正して問題ないようなら保存をクリックします。
(12) アクセントを変更したい場合は、アクセント変更をクリックして各パラメータを編集します。
(13) テキストを削除・追加を行いたい時は、リストを右クリックしてメニューから行えます。
(14) 編集した字幕ファイルを出力する場合は、字幕出力をクリックします。4種類から保存方法を選択できます。
テキスト文章を読み上げる時に利用します。
(0) VOICEVOXを起動しておきます。
(1) アプリを起動します。
(2) テキスト読み上げを選択します。
(3) 字幕を入力、音声やその他情報をカスタマイズして、音声合成をクリックします。
(4) 再生ボタンをクリックすると読み上げます。
(5) ゆっくりボイス(AquesTalk)やVOICEVOXのアクセントを変更したい場合は、アクセント変更をクリックします。
ゆっくりボイス(AquesTalk)の場合
VOICEVOXの場合
(6) アクセントに変更を加えて再生ボタンで確認後問題なければ設定ボタンを押します。
(7) テキスト読み上げ画面で音声合成を行い再生ボタンをクリックすると、編集した音声を読み上げます。
※VOICEVOX系は、500文字まで、AquesTalkは1000文字までの文字数制限があります。
※辞書機能は、本アプリでは搭載していませんが、VOICEVOXの辞書機能をご利用ください。VOICEVOXの辞書を元に音声を変換しています。
※音声は、ScenarioVoice.exeと同一階層にあるwavフォルダに保存されます。
※音声保存先を変更したい場合は、設定⇒その他から変更可能です。
※字幕テキストを一緒に出力したい場合は、設定⇒その他から変更可能です。
srt出力方法について説明します。
このsrt出力機能は、VOICEVOXやAquesTalkの音声と字幕のタイミングが完全一致する形で出力可能になります。
(1) 字幕読み込みを行い字幕一覧を表示します。
一括で無音時間を設定したい場合、左上の詳細設定メニューから出来ます。
(2) 各種パラメータや無音時間を調整しておきます。
(3) srt解析をクリックします。
(4) srt解析が完了します。
(5) 字幕出力をクリックしてsrtファイルを選択し出力ボタンをクリックします。
(6) outputフォルダを確認するとsrtファイルが出力されます。
中身を確認すると以下の様になっています。
このsrtファイルは無音時間を考慮した形になっていますので、ご安心ください。
無音時間を前後に追加するとその無音部分は動画にするとテキストが表示されず、音声と字幕テキストが完全一致する仕様です。
(1) csvファイルで台本を作成。
(2) ScenarioVoiceの字幕読み込み機能でcsv読み込み。
(3) 全て合成を実行して音声合成。その後、連続再生で音声を確認する。
(4) 気になる音声について音程、音量等のパラメータの修正やアクセント変更で読みやアクセントを修正する。
(5) 全て合成を実行して音声合成。その後、連続再生で音声を確認する。
(6) 字幕出力機能でプロジェクトファイルとして保存を行う。
(7) ゆっくりムービーメーカーやAviUtlと連携して動画制作を行う。
※プロジェクトファイルで保存を行うと字幕テキストや様々な音声パラメータ、アクセント等をまとめて保存して後から読み込みできます。一度プロジェクトファイルを作っておけば後から同じ音声パラメータを基にwavファイルの作成が可能になります。
(1) 設定⇒音声プリセットを選択。
(2) 音声プリセット一覧が表示されます。
(3) 新規追加をクリック。
(4) 各種設定を行い、保存をクリックします。
(5) 編集したい時は、一覧から選択してダブルクリックします。削除する場合は、一覧から選択して削除をクリック。
(6) 設定をクリックして適用します。
※設定された内容は、字幕読み込み、テキスト読み上げの音声に適用されます。
また、csv読み込み時にプリセットの内容を自動で適用することができます。
以下を参考にしてください。
csvを以下の様に設定します。
音声プリセットを以下の様に設定します。(プリセットの名前とcsvの名前を合わせておきます。)
csvを読み込みます。(ここで読み込んだ内容は、音声プリセットの値が自動的に適用されます。話速、音量など)
全て合成を行いwavと字幕ファイルを出力します。(ファイル名にプリセットで指定した名前が設定されます、)
(1) VOICEVOXやAquestalkの長文を読み上げたい場合は、字幕読み込みのフリーテキスト読み込みをご利用ください。その後、必要に応じてwavファイルを結合して1つの音声ファイルとします。
(2) 青空文庫を読み上げたい場合は、テキストエディタで正規表現を使ってテキストを変換後、字幕読み込みのフリーテキスト読み込みをご利用ください。(正規表現は、変換文字:"|?([一-龠]+)《(.+?)》"、置換文字列:"\2")
csvの書き方について説明します。
csvは、以下の様に1列目に話者、2列目にテキストを記述します。
AquesTalk(女性1),こんにちは霊夢だよ
この1列名の話者名は、音声プリセットの名前を割り当てるか、もしくは以下の様にします。
AquesTalk(女性1)/AquesTalk(女性2)/四国めたん(ノーマル)/ずんだもん(ノーマル)
AquesTalkの場合は、AquesTalk(キャラクター)、VOICEVOXの場合は、キャラクター(スタイル)です。
辞書機能は、本アプリでは搭載しておりませんが、VOICEVOXの辞書機能を使って変換しております。
主に英単語を読み上げたい方は、VOICEVOXの辞書機能をご利用ください。
稀に辞書に登録した単語で読み上げられないことがあります。その場合は、単語優先度を見直してください。
(1) 監視フォルダ、ファイル名、レイヤーを設定しておきます。また、カスタムボイスを有効にします。
(2) 追加してシークを選択しておきます。
(3) ScenarioVoiceから全て合成をクリック。(事前に「字幕ファイル出力」にチェックを入れておく必要があります。)
※テキスト読み上げ機能を利用する場合は、一つずつ音声と字幕を設定することができます。
(音声保存先や字幕ファイル出力設定を設定メニューのその他から設定しておく必要があります。)
(4) 指定したレイヤーに音声と字幕が設定されます。
(1) AviUtlとかんしくん(PSDToolKit)とL-SMASH Worksをダウンロードします。
(2) AviUtlとPSDToolKitは、解凍したら同一フォルダへファイルをまとめてインストール完了です。
(3) L-SMASH Worksは、aviutl.exeと同一階層にPluginsフォルダを作りそこへlwcolor.auc、lwdumper.auf、lwinput.aui、lwmuxer.aufを配置します。また、AviUtlを開きファイル⇒環境設定⇒入力プラグイン優先度設定を開きL-SMASH Worksの優先度をWave File Readerより上にします。
(4) aviutl.exeを実行してAviUtlの設定⇒拡張編集の設定をクリック。
(5) 拡張編集画面で右クリック⇒新規プロジェクト作成をクリック⇒OKをクリック。
(6) AviUtlのかんしくんフォルダ内のsetting.txt-templateの名前をsetting.txtに変更する。
(7) [[rule]] セクションを以下の様に編集する。(以下は一例です。必要に応じて編集してください。)
[[rule]]
encoding = 'utf8'
file = '*.wav'
layer = 1
modifier = '''
filename = os.date("%y%m%d_%H%M%S") .. "_女性1_" .. tofilename(text, 10) .. ".wav"
'''
(8) かんしくんフォルダのforcepser.exeを起動する。
(9) AviUtlのファイル⇒編集プロジェクトの保存を行う。
(10) ScenarioVoiceから全て合成をクリック。(事前に「字幕ファイル出力」にチェックを入れておく必要があります。)
※音声保存先は、デフォルトでかんしくんフォルダ下のtmpフォルダを指定します。
※テキスト読み上げ機能を利用する場合は、一つずつ音声と字幕を設定することができます。
(音声保存先や字幕ファイル出力設定を設定メニューのその他から設定しておく必要があります。)
(11) 指定したレイヤーに音声と字幕が設定されます。
※かんしくんの設定については、こちらの動画内容をご確認ください。
※字幕の位置や大きさ、色など変更したい場合があると思います。その場合にかんしくんの動画を参考にしてください。
(1) 音声ファイルとsrtファイルをScenarioVoiceで作成しておきます。
(2) 作成した音声ファイルをPowerDirectorに追加します。(作成した音声を赤枠へドラッグして追加します。)
(3) 音声ファイルをレイヤーに配置します。(青枠の音声を全選択後、赤枠のレイヤーにドラッグして配置します。)
(4) 字幕ファイル(srtファイル)を読み込みます(字幕⇒ファイルから字幕読み込み⇒srt選択⇒開くをクリックします。)
(5) 音声と字幕テキストが完全同期する形でPowerDirectorに配置されます。
今回は、PowerDirectorを例に説明しましたが、srtファイルを読み込める動画編集ソフトでしたら同じ様に音声と字幕が一致する形で配置可能だと思います。
ゆっくりムービーメーカーやAviUtlの今までのScenarioVoiceの連携と比べてsrtファイルでの連携方法は、簡単に連携できて音声と字幕の位置を調整不要になるため、かなりの時短に繋がると思います。
ScenarioVoiceでは、VOICEVOX互換ソフトも利用可能です。
ポート番号は、ScenarioVoice.exe.configの値を編集してください。
以下のポートに変更すると各音声合成ソフトを利用できます。
対応ソフト | port番号 |
---|---|
VOICEVOX | 50021 |
COEIROINK v1 | 50031 |
LMROID | 49973 |
SHAREVOX | 50025 |
ITVOICE | 49540 |
VOICEVOX Nemo | 50121 |
AivisSpeechは、APIがVOICEVOX完全互換ではないためサポートしていません。
COEIROINKはv1のみサポートしています。v2以降、API仕様が変更になりVOICEVOX互換ではなくなりました。
VOICEVOX Nemoは、マルチエンジン機能を利用してVOICEVOXで動作させたものを利用します。
ご質問、ご要望のある方は、以下の問い合わせフォームからお問い合わせください。