感情表現も自由自在、大きく進化した音声合成システム、VOICEROID2を使ってみた

以前にも何度か紹介してきた音声合成システムの、VOICEROID(ボイスロイド)。株式会社エーアイの音声合成エンジンを利用した株式会社AHSが企画・販売するソフトウェアで、とっても人間的で自然な声で簡単にしゃべらせることができる合成を実現することができる製品です。AHSが手がけているため、結月ゆかり東北ずん子など、同じ声で歌うVOCALOID製品があるのも楽しいところです。

そのVOICEROIDはこれまでに少しずつ進化してきていましたが、このたび初のメジャーバージョンアップを果たし、VOICEROID2となって6月9日より2つのキャラクタ製品「琴葉茜・葵(ことのはあかね・あおい)」、「結月ゆかり」が発売されます。今回のVOICEROID2では感情表現ができるパラメータが搭載され、その設定によって、まったく違ったニュアンスでしゃべるようになったのが大きなポイント。実際どんな製品に仕上がったのか、紹介してみましょう。

感情を表現するパラメータも搭載され、大幅に強化された音声合成システム、VOICEROID2


VOICEROIDは、日本語のテキストを入力したり、コピ&ペーストで貼り付けるだけで、簡単に、そして非常に自然な感じでしゃべってくれるのが大きな特徴のソフトでした。ちょっと聴いただけでは、音声合成とは気づかないほどの自然さです。


VOICEROID2は日本語テキストを入力すれば漢字が入っていても、そのままキレイに読んでくれる音声合成システム

そのVOICEROIDがVOICEROID2になったわけですが、実際どんな声なのか、まずは以下のビデオをご覧ください。

どうですか?特に何の学習をさせているわけではなく、ただテキストを打ち込んだだけですが、すごく自然な発音をしてくれるのが分かりますよね。しかも感情表現のパラメータを動かすと、そのしゃべり方も大きく変わるのがよく分かると思います。

ご覧いただいて分かるとおり、このVOICEROID2エディタ上には3人のキャラクタがいました。一番上が関西弁でしゃべる双子の姉「琴葉茜」、真ん中にいるのが標準語をしゃべる双子の妹「琴葉葵」で、この2キャラクタはセットで販売されています。


VOICEROID2製品は「琴葉茜・葵」と「結月ゆかり」の2つ登場

一方、一番下にいるのが、VOCALOIDでもお馴染みの「結月ゆかり」で別製品となっています。ここで、これまでのVOICEROIDをご存知の方は、「あれ?」と思いますよね。そう、従来は各キャラクタごとに別ソフトとなっていましたが、今回のVOICEROID2ではVOCALOID4 Editorなどと同様に共通のエディターがあり、そこにライブラリとして「琴葉茜」、「琴葉葵」、「結月ゆかり」が載っているのです。ただし、VOCALOIDとは異なり、このエディターは別売ではなく、製品の中に含まれているため、製品と同時にインストールされます。

インポートツールを使って旧VOICEROID製品のライブラリを取り込むこともできる
ただし、2本目以降のソフトをインストールした場合は、ライブラリのみがインストールされる形になっています。また従来のVOICEROID+EXシリーズを持っている人は、AHSのマイページから入手可能なインポートツールを利用することで、VOICEROID2エディタ上で操作可能になります。

「VOICEROID+ 鷹の爪 吉田くん EX」をインポートしてみると、普通に使うことができた

試しに、手元にあった鷹の爪団の吉田くんをインストールしてみると、VOICEROID2エディタでしっかり使うことができました。聴いた感じでは、従来とまったく変わらないのですが、AHSに確認をしたところ「従来のVOICEROID+EXとVOICEROID2ではエンジンが異なるため、それぞれで同じ言葉をしゃべらせた結果を比較すると、微妙に違う点があります」とのことでした。


スタイルとして感情を表現するパラメータが3つ設定できるようになっている

さて、先ほどのビデオでもお分かりいただけたと思いますが、VOICEROID2ではボイススタイルという新しいパラメータに対応しています。それが前述の喜び、怒り、悲しみの3つなのですが、これが利用可能なのは、スタイル対応のライブラリのみ。今回、新製品開発にあたり、嬉しい声や、怒った声でのサンプリングを行っているからこそ実現できているわけです。

感情パラメーターはミックスして設定することも可能

同じキャラクタでもスタイルのパラメータの持たせ方によって、別人といってもいいほど違う声になるのが面白いところです。このビデオでは極端に喜び100%、怒り100%、悲しみ100%と1つずつ設定しましたが、50%とか70%といった設定にしてニュアンスを出すこともできるし、各感情をミックスして、喜び50%、怒り70%、悲しみ10%、といった中間値を設定して独特なキャラクタを作り出すことも可能です。

スタイル以外にも話速、高さ、抑揚などのパラメータも設定した上でユーザープリセットとして保存できる
そしてこの作ったキャラクタをユーザープリセットとして名前を付けて保存することも可能となっています。これによって、かなりいろいろな声を用意しておくことができるわけです。そして、なんといっても面白いのは、用意したキャラクタを使い、マルチボイスを実現できるということです。つまり、1文ごとに別々のボイスを割り当てることで、対話のようなことができちゃうんです。

試しに、芥川龍之介の「三つの宝」という青空文庫の冒頭をコピー&ペーストで、読ませてみたのが以下のビデオです。

かなり、いい感じで対話してくれていると思いませんか?ここでは、テキストをVOICEROID2エディターに貼り付けるとともに、1文ことに、キャラクタをドラッグ&ドロップして、キャラクタを割り当てているんです。ドロップするとテキストの頭に「第一の盗賊>」といった表記が付き、これでキャラクタを切り替える仕組みになっています。


左上のキャラクタを文の上へドラッグすると声を割り当てることができる

たったそれだけの作業で、これだけの演劇をしてくれるんですから、なかなか楽しいですよ。ただ、しゃべらせてみたところ、数か所、妙なイントネーションのところがあったので、そこだけ手動で修正しています。

数か所イントネーションの調整を行った

具体的には「こん畜生!」の「こん」がキツネみたいな発音になってたので、これを修正しています。これは以前からあった機能ですが、すごくシンプルで使いやすいのもVOICEROIDの特徴。単純に上がるか、下がる、維持するかだけの選択肢なので、ピッチ曲線を描くなんてこともなく、簡単なのに、それで十分なんですよね。

このようにして音声が出来上がったら、VOICEROID2上でしゃべらせるだけでなく、WAVでの書き出しも可能になっています。実は従来のVOICEROIDではこの書き出しにおいて16kHzのサンプリングレートであったため、環境によっては再生できなかったり、読み込めなかったりしましたが、今回のVOICEROID2では44.1kHzになったため、そうしたトラブルもなくなったのと同時に音質も向上しているので、その点だけでも従来ユーザーはバージョンアップする価値がありそうですね。

また、全文を1つのWAVファイルに書き出すだけでなく、区切って複数のWAVとして書き出すことも可能となっているので、いわゆる「ゲーム実況」の動画などを作る際にも便利に使えそうですね。

VocAlign Projectを用いてラップを作ってみる、といった使い方も面白いはず

まだ機能の一部を紹介したのに過ぎませんが、VOICEROID2は、このように簡単な操作で自然な声の音声合成ができるツールなのです。これをどう利用するかはユーザー次第。先日「カッコいいラップを簡単に作れるプラグイン、VocAlignを実践してみた!」という記事で、VOICEROIDを使ったラップを紹介しましたが、そんな使い方をするのも手ですし、音楽作品の中のトークとして入れるのもいいですよね。もちろん、音楽と関係なく、ビデオ作品のナレーションに使ったりするのもいいと思います。

商用で使うためのライセンス方式が4種類用意された
ここで気になるのが、これを商用に用いていいのか、という点。従来はこの点が少しわかりにくかったのですが、先日そのライセンス方式が大きく変わり、商用においてもより使いやすくなっています。詳細はAHSのサイトをご覧いただきたいのですが、
①個人有償配布
②楽曲ライセンス
③VOICEROID個人向け商用ライセンス
④VOICEROID法人ライセンス

の大きく4つのメニューが用意され、価格もしっかりと明示されています。

たとえば、同人サークルでの有償頒布の場合は①に相当し、登録だけすれば、無償で利用することが可能です。また個人が楽曲で利用する場合は1楽曲あたりライセンス単価5,000円(税別)などとなっているので、いろいろな使い方が考えられそうですね。

【製品情報】
VOICEROID2 琴葉茜・葵 製品情報
VOICEROID2 結月ゆかり 製品情報

【価格チェック】
◎Amazon ⇒ VOICEROID2 琴葉茜・葵 (パッケージ版)
◎Amazon ⇒ VOICEROID2 結月ゆかり(パッケージ版)
◎Amazon ⇒ VOICEROID2 琴葉茜・葵 ガイドブック付き(パッケージ版)
◎Amazon ⇒ VOICEROID2 結月ゆかり ガイドブック付き(パッケージ版)
◎AHSストア ⇒ VOICEROID2 琴葉茜・葵 (パッケージ版)
◎AHSストア ⇒ VOICEROID2 琴葉 茜・葵 ガイドブック付き(パッケージ版)

◎AHSストア ⇒VOICEROID2 結月ゆかり(パッケージ版)

◎AHSストア ⇒ VOICEROID2 結月ゆかり ガイドブック付き (パッケージ版)

Commentsこの記事についたコメント

8件のコメント
  • WEBWEBWEB

    この記事の中の最初の動画の「こんにちは」を聞いただけで音質の低さ、「こ」にアクセントがないことで、購入なしと思いました。バージョン3に期待してます。

    2017年6月4日 3:23 AM
  • djh

    貴重な、記事、ありがとうございます。
    インポートした、exシリーズは、44.1kHzで、出力されますか?
    よろしければ、教えてくださいませ。

    2017年6月8日 1:28 AM
  • 藤本健

    djhさん
    はい、インポートしたものでも44.1kHz出力です。
    ただ、内部でサンプリングレートコンバートされているだけのようではありますが。

    2017年6月8日 1:33 AM
  • djh

    ご返信、ありがとうございます。
    exゆかり、インポートと、ゆかり2の音質は違うということですか?(素の素材が)
    現在、exゆかりを持っているのですが、
    少しでも高音質を求めるなら、ゆかり2を買ったほうがいいですかね?
    (同じなら、琴葉茜・葵、購入しようか、迷っています)
    よろしければ、アドバイスお願いします。

    2017年6月8日 1:44 AM
  • djh

    藤本様
    販売店に、前のコメントの件、問い合わせました。
    また、何かわかりましたら、教えてくださいませ。
    失礼します。

    2017年6月8日 3:18 PM
  • 藤本健

    djhさん
    exゆかりをインポートしたものと、ゆかり2の標準の音質はあまり違いはないと思います。ただし、まったく同じではないということと、ゆかり2は表情付けができるのが大きな特徴です。

    2017年6月8日 11:00 PM
  • djh

    藤本様
    お返事ありがとうございます。助かります。
    exゆかり、サンプルレートが、22,050で、書き出しされております。
    素の素材の音質が同じなのか?
    同じ場合、2のエディターで、ゆかり2と同じ音質で出力できるのか?(数字では、44.1ですが)
    が知りたいとこです。
    販売店でもないのに、質問してすみません。
    何かわかりましたら、教えてくださいませ。
    本当にありがとうございます。

    2017年6月9日 12:38 AM
  • 藤本健

    djhさん
    はい、その推測通りだと聞いております。

    2017年6月9日 7:47 AM

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です