VTuberに超強力兵器が誕生!リアルタイムに自分の声をキャラクタボイスに変換できるソフト、Voidolが発売開始!

マイクに向かってしゃべる声を、リアルタイムにキャラクタボイスに変換できるソフト、Voidol(ボイドル)が本日4月3日より発売が開始されました。価格は2,000円(2019年7月まではキャンペーン価格の960円)と手ごろな価格。男性が女性キャラクタに変身したり、女性が男性キャラクタに変身することも簡単にでき、オーディオインターフェイスとマイクを利用することで、かなり高音質での実現が可能です。

今回発売されたのはMac版ですが、5月か6月までにはWindows版も登場する予定。また、Voidol内には「くりむ蔵」と「音宮いろは(おとみやいろは)」という2つの無料のボイスモデルが付属しますが、今後さまざまなキャラクタのボイスモデルがオプションとして発売される予定です。実際どのくらいのことができるのか、開発元のクリムゾンテクノロジーに行って試してみたので、紹介してみましょう。


クリムゾンテクノロジーから「Voidol – Powered by リアチェンvoice ー」が発売

今回発売されたソフト、正式名称は「Voidol – Powered by リアチェンvoice ー」というもの。その名前を聞いて「あれ?何か聞いたことある名前だ!」と思った方も少なくないと思います。そう以前にも「自分の声をキャラクターの声にリアルタイム変換するアプリ、リアチェンvoiceが無料で登場!佐藤聡美さんや小岩井ことりさんになれちゃうぞ!」や「自分の声をキャラクターの声にリアルタイム変換するSFのような技術、リアチェンvoiceが楽器フェアに登場!」といった記事で紹介したことがあった「リアチェンvoice」のテクノロジーを使った新製品なのです。

まずは、クリムゾンテクノロジーの広報担当、波多江良徳さんに、簡単にデモをしてもらったので、まずはこのビデオをご覧ください。

お分かりいただけますか?波多江さんがマイクに向かってしゃべった声が、オーディオインターフェイス(ここではFocusriteのScarlett SoloにShureのSM58を接続していました)を介してMacに入り、Voidolがリアルタイムに処理をした上でオーディオインターフェイスからモニタースピーカーを通じて変換された音が出ていたのです。


Voidolのメイン画面

その様子をiPhone XSでそのまま録画していたので、波多江さんの生の声とモニタースピーカーから出る音の両方を捉えていたのです。その二つの声の状況からもリアルタイムに変換しているのが分かりますよね。でも、これは訓練をしている波多江さんだから、こんなにキレイにできているのではないか、もしかしたら波多江さんの声に最適化されているのではないか……と疑いを持ってしまったので、私にも試させてもらいました。

せっかくなら違うキャラクタを試してみたいと言ったところ、まもなくオプションとして発売になる「東北ずん子」が使えるとのことだったので、東北ずん子の紹介文の一部を朗読してみたのが以下のビデオです。

ちょっと、これ、スゴクないですか?基本的には、昨年iPhone版として発売されたリアチェンvoiceのMac版なんですが、性能的に断然向上しているんです。

「変換エンジンそのものは、iOS版のものと大きく変わっていないのですが、Macに最適化させるために、改めて作り直しているのと同時に、オーディオインターフェイスとマイクを使っているから、より高品位な音になっているんです」と波多江さんは説明してくれました。


iPhone版のアプリ、リアチェンボイス

実際に使った感じでいうと、リアルタイム変換ではあるけれど感覚的に50msec以上のディレイがかかった感じのレイテンシーはありました。しゃべりはじめに若干の違和感がありましたが、慣れれば全然問題ないレベルですね。これ、顔を隠せば十分、東北ずん子になり切れそうな気がしますね。

まさにVTuberのための強力兵器の登場という感じですが、YouTubeなどで流しても問題ないのでしょうか?また、その際広告を入れて収益を上げるとか、これを使って作った朗読劇をM3やコミケなどの同人即売会で頒布するというのは問題にならないのでしょうか?


iPhone版にはなかった新キャラクタ、「音宮いろは」が標準搭載

「基本的に一般の方が動画配信して収入があるような場合も商用とはみなしません。東北ずん子と吉田くんに関しては、少し規定があるので、朗読劇CDの販売はNGとなっていますが、当社のオリジナルキャラクタに関しては自由に使っていただいて結構です」(波多江さん)

ただし、作ったボイスを元にして新たなキャラクタを作って販売したり、このアプリケーション自体をシステムに組み込んで販売するといったことは個人でもNGとのことでしたが、かなり自由度は高そうですね。

では、もうちょっとソフトの機能のほうを見てみましょう。iOSアプリのリアチェンvoiceと比較すると、かなりいろいろな機能が搭載されていて、便利に使えるようになっています。VTuberの利用を想定した機能という気がしますが、見ていきましょう。


各種設定画面。画面右側でオーディオデバイスの設定を行う

まずはオーディオの入出力から見ていきましょう。ここではCore Audioで入力と出力を設定し、サンプリングレート、バッファサイズを決めることができます。デフォルトのバッファサイズは512sampleになっていますが、マシンスペックが高ければ、これを小さくすることで、さらにレイテンシーを縮めることが可能です。


Windows版もしっかりできている。ASIOドライバの利用で音質もレイテンシーも向上できる

実は後日発売になるWindows版ももうほぼ仕上がっており、それを試してみたところWindows Audio Exclusive Mode(WASAPI排他モード)、DirectSound、そしてASIOが使えるようになっており、まったく問題なく安定して動作してくれましたよ。

ここでポイントとなるのは入力はモノラルで扱っており、声の入力のほかにAUX入力を割り当てられるようになっているという点。つまり、モノラルにはなりますがAUXにBGMとかカラオケを入れれば声の変換に関係なくバックの音として鳴らすことができるのです。


画面中央下にあるMIX LEVELで声とAUXのバランスを調整

そして、その声とAUXのバランスはMIX LEVELで調整することが可能です。さらに、声に関してはリバーブをかけられるようになっており、HALL、ROOM、PLATEなど6種類から選ぶことが可能で、リバーブのリターンレベルをSPACEで調整することも可能です。ここはAUXには影響しないわけですね。


6種類のリバーブを搭載している

さらにNOISE GATEが用意されているのも、運用上非常に大きく働いてくれる点。NOISE GATEを使わない状態だと、マイクから入るすべてが変換対象となってしまい、常に妙な音が出てしまうのですが、これを少し持ち上げることにより、ある程度の音量にのみ変換が効くため、キレイでクリアな声を出すことが可能になるのです。


OFF/弱/強でDUCKINGの設定ができる

そして、もう一つ重要なのがDUCKINGです。そうDAWのエフェクトの世界でいうところのサイドチェイン的な使い方になります。つまり大きな声の入力が入るとAUXを小さく、声が小さくなれば元に音量に戻っていくのです。VTuberがBGMを鳴らしながら、しゃべるときは自動的にBGMの音量を下げて聴き取りやすくすることができるわけです。

Voidolで、どの声に変換するかはインストールされているボイスモデルから選択するわけですが、それと同時に入力する声、つまりしゃべるユーザーが男性か、女性を選択するようになっています。これによって、男性の声を女性ボイスに変換したり、女性の声を男性ボイスに変換する際にも違和感がないようにうまく調整してくれるようですよ。


3teneやAdobe Character Animatorと組み合わせてVTuverツールとして活用

ここから先はユーザーがどのようにこれを利用するかですが、たとえば3teneを使うとか、Adobe Character AnimatorなどをVoidolと併用すれば、簡単にVTuberになれちゃうわけですよ。この際、Voidolの入力と、3teneやAdobe Character Animatorの音声入力を同じものに設定すればいいだけです。3teneのMac版を使って波多江さんに実演してもらったのが、以下のビデオです。

ところで、このVoidol、しゃべりではなく、歌はどうなんだろう……、そう思う方もいると思いますが、まだ検証中ということではありましが、そのテスト用のボイスモデル、Bohemianを使ったデモでは、ちょっとトンでもないことが起こっていました。これはBohemian Rhapsodyの歌声を元に学習させてボイスモデルを作っているそうですが、それを波多江さんに実現してもらったのが以下のビデオです。

波多江さんの素性をご存知の方なら、「それ、ズルイよ!」と思われるかもしれないし、波多江さんが上手すぎて、「どこが変わったのかよく分からない」……なんて方もいるとは思いますが、よく聴くと、すごいレベルでの歌声変換が行われているのが分かると思います。気になる方は、波多江さんの名前で、ググってみてくださいね!

以上、4月3日に発売されたVoidolについて紹介してみましたが、いかがだったでしょうか?今後、ボイスモデルが増えていくと同時にWindows版もリリースされるなど、どんどん面白いことになっていきそうです。VTuberのみなさんにとっても、従来のピッチチェンジやフォルマントチェンジによるボイス変換とは次元の異なるものなので、かなり面白い世界になっていきそうですよね。

 

【関連情報】
Voidol – Powered by リアチェンvoice- 製品情報

【ダウンロード&購入】
◎Amazon ⇒ Voidol for Windows Voidol for MacOS
◎楽天 ⇒ Voidol for Windows Voidol for MacOS

モバイルバージョンを終了