CeVIO Pro(仮)改めVoiSonaのβ版無料公開がスタート。VSTiに加えAudio Unitsにも対応し、M1にもネイティブ対応

6月2日、テクノスピーチが最新のAI技術で人間の歌声をリアルに再現する歌声合成ソフト、VoiSona(ボイソナ)のβ版を無料で公開しました。これは、今年2月に「WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始」という記事で紹介したCeVIO Pro(仮)が名称を変更するとともに、β版へとアップグレードしたもので、ソングエディタとともに、デフォルトボイスライブラリとして女性シンガーである「知声」(読み:ちせい、英語表記:Chis-A)が付属している点も同様です。

CeVIO Pro(仮)でもWindowsとMacに対応するとともにスタンドアロンおよびVSTiプラグインとして動作する形になっていましたが、β版となったVoiSonaではMacのAudio Unitsプラグインにも対応。さらに、MacのM1プロセッサにもネイティブ対応する形になっています。正式版はこの秋の公開を目指して開発中とのことですが、なぜCeVIOの名前が外れたのか、正式版になった際に何が変わり、価格はどうなるのか、今後CeVIO AIとの関係はどうなるのか……など気になることもいろいろ。そこで、オンラインインタビューの形でテクノスピーチの代表取締役である大浦圭一郎さん、エンタメ事業部プロデューサーである塚田恵佑さんにお話を伺ってみました。

6月2日、テクノスピーチよりVoiSonaのβ版が無料で公開された

Audio Units対応やM1プロセッサ対応を実現

--CeVIO Pro(仮)として2月24日にリリースのタイミングで記事にしましたが、かなり反響があり、これまでCeVIO AIやVOCALOIDなどにもあまり関心を示していなかったプロの作曲家などからも面白い、という声が届いていました。
大浦:ありがとうございます。当社でも想定していた以上のダウンロード数があり、多くの反響をいただき、驚いております。動作環境がWindowsだけでなくMacでも利用できるようになったこと、そして無料でのリリースということもあり、今までとは異なるユーザーの方に使っていただけたのでは…と喜んでおります。

今回オンラインでお話を伺ったテクノスピーチの代表取締役である大浦圭一郎さん

塚田:4月に今回で4回目となるボカコレ、ボカコレ2022春が開催されました。ここでもCeVIO Pro(仮)の知声の作品が数多く発表されており、リリース2か月のソフトとしては、かなり存在感が出せたのではないか……と思っておりました。

大浦さんとともにお話を伺ったエンタメ事業部プロデューサーの塚田恵佑さん

--α版のリリースから3か月で、β版となるVoiSonaのリリースとなったわけですが、これまでもアップデートがありましたよね?改めてどんなアップデートがされてきたのか教えていただけますか?
大浦:最初のα版が出た後Ver0.5というものを出していました。ここでは不具合修正など細かな調整が行われたほか、CeVIO Creative StudioおよびCeVIO AIのファイル形式であるCCS、CCSTファイルの入出力にも対応しました。当初は入力だけだったのを出力も可能としています。同様にMIDIファイルもインポートだけでなくエクスポートにも対応しています。またエディタ内での再生制御機能を追加しました。VSTiの仕様の制約上、プラグイン側からDAWのトランスポートを動かせないためにこうした機能を搭載しました。さらにショートカットも増強しました。

Ver0.3.1

Ver0.4.0

Ver0.5.0

--ショートカットなんてあったのでしたっけ?
大浦:はい、ショートカットを使うことで、操作がより快適になるので、ぜひ活用していただければと思っており、操作性向上のために一部ショートカットを追加していました。どんなショートカットがあるかは「編集」メニューの「環境設定」から確認することもできますし、必要に応じてショートカットを編集したり、追加することも可能です。そのほかVer0.5ではmacOSでのピンチイン/ピンチアウトにも対応させています。α版リリース時、Macユーザーからピンチイン/ピンチアウトに対応してほしいという声が多く寄せられたことから、すぐに対応させました。

VoiSonaのショートカット編集ウィンドウ。自由に設定を変更することも可能

--そのVer0.5から今回β版となったわけですが、今回は機能的にどんな進化があったのでしょうか?

大浦:Macユーザーの場合、思っていた以上にLogicユーザーが多く、VSTiだと使えないという声をいただきました。そのためβ版においてはLogicでも問題なく動作させられるようにAudio Units対応させています。また、MacユーザーからはM1プロセッサへの対応も求められており、これはやるしかない、ということで対応させました。M1 MacでM1ネイティブのDAWを動かす場合と、M1 MacでIntelコードのDAWを動かす場合ではプラグインに対する挙動が異なるなど、いろいろややこしいところがあり、すべての動作検証を行うのに時間がかかってしまいましたが、なんとか対応させることができました。また従来はサンプリングレートが48kHzの場合のみで動作するという仕様になっていましたが、今回のβ版ではそうした制限をなくし、どのサンプリングレートでも使えるようにしています。

Audio Unitsに対応したため、Logic ProやGarageBand上でもVoiSonaを使うことができる

VoiSonaへの改名とその名前の由来

--そのβ版になるタイミングでCeVIO Pro(仮)からVoiSonaと改名することになった理由などを教えてください。
塚田:「CeVIO Pro (仮)は当社単独で企画・開発を行うAI歌唱ソフトで、当社含む5社共同のCeVIOプロジェクトという主体で運営するCeVIOとは、姉妹ブランドの関係になる」といったお話を 前回のインタビュー記事 の中でもお話させていただきました。その立ち位置をより分かりやすくするため、CeVIO姉妹ソフトブランド「VoiSona」という形に名称を改めました。特に、α版公開前後にSNSなどでユーザーの皆様の反応を追ってみると、CeVIO Pro(仮)という名称ゆえにCeVIO AIやCeVIO Creative Studioのボイスライブラリ製品と互換性があると誤解させてしまっているなと感じるケースも多く…。やはり、こうした誤解をなくす上でも、正式リリースに向けて名称を改めたいと考えており、ようやく商標登録など各種環境も整ったことから発表させていただきました。

VoiSonaのロゴ

--最近、音声合成界隈でも商標が大きな話題になっていましたが、商標を取得するには結構準備期間も必要ですよね?
塚田:おっしゃる通りです。実は、α版を発表した時点ではすでに社内的にはVoiSonaの名前も決めて、商標登録に向けた準備も進めていました。実はα版の発表から間もない2月27日に、商標登録を速報するbotでも当社がVoiSonaの商標を出願していたことがツイートされていました。

--このbotをしっかりチェックしていたら、いろいろな情報がつかめそうですね。ところで、そのVoiSonaの名前の由来について、お伺いできますか?
塚田:音声「Voice」と人格・魅力などの意味を持つ「Persona」を結合した造語で、音声で多様なパーソナリティを表現したいというメッセージを込めたネーミングです。数多くのアイディアの中から絞り込んで、これに決めました。

サブスク価格は税込6,600円/年、CeVIO AIさとうささらユーザーは初年度無料で提供

--改めて、そのVoiSonaの料金体系について教えてください。
塚田:α版、今回のβ版、そして秋にリリースを予定している正式版においてもソングエディタ本体については無料であり、デフォルトのボイスライブラリである知声についても無料で提供していきます。ここで合成された歌声の波形データは個人/法人、商用/非商用を問わず、原則、無料で利用することが可能となっています。一方で、今後は徐々にボイスライブラリを追加していく予定であり、これらについてはサブスクリプションでの提供を予定しています。先ほど申し上げた通り、VoiSonaとCeVIO AIの間には直接的な互換性はありません。しかし、姉妹ブランドとして、ご要望の多いボイスライブラリ製品は、前向きにクロスプラットフォーム化の検討をしていきたいと考えています。

※2022.6.3追記
テクノスピーチから正式版のリリースが9月であること、また「さとうささら」も同時リリースされることが発表されました。

--具体的にはどんなボイスライブラリが登場し、価格はいくらくらいになるのでしょうか?
塚田:先に価格のお話をしますと、有償の追加ボイスライブラリについては、年間サブスクプランで税込6,600円、といった辺りを社内では想定しています。ラインナップについて、まずCeVIO AIから「さとうささら」のクロスプラットフォーム化が決まっていて、これは秋のVoiSona正式リリースと同時実装の方向で調整しています。前回のインタビューでもお伝えした通り、CeVIO AIからクロスプラットフォーム化されたボイスライブラリについては、CeVIO AIの同製品ライセンス保有者様への優待プランを設けたいと考えており、さとうささらについてはCeVIOプロジェクトとも相談し、なんと初年度無料(※CeVIO AIさとうささらソングボイスのライセンス所有者のみ。2年目から通常価格)でOKいただけました。VoiSona側としてもかなり思い切った形ですので、是非リリースの折には、たくさんの方にお使い頂けたらと思っています。CeVIOからのクロスプラットフォーム化でない、VoiSona純正のボイスライブラリ製品については、現時点で完全新規キャラクタ・新規CVの男声ボイスライブラリの制作が決まっています。あとは知声の英語版ですね。これらは年内から年明けにかけて、発表やリリースのスケジュールを詰めたり、ビジュアル周りの準備をしたりしている所です。また、本決定ではないものの動いている案件は複数ありますので、機を見てユーザーの皆様に情報お伝えしていければと思っています。

現在は知声のみだが、正式リリースのタイミングでさとうささらや、その後も新規ボイスライブラリが増えていくとのこと

--手ごろな価格ではありますが、サブスクリプション、まだまだ根付いているとは言えないと思うし、否定的な考え方をする人も少なくないと思います。なぜあえてサブスクリプションという料金体系をとったのですか?
大浦:最大の理由はサブスクリプションにすることで、演者さんへの継続的なバックが可能になるということがあります。音声合成、歌声合成の世界では、これまで製品を作る段階では声優さんなど演者さんにギャランティーが支払われますが、それっきりになってしまい、いくらキャラクタが大ヒットになっても、演者さんに追加で支払われることが無いケースが多いです。やはりより健全なエコシステムを構築するには、演者さんに継続的にバックできる体系が必要だろうと考えていました。またこれまで法人の利用や営利目的での利用の場合、別途契約した上で料金を支払い……という制度はあったものの、煩雑で扱いにくいという面があったのも事実です。そうした波形利用料周りも簡略化し(知声は無償、追加ボイスライブラリはサブスクリプションの料金内)、使いやすく分かりやすい体系としました。一方で、サブスクリプションだからこそ、ボイスライブラリを含め、積極的なアップデートもしていきたいと思っています。

VoiSonaとCeVIOは姉妹ブランドという関係になっている

VoiSonaとCeVIOプロジェクトとの関係は!?

--今回のテクノスピーチのVoiSonaのリリースについて、「CeVIOプロジェクトからの離脱か?」というようにとる人もいたように思いますが、その点についてぜひ説明をお願いします。
大浦:CeVIOプロジェクトにおいて、当社は音声合成エンジンの提供とボイスライブラリの制作という役割を担っており、今後ももちろん継続的に関わって参ります。その意味でも、VoiSonaはCeVIOと姉妹ブランドでありたいと考えており、ボイスライブラリのクロスプラットフォーム化など、CeVIOプロジェクトのみなさんとも協力関係を続けていきたいと思っています。さとうささらのように、CeVIO AIのボイスライブラリをVoiSonaで使えるようにするケースもあれば、逆にVoiSonaのボイスライブラリをCeVIO AIに持っていくことができれば、とも考えております。また、VoiSonaの売上の一部をCeVIOプロジェクトにもバックする形で、姉妹ブランドとしての業務提携をしています。

塚田:テクノスピーチの中でも、実は私自身は大浦と違い、CeVIOプロジェクト参加メンバーではなくVoiSona専任です。ただ、テクノスピーチに入社する前からいちユーザーとしてCeVIO を愛用していたこともあり、姉妹ブランドとしてお互いを盛り上げられる良い関係性を築ければ、と思っています。
例えば、購入したボイスライブラリを指して「うちの○○さん」というような表現を音声ソフトウェアユーザー間ですることがあるのですが、こうした感覚は買い切りであるCeVIO AIの方がより強く得られるものと個人的に感じる部分もあります。その意味で大浦も言う通り、VoiSonaボイスライブラリをCeVIO AIに持っていく、といったことも検討していきたいと考えています。

--今回、VoiSonaをインストールしてみたところ、CeVIO Pro(仮)に上書きされるのではなく、別のVSTiとしてインストールされ、両方が使える形になっていますが、ここでの互換性などはどうなっているのでしょうか?
大浦:CeVIO Pro(仮)のVer0.5と今回のVoiSonaのβ版は見た目もほぼ同じで、バージョンアップという形なので、CeVIO Pro (仮)のプロジェクトファイルtssprjをVoiSonaでロードすることが可能です。ファイルの保存形式にはいくつかあり、DAWから利用する場合はDAWのプロジェクトファイルとして保存すれば、歌唱情報も全て保存できて便利です。ただ、CeVIO Pro(仮)とVoiSonaではプラグインの名前が異なるため、DAWからは同じプラグインとはみなされません。そのため、CeVIO Pro (仮)で作ったコンテンツをVoiSona上で再現する場合は、いったんCeVIO Pro(仮)のエクスポート機能によりtssprj形式で保存し、それをVoiSonaのインポート機能で読み込んでいただければと思います。
今回のVoiSonaのリリースにより、CeVIO Pro(仮)の役目は終わったのですが、これまでDAW上のプラグインとしてCeVIO Pro(仮)で曲を作り、DAWのプロジェクトファイルとして保存していた人が、そのファイルを開くためにはCeVIO Pro(仮)が必要になります。もし、我々がCeVIO Pro(仮)の提供をやめてしまうと、それまでに作った曲を再現できなくなってしまう可能性があり、それは忍びないし、我々の意図するところではありません。そのため、当面はCeVIO Pro(仮)の提供を続ける予定です。なお、旧バージョンは認証の関係で1ヶ月程度で使えなくなりますので、その場合は6/2に公開のCeVIO Pro(仮)の最終バージョンをご利用ください。

公式サイトにはVoiSonaのほか、CeVIO Pro (仮)最終バージョンのダウンロードリンクが用意されている

ARA 2対応や合成音声の品質向上を実現したい

--今後、正式版のリリース、さらにはその先でのアップデートでは、どんなことを盛り込んでいくのでしょうか?
大浦:VST、Audio Unitsに加え、いつかはARA 2へも対応したいと思っています。ARA 2に対応すれば、CubaseやStudio OneなどにおいてDAWの一機能のように融合して使えるようになるため、プラグインとして使うよりも、より使い勝手が向上します。ちょうどMelodyneを使うような感覚でVoiSonaを利用できるようになるはずです。もちろん合成音声品質向上も行っていきますし、ボイスライブラリもどんどん増やしていきたいと思っています。
このボイスライブラリを増やすことで、任天堂Switchのスマブラ(大乱闘スマッシュブラザーズ)のような世界観を実現したいと思っています。つまりさまざまな会社のキャラクタが会社の垣根を越えて同居しているスマブラの音声合成版というか……。これまでのCeVIO Creative StudioやCeVIO AIのキャラクタはもちろん、異なる音声合成プラットフォームのキャラクタであったり、VRのキャラクタだったり、場合によっては普通に紅白に出ているようなアーティストだったりと、まさにごちゃ混ぜ感を出していければと考えています。そこに向けて一歩一歩進めていければと思っています。
塚田:エンタメ事業部としては、CeVIO Pro (仮)の頃から引き続き、VoiSonaに関連するコンテンツやグッズの制作、イベント出展にも力を入れていきたいと考えています。
目下、せっかくささらさんのクロスプラットフォーム化も決まっていることですし、知声とささらさんのコラボレーションで何かできれば、と思っていますので、CeVIOファン、ささらファンの皆様にも楽しみにお待ち頂けたら嬉しいです。

--ありがとうございました。

【関連情報】
VoiSona公式サイト
VoiSona公式Twitter @VoiSonaOfficial

モバイルバージョンを終了