CASIOが歌うシンセサイザ・CT-S1000Vをリリース。和音も歌える新型カシオトーンが3月発売

先日「CASIOが間もなく、新音源方式のシンセサイザーを発表か!?」という記事で取り上げたCASIOのシンセサイザが本日1月21日に、正式に発表されました。すでに海外からのリーク情報なども流れていたので、気になっていた方も多いと思いますが、登場したのはCT-S1000Vという製品で、指定した歌詞に合わせて歌わせることができるシンセサイザ。日本語、英語に対応するバイリンガルであり、和音を歌わせることも可能というものです。CeVIOを生み出した名古屋工業大学を中心とした研究に基づく技術を使用したテクノスピーチHMMエンジンを中枢に据えるとともに、CASIOの電子楽器音源技術を組み合わせることで生まれたユニークな楽器となっています。

歌うキーボードとしては、2017年にYAMAHAがVOCALOID Keyboardを発売していますが、このCT-S1000Vは和音で歌わせることができるのが大きな特徴。また1音ずつ歌詞を歌わせていくことができるノートモードのほか、テンポに合わせて歌わせることができるフレーズモードを持っているのもユニークなところ。また声質を自由にエディットできるとともに、ボコーダー的な歌わせ方ができたり、PCM音源と組み合わせて、たとえばニワトリの鳴き声のような歌声で歌わせることができるなど、これまでにない新たな歌うシンセサイザとなっているのです。CT-S1000Vはカシオトーンのラインナップとして登場したこともあり、従来からの電子キーボードとしての機能を備えつつ、その音色をシンセサイザとしてエディット可能なのも注目すべきポイント。そこにアドオンされる形で、ボーカル音源機能を搭載したのが、今回の新製品、CT-S1000Vなのです。すでにプレスリリースやCASIOサイトでも製品情報が公表されていますが、発表前に開発者にいろいろとお話しを伺うこともできたので、実際CT-S1000Vで鳴らした音も交えながら、どんな製品なのか、より突っ込んだ情報を紹介してみましょう。

CASIOが1月21日に発表したボーカルシンセシス音源を搭載した歌うキーボード、CT-S1000V

DTMステーションでは、これまでCASIOのデジタルシンセサイザの歴史を5回にわたって振り返ってきましたが、そうした中で、まったく新たなシンセサイザを開発している……といった話をなんとなく伺っていました。それがいよいよCT-S1000Vとして発表されたわけです。イギリスからティザービデオなどは公表されていましたが、もちろんCASIOですから日本ですべて開発されたシンセサイザです。

CT-S1000Vはステレオスピーカーも搭載した61鍵のキーボードとなっている

ブラックとワインレッドの配色のCT-S1000V、製品ラインナップとしてはカシオトーンの上位モデルという位置づけですが、これまでのカシオトーンのイメージとはだいぶ異なるシンセサイザとなっています。ロゴにはAiX SOUND SOURCE WITH VOCAL SYNTHESISとあり、ここに新しいシンセサイザエンジンが搭載されていることを示しているようです。まだ国内での正式な発売時期、価格などは公表されていませんが、おそらくは3月上旬の発売で、市場想定販売価格は5万円前後になりそう、とのこと。個人的にはCT-S1000Vの中身から考えると、安すぎな価格設定であるのが気になるところですが、これもCASIOならではの点なのかもしれません。

CT-S1000VのフロントパネルにあるAiX SOUND SOURCEというロゴ

今回、そのCT-S1000Vの発表を前に、事前に開発部門にお伺いし、カシオのプロデューサーである岩瀬広さん、開発担当である段城真さんにお話しを聞いてみました。岩瀬さんは、これまでもCASIOデジタルシンセサイザの歴史をインタビューしてきたので、もうDTMステーションとしてはお馴染みですよね。

CT-S1000Vを開発したカシオの段城真さん(左)と岩瀬広さん(右)

当社では、40年電子楽器に取り組んできました。この歴史の中でPCMが登場したことで技術は大きく進化し、さまざまなサウンドを自在に出せるようになりました。しかし、これまで電子楽器でできていなかったのがボーカル。残された聖域に取り組まなくては……とボーカル音源に取り組んできました。端的にいえば、コーラス隊がいなくても成り立つバンドを作ってみたい、新しい歌う楽器で音楽の世界を変えてみたいという思いです」と語るのは、岩瀬さん。

その岩瀬さんは、この新しいCT-S1000Vを「歌詞を弾く楽器だ」と言っており、「PCM誕生以来の大変革になるのではないか」と自信を見せています。でも、実際どんな音が出るのかが一番気になるところ。実際、その音を収録したのがこちらです。

どうですか? これ、スゴくないですか!? 年末に仕込んでおいた歌詞で弾いてもらったので、ちょっぴり季節外れなクリスマスソングになってしまいましたが(笑)、和音で自在に歌わせているのを目の当たりにし、かなり驚かされました。岩瀬さんからは、以前から新方式のデジタルシンセサイザとは聞いていたのですが、正直なところ、当初はそれほど大きな期待は持っていなかったのです。が、昨年末からのティザー広告ビデオなどで気になり、岩瀬さんにお願いして、発表前にこっそり見せてもらった結果、デジタルシンセのCASIO復活が間違いないことを確信しました。まさに従来になかったボーカルシンセサイザであり、YAMAHAのVOCALOID Keyboardとも、まったく異なる電子楽器といってよさそうです。デモ演奏してくれたのは、開発担当の段城さん。

3年ほど前から着手し、ようやくここまでたどり着きました。名古屋工業大学の徳田恵一先生、大浦圭一郎先生、またその研究室から生まれたベンチャー企業であるテクノスピーチさんと共同で開発してきました。このボーカルシンセシス音源は人が歌った歌声と、その歌の楽譜を機械学習することで特徴量を抽出し、歌声パラメーターを推論することで歌声合成しています。そのため、従来のPCM音源とはまったく異なる技術で、データ量も小さく、非常に滑らかな歌声を作り出すことができます」(段城さん)

ボーカルシンセサイズ音源の基本的概念。人の歌声を学習し、それを元に歌声合成している

つまりCeVIOで使われたテクノスピーチによる歌声合成技術をCASIOがLSI化して搭載しているようで、内部のDSP、CPUを使いながら処理しているので、滑らかに歌っているようです。また、単に歌声を選んで、演奏するというだけでなく、パラメーターがいろいろあるのも面白いところ。たとえば、性別ノブ、年齢ノブを動かすことによって、演奏しながらでもリアルタイムに声質を大きく変化させることができるのです。

カシオの技術でチップ内にDSP、CPU、音源を載せ歌声合成の処理を行っている

音色切り替えというか、歌声のキャラクタの切り替えが一瞬でできることにも驚きます。サンプリング音源ではないので、データの読み込みに時間がかからないし、パラメーターを動かすことでその声色がドラスティックに変化していくことにも驚きました。以下は、サザエさんの登場人物である、磯野フネさん、それにタラちゃんに近い声を作り、それをモーフィングさせてしまうという例です。

性別や年齢といったパラメーターを動かして作っているわけですが、いままでのVOCALOIDやCeVIO、Synthesizer Vなどにもなかった、リアルタイムで歌声パラメーターを制御できる機能が新しいですよね。段城さんによると、テクノスピーチ社の技術をベースにはしているけれど、CeVIOとはいろいろと異なる仕組みを搭載していることで実現させているようです。

さらに、もう一つデモで見せてもらったのがこちらのビデオです。

そう前半ではデスボイスやウィスパーボイスで歌わせることができていますが、このよう無声音だけを鳴らすといったことも可能になっているのはHMMエンジンだからこそのものですね。

さらに驚いたのはニワトリの鳴き声や牛の鳴き声で歌わせるというユニークな使い方もできる、ということ。これまでもサンプリングを使うことで、ニワトリの鳴き声で歌わせることは可能でしたが、このビデオでもわかる通り、サンプリングとはまったく違う手法で歌わせているからこそ、この鳴き声に歌詞を当てはめて歌わせることができるんですね。ちょっとできることが豊富すぎて、圧倒されてしまいます。

ボーカルシンセシス音源のブロックダイアグラム

ブロックダイアグラムを見せていただいたところ、各パラメーターで歌声を調整したのちに、Excitation Generationというところで、PCMの音と合成させているところがあります。ここでニワトリや牛の鳴声をサンプリングしたものと組み合わせているわけですね。

最後のSynthesis FilterはCeVIOでも最終的に音を合成する、声道となる部分です。これはいわばボコーダーともいえる部分。そこを積極的に活用し、いわゆるボコーダーサウンドのような演奏もできるシステムになっているのです。

これも、めちゃめちゃカッコイイですよね。自分がマイクに向かって歌うのではなく、歌詞を仕込んでおいて、それに合わせてキーボードを弾くとボコーダーサウンドで演奏されるというものです。単音でも和音でも行けるわけです。

ここで、やはりどうしても気になるのは、歌詞はどのように入力するのか、そして、もしミスタッチしたらどうなるのか、という点。

内蔵スピーカーには、うっすらとCasiotoneの文字が…

予めいくつかの歌詞は入っていますが、スマホアプリから自由に歌詞を入力し、それを音源内に転送して利用できるようになっています。ただ、1つのメモリには、あえて長い歌詞を入れずに、短いフレーズを入れるコンセプトなので、1曲演奏していくのであれば、演奏中にメモリを切り替えながらつなげていく形を想定しています。すでにお気づきかと思いますが、ここには2種類の歌わせ方を実装しています。1つは押鍵ごとに歌詞音節が進行するモード(ノートモード)です。この場合、もしミスタッチした際は、ペダルや鍵盤で歌詞の頭出しなどの歌詞音節制御ができるようになっているので、これを利用することができます。一方で、これとは別に予め指定した譜割りで進行するフレーズの和声を変更させるモード(フレーズモード)というものも用意しており、先ほどのサイレントナイトや、蛍の光もこのモードを使っています。この演奏モードの場合、予めユーザーが決めた譜割りで歌詞が進行するため、歌詞が遅れたり進みすぎたりするということがなくなり、歌詞の進行を気にせずに、キーボード(和声)の演奏に専念できるのが大きな特徴です」と段城さんは話します。

CT-S1000Vの操作パネル。シンプルな操作体系ながら、かなり複雑な操作まで可能

さらに文字を白鍵の左側から順にアサインさせる機能もあるので、先ほどのビデオの「蛍の光」であれば「ほ」、「た」、「る」、「の」、「ひ」、「か」、「り」…の歌詞の中から任意の文字を鍵盤で指定して歌わせることも可能になっていました。またカシオトーンのアルペジエーター機能と組み合わせて歌詞を自動演奏させることもできるから、キーボードの演奏が苦手な人でも、スムーズに歌わせることができそうです。

ところでWindows上で動くCeVIOのほうは、2021年にCeVIO AIという新技術を投入し、より人間的に歌うソフトが次々と登場してきました。このカシオトーンに載るエンジンはどうなっているのでしょうか?
これは、CeVIO AIではなく、CeVIO Creative Studioに相当するもので、HMM(隠れマルコフモデル)を使った歌声合成となっています。リアルな人間っぽさを追求するというよりも、楽器としての幅を広げていくという使い方として、HMMのほうがよりマッチしていると現状では考えています」(段城さん)とのことで、かなりうまく設計された楽器になっているようです。

まずは、発表されたばかりの歌うキーボード、CT-S1000Vについて、第一報という形での紹介となりましたが、また詳細情報が入ったら、いろいろと紹介していく予定です。

【関連情報】
CT-S1000V製品情報

【関連記事】
CASIOが間もなく、新音源方式のシンセサイザーを発表か!?

【価格チェック&購入】
◎Rock oN ⇒ CT-S1000V
◎宮地楽器 ⇒ CT-S1000V
◎OTAIRECORD ⇒ CT-S1000V
◎Amazon ⇒ CT-S1000V
◎サウンドハウス ⇒ CT-S1000V