初音ミクの歌声はなぜ人々の心をつかむのか。「生みの親」であるクリプトン・フューチャー・メディア創業者の伊藤博之さんは「クリエイターが脈々と創り上げてきた楽曲から感じるエモさなのかもしれないけれど、ひょっとしたら、人ではない歌声そのものが持つ儚さなのかもしれない」という――。

※本稿は、伊藤博之著、柴那典聞き手・構成『創作のミライ 「初音ミク」が北海道から生まれたわけ』(中央公論新社)の一部を再編集したものです。
■北海道を応援する「雪ミク」の誕生
僕が北海道にずっといて、クリプトンはずっと札幌にある。そこからいろいろなつながりが生まれてきました。そのひとつの結果として、北海道を応援するキャラクターの「雪ミク」の誕生があります。
雪ミクが生まれたきっかけは「さっぽろ雪まつり」です。さっぽろ雪まつりをご存じの方は多いと思いますが、1950年から続く冬のお祭りで、毎年大小さまざまな雪像が札幌の中心部の大通(おおどおり)公園に並びます。
2010年のさっぽろ雪まつりで初音ミクを雪像化することになり、その“真っ白い初音ミク”のイメージから「雪ミク」が生まれました。せっかくなので、ただ雪像を創るだけでなく、同じ期間にイベントなどの企画も実施しようということになった。そこで始めたのが「SNOW MIKU」というフェスティバルです。フェスティバルの集客によって、冬の北海道をさらに盛り上げたいという思いがありました。
■クリエイターが力を発揮できる場を設ける
翌年以降のさっぽろ雪まつりでは「雪ミク」としての雪像を展示するようになり、「SNOW MIKU」も雪ミクが北海道を応援するフェスティバルとして毎年恒例になりました。2012年からは「SNOW MIKU」で雪ミクが着る衣装デザインを公募するようになり、毎年テーマに沿ってインターネット上で広く募集しています。

たとえば、2015年のテーマは「北海道の冬をイメージした『植物』」でスズランをモチーフにしたデザインが、2024年のテーマは「北海道の冬をイメージした『ごちそう』」でスープカレーをモチーフにしたデザインが選ばれました。選ばれた衣装デザイン姿の雪ミクは、フェスティバルのメインビジュアルに採用されますし、フィギュアとして商品化されるのが恒例です。こうした地域振興を目的とした企画においても、クリエイターがクリエイティビティを発揮できる場を必ず設けるようにしています。
また、冬以外にも雪ミクを通して北海道に興味を持ってもらうべく、2014年には北海道の新千歳(しんちとせ)空港内に雪ミクのショップ&ミュージアムとして「雪ミク スカイタウン」をオープンしました。
現在では冬に限らず活動するようになっており、北海道を盛り上げる各種取り組みのアンバサダーを務め、企業やキャラクターとのコラボレーションを行うなど、応援の場を多方面に広げています。最近では小樽(おたる)、函館(はこだて)、三笠(みかさ)など、札幌市外でイベントを展開する機会も増えています。
初音ミクで得た成果を地元である北海道に還元したいという思いで、これからも雪ミクをはじめとしたローカルプロジェクトを展開していくつもりです。
■AI技術の発展が与える影響
AIはこれからの世の中を大きく変えていくでしょう。
音楽の分野でも、AI技術は目覚ましく発展しています。人間と機械の垣根があいまいになっている。そういうことはすでに起こっています。
たとえば、ピアノやドラムやバイオリンなどの楽器の音色は、すでにバーチャルなソフトウェア音源で再現できるようになっています。
そうした音源の演奏性能はちょっと聴いたくらいでは本物と区別がつかないくらい。歌声は難易度が高かったのですが、ここにきてAIによる歌声合成技術が大きな進歩を遂げている。かなりの精度で人間らしい歌声を再現できるようになっています。
そういう中で、初音ミクのような歌声合成ソフトウェアはどういう位置づけの存在になっていくのか。
そこでヒントになるのは、ギターの技術進化の歴史です。エレキギターのジャジーな、少しブルージーな音色の正体はギターのボディについているピックアップによるものです。ピックアップはギターの弦の振動を電気信号に変換する役割を果たしていて、そこで変換された信号がシールドケーブルを通ってアンプに送られて音が出るという仕組みになっている。弦の小さな音を拾うマイクロフォンのようなものです。
■初音ミクはなぜエモいのか
エレキギターの世界では、1950年代にギブソンというギターメーカーが「PAF」(製品に貼られた特許出願中を意味する“Patent Applied For”のステッカーに由来)というピックアップをつくったのですが、それがいまもリファレンス(参照)されています。いわゆるビンテージの楽器だけでなく、いろんなメーカーがつくっているギターもPAFを参考にしている。ジャズやブルースのジャンルでは、その音色はいわばお手本です。
それは、オーディオのクオリティとして考えるならば、決して「いい音」ではありません。
ちょっと歪(ひず)んでいる。けれど、その歪んだ感じが味わいになっている。PAFを搭載したギターを使って弾いた曲のフレーズがリスナーの心に染み付いている。だから、決してそれを歪んだ音とは思わず、ジャジーな、ブルージーな音というふうに感じている。
歌声合成ソフトウェアにも、それと似たようなところがあるのではないでしょうか。
特に初音ミクの歌声には、エモさがある。それはクリエイターが脈々と創り上げてきた楽曲から感じるエモさなのかもしれないけれど、ひょっとしたら、人ではない歌声そのものが持つ儚(はかな)さなのかもしれないとも思います。
■非現実的な、非人格的な歌唱
歌声合成ソフトウェアの歌声は決して人間の声そのままではなく、人とシンセサイザーのハイブリッドというべき、非現実的な、非人格的な歌唱というものです。そこがエモさにつながっているのかもしれない。それは、ギブソンのPAFが持つ、歪みにすら人が愛おしさを感じてしまうような音色の美しさに通じるものだと思います。
別の喩えをするなら、それはグランドピアノとエレクトリックピアノ(エレピ)の対比に近いところもあるかもしれません。エレピは基本的にピアノと同じような機構を持っていて、鍵盤を弾くとハンマーが弦を叩いて音を鳴らし、それをピックアップで拾って増幅するという仕組みになっています。
グランドピアノに比べると筐体(きょうたい)は小さく、生音も小さく、けれどもアンプからは大きな音を鳴らすことができる。そういうニーズから生まれた楽器です。
でも、あの音色もエモいですよね。特にローズ・ピアノなどは、ジャズやブルースやソウルの数々の名曲に使われてきました。そういうエレピに対してグランドピアノの簡易版とは誰も思わない。まったく別の価値を持つものとして愛されている。
■人に近づくことがゴールではない
初音ミクは人に近づいていくというところがゴールではないと思います。音声ライブラリを収録した声優さんの声を再現できるように頑張ろうと進めていくと、それは初音ミクではないのかもしれない。完全に人間と同じになってしまうと、それが初音ミクであるという識別も怪しくなってしまう。ほどよく初音ミクらしさが残った状態での歌唱が維持されるということが重要なのではないかと思います。
初音ミク特有の歌声が、そのキャラクター性を形づくっているのは事実なので、それを保持することは必要です。ただ、ビブラートや歌いまわしなどは、人間が手作業で調整している。
それが自動的に実現できるようになると、より初音ミクらしく、よりなめらかに歌わせることができる。そういうアップデートはめざしていきたいと思っています。

----------

伊藤 博之(いとう・ひろゆき)

クリプトン・フューチャー・メディア代表取締役

北海学園大学経済学部卒業。北海道大学工学部職員を経て、1995年7月にクリプトン・フューチャー・メディアを創業。「初音ミク」「鏡音リン・レン」など数々のヒット商品を生み出した。2013年、藍綬褒章を受章。

----------
----------

柴 那典(しば・とものり)

音楽ジャーナリスト

1976年生まれ。ロッキング・オン社を経て独立。雑誌、ウェブ、モバイルなど各方面にて編集とライティングを手がける。『ヒットの崩壊』(講談社現代新書)、『平成のヒット曲』(新潮新書)など著書多数。ブログ「日々の音色とことば」Twitter:@shiba710

----------

(クリプトン・フューチャー・メディア代表取締役 伊藤 博之、音楽ジャーナリスト 柴 那典)
編集部おすすめ