0 はじめに 音声合成との長い関わり

エンタメ系の会社で社会人を始めたずいぶん前から、音声合成を使うことにずーっとトライしてきました。

8ビットのプロセッサでアセンブラで仕込みをしていたころ。今考えれば本当に稚拙な声しか出ませんでした。それでも世の中に声という新しい表現を届けられたことに感動。でも、ディレクターからは「これじゃない」。

 

それから結構たって。今の環境は「日本国民全員音声合成を使う」という状況に。

CPU性能も音声合成技術も向上しましたが、何より再生できるプラットフォームとしてスマホが個人に行き渡ったこと、ロボットのサービス的な使われ方の普及、スマートスピーカーの登場、などにより音声合成が活躍する場がどんどん増えているのが要因です。

 

このように、環境も体験タイミングもかなり行き渡った感があります。しかし、その中身についてはどうでしょう?最初の一回は面白い、特定の場面では使える、などまだまだ限定された状況での利用にとどまっているのではないでしょうか。

使われ方については自分が想像できるバリエーションのまだ入り口、という感覚もあります。

長年執着し続け過ぎてある種のこじらせの度が過ぎているのかもしれません。それでも、過去からの経緯を見て現在を考えると、間違いなく「その先」はあり得る、しかも自分はどうやら「その先」を見ているかもしれない、という考えから、音声合成にまつわる個人的なノウハウの棚卸をここで行いたいと思います。

 

音声合成とのかかわりで言えば、ほぼ「使用者」でした。短期間開発に関わっていたこともありますが、基本的には常に世の中のためになったり楽しくしたりするサービスやコンテンツを一生懸命考えていたような気がします。

ということで、このブログは原理や開発に関わることはあまり言及しておりません。使い方特化、とお考え下さい。