福岡大学 准教授 髙橋伸弥様
2000年に九州大学 システム情報科学研究科知能システム学 博士課程修了。音声メディアを中心に人工知能技術を応用した様々な研究を行ない、現在は、ミツバチの行動を観察・分析するためのシステムの開発や、火山の観光ガイドを目的としたジオパーク向けアプリの開発にも力を注いでいる。
先生の研究内容について教えてください
わたしたちの生活にすっかり浸透した「OK Google」や「Siri」が代表例ですが、人間と自然な会話ができるコンピュータシステムを、人工知能技術を使ってつくる研究をしています。
わたしたちが「OK Google、〇〇して」と話しかけた時、機械は「今、Googleって呼ばれたぞ」と認識をするのですが、その認識対象は、人間が事前に入力をしておく必要があります。また現状では基本的に一問一答形式で、機械はさっき話したことなんてすぐに忘れてしまいます。こういった人間にはできて機械にはまだ難しいことを実現するためには、対話の流れをどういう風に処理をしていくかがカギになります。
また、昔の機械が発するたどたどしい合成音声に比べたら、随分、流ちょうにしゃべるようになりましたが、イントネーションなど改善点はまだまだあり、もっとナチュラルに話せる機械をつくれたらと思っています。
このような音声メディア研究を中心に、画像や映像、文章などいろいろ扱う研究をしています。
音声メディアの分野における、これからの可能性について教えてください
いくつかありますが、そのうちの1つに福岡大学病院 耳鼻咽喉科の先生と共同で行なっている、音を聞き取りやすくする補聴器の仕組みづくりについて研究をしています。メガネと違って補聴器は心理的に抵抗があるのか、装着するのを敬遠する人が多いんです。補聴器って意外と高くて最高級のものだと50万円くらいしますし、10~20万円するものでも、人によっては聞きづらさがあるんですよね。
耳が悪い人に対して「ボリュームを上げれば聞こえる」と勘違いしている人も多いのですが、高齢になるとサ行やタ行など特定の周波数だけ聞こえづらくなったりします。10代の人には聞こえるモスキート音が、30代になると聞こえる人と聞こえない人に分かれてしまうのと一緒で、人は年齢とともに高い音がだんだん聞こえづらくなるもの。
例えば、その人にとって聞こえづらい音だけ自動的に変換して聞こえやすくしたり、活舌が悪い人の声を変換して聞き取りやすくするなど、オシャレな若い人でも使ってもらえる補聴器をつくれば、補聴器に対するハードルも下がるはず。
スマホには一昔前のスーパーコンピュータ並みの性能が搭載されているので、スマホを使って実現できないかと研究と実験を繰り返しています。
弊社のディープラーニングを購入後、お仕事のスピードに何か変化はありましたか?
以前は3日間かかっていた作業が、機械を導入したことで3時間ほどに短縮されたので大変助かっています。
生物を研究している福大の先生とミツバチの1日の行動を追跡する研究をしているのですが、もともとは、学生が映像を見て記録を取っていたんです。
しかし、この方法だと手作業だし時間がかかる。コンピュータを使ってもっと効率化できないか? と画像処理と信号処理などディープラーニングを使い始めたおかげで研究の精度が上がりました。
AIの良さってなんだと思いますか?
AIでできるコトを増やすことで、人間の仕事を奪ってしまうのではないかと危惧されていますが、人工知能と言えども映画に出てくるような優れたAIは50年経ってもできないんじゃないかと思います。
むしろAIを活用することで、人間が気づかなかったことをすぐに見つけてくれたりと、どの業界においても有効活用できるのがAI。
AIにがんばってもらうために、僕たち研究者がAIの能力(技術)を高める研究をしています。
アプライドに注文して良かったと思う点は、何かありますか?
購入後にGPUを2枚追加し、メモリも増やしてもらったのですが、依頼してから僕の手元に届くまでほとんど待つことはなく、素早い対応で助かりました。メーカーの方に修理をお願いすると、大抵、遠くにある工場へ持って行って、そこで修理をしてまたこちらに戻って来るので時間がかかるのですが、アプライドは博多店に工場を併設しているそうで、そこで作業をされたと聞きました。
地場企業ならではの強みかもしれませんが、実は今回依頼したのは、学内でアプライドの評判が良く、うちの大学の先生からアプライドにお願いして良かったという話を何人かから聞いたからなんです。アプライドの機械のおかげで、「働き方改革」ならぬ「研究の仕方改革」が進んでいます。