さまざまな音声情報を認識・処理する技術を応用することで、防犯や医療福祉に役立てることができます。
早坂研究室では、特定の音を抽出する音源分離技術や、ネット環境に依存しないスタイルで提供するスタンドアロン型音声認識システムの開発に取り組んでいます。
私たちは、街中であっても友達の声ならすぐに聞き分けられます。けれども、街の音を録音して聴くと、交通音・風・広告音声・他人の声や靴音など雑多な音=ノイズが入り交じっていることがわかります。機械は特定の音のみを認識することが苦手でした。たとえば悲鳴を上げたとしても、ノイズと交じって悲鳴と認識されにくいのです。
早坂研究室では、防犯に役立てるために、ノイズの中から悲鳴を検出する研究に取り組んでいます。
まずは、悲鳴の特徴を分析するために、身の危険を感じるさまざまなシチュエーションを想像させて被験者から悲鳴を採取。この採取した悲鳴とノイズを用い、悲鳴のみを抽出するようにネットワーク(AI)を学習させます。早坂教授は、このネットワーク(AI)を使って、ノイズ交じりの悲鳴から、悲鳴だけを抽出しリアルタイムで検出することに成功。この技術の確立によって、悲鳴を検出すると警報音やランプが発動し、外部に危険を知らせることができるようになりました。
現在ネット環境に繋がって動作するモノのインターネット=IoTが普及していますが、早坂研究室では、ネット環境に依存しない「スタンドアロン型」のメリットにも注目。
犯罪リスクの高い更衣室・トイレ・エレベータ等の場所で悲鳴を上げた時に、ネット環境に不具合が生じれば外部に知らせることができません。安心・安全を優先するにはスタンドアロン型は非常に有効です。同じ理由から、医療福祉の現場で使う音声操作ベッドをスタンドアロン型音声認識で実現。複数のベッドが並ぶ際に、隣の人の操作音声で誤って動作するのを防ぐため、ベッドに安価なカメラを設置し、カメラの方を向いた時のみ動作させるようにします。こんなふうに動作環境を整えれば、クラウド型で使われるトリガーワードも必要ありません。
早坂研究室では、音声研究を中心に、リアルな問題と向き合い社会をより良くすることを目指しています。ネット環境に依存しない「スタンドアロン型」をうまく活用することで、クラウド型より高性能化が難しいという課題も低コストで解決できます。音声研究が日常生活に潜む問題を解決し、緊急時にも役立つものとして社会に活かされるよう、実践的研究を行っています。
特徴を捉えて識別する技術は、音声だけでなく、画像・映像にも応用できます。現在、フリマサイトに投稿する商品画像の背景と商品を識別して正しい商品カテゴリーに自動で振り分けるシステムや、タッチパネル等の指書き文字を字の形だけでなく、書くスピードからも判定する本人認証システムなども研究中。
個人の小さなビジネスから、文書偽造を暴く法科学の分野まで、信号処理技術は、社会の動きをスムーズにしてくれそうです。
各種取材や研究に関することなど、
お気軽にお問い合わせください