大阪電気通信大学

早坂昇

HAYASAKA Noboru

所属部署

情報通信工学部情報工学科教授
大学院工学研究科情報工学コース教授

学位など

博士（情報科学）
北海道大学

研究テーマ

音声認識を中心とする音声情報処理に関する研究とその実用化

プライベートでは研究を一切忘れて子どもとゲームに興じています。趣味はフィギュア収集でヒーローに特化した500体を所蔵。また、高校時代に一口馬主になったほどの馬好きで、スポーツ紙主催の馬の絵画コンクールで入選経験あり。

ディープラーニング悲鳴認識指書き文字深層学習画像セグメンテーション筆者照合音声認識音源分離

音声情報処理技術で
防犯や医療福祉をサポートする

さまざまな音声情報を認識・処理する技術を応用することで、防犯や医療福祉に役立てることができます。
早坂研究室では、特定の音を抽出する音源分離技術や、ネット環境に依存しないスタイルで提供するスタンドアロン型音声認識システムの開発に取り組んでいます。

ノイズに囲まれている日常空間で悲鳴を
リアルタイムで検出する

私たちは、街中であっても友達の声ならすぐに聞き分けられます。けれども、街の音を録音して聴くと、交通音・風・広告音声・他人の声や靴音など雑多な音＝ノイズが入り交じっていることがわかります。機械は特定の音のみを認識することが苦手でした。たとえば悲鳴を上げたとしても、ノイズと交じって悲鳴と認識されにくいのです。

早坂研究室では、防犯に役立てるために、ノイズの中から悲鳴を検出する研究に取り組んでいます。

まずは、悲鳴の特徴を分析するために、身の危険を感じるさまざまなシチュエーションを想像させて被験者から悲鳴を採取。この採取した悲鳴とノイズを用い、悲鳴のみを抽出するようにネットワーク(AI)を学習させます。早坂教授は、このネットワーク(AI)を使って、ノイズ交じりの悲鳴から、悲鳴だけを抽出しリアルタイムで検出することに成功。この技術の確立によって、悲鳴を検出すると警報音やランプが発動し、外部に危険を知らせることができるようになりました。

音源分離によりノイズから悲鳴のみを検出

ネット環境に依存しないスタンドアロン型は
防犯・医療福祉など、緊急事態に強い！

現在ネット環境に繋がって動作するモノのインターネット＝IoTが普及していますが、早坂研究室では、ネット環境に依存しない「スタンドアロン型」のメリットにも注目。

犯罪リスクの高い更衣室・トイレ・エレベータ等の場所で悲鳴を上げた時に、ネット環境に不具合が生じれば外部に知らせることができません。安心・安全を優先するにはスタンドアロン型は非常に有効です。同じ理由から、医療福祉の現場で使う音声操作ベッドをスタンドアロン型音声認識で実現。複数のベッドが並ぶ際に、隣の人の操作音声で誤って動作するのを防ぐため、ベッドに安価なカメラを設置し、カメラの方を向いた時のみ動作させるようにします。こんなふうに動作環境を整えれば、クラウド型で使われるトリガーワードも必要ありません。

早坂研究室では、音声研究を中心に、リアルな問題と向き合い社会をより良くすることを目指しています。ネット環境に依存しない「スタンドアロン型」をうまく活用することで、クラウド型より高性能化が難しいという課題も低コストで解決できます。音声研究が日常生活に潜む問題を解決し、緊急時にも役立つものとして社会に活かされるよう、実践的研究を行っています。

「これ」と「これ以外」を識別する技術で
フリマ出品から法科学までをサポート！

特徴を捉えて識別する技術は、音声だけでなく、画像・映像にも応用できます。現在、フリマサイトに投稿する商品画像の背景と商品を識別して正しい商品カテゴリーに自動で振り分けるシステムや、タッチパネル等の指書き文字を字の形だけでなく、書くスピードからも判定する本人認証システムなども研究中。
個人の小さなビジネスから、文書偽造を暴く法科学の分野まで、信号処理技術は、社会の動きをスムーズにしてくれそうです。