東京工業大学 情報理工学研究科 情報環境学専攻
中臺研究室のホームページです。
告知
- HRI-JPでは2009年度夏季インターンシップ募集は終了しました。 ご応募ありがとうございました。
- 詳細はこちら[PDF]をご覧ください。
what's new
- '09/07/14 09年度夏季インターンシップ募集終了のお知らせを掲載しました。
- '09/06/29 09年度夏季インターンシップ募集のお知らせを掲載しました。
- '09/04/07 ホームページの内容を更新しました。
- '07/09/26 ホームページをリニューアルしました。
研究の紹介
新しい研究領域として、「ロボット聴覚」研究を行っています。ロボット聴覚研究は、人工知能、信号処理、ロボティクスをまたがる新たな研究分野として 2000 年に提唱した分野で、近年、国内外で注目を浴びてきています。 「ロボット聴覚」では、大きなテーマとして、人が普段聞いているような音環境を、如何にロボットに理解できるようにするかという問題を扱っています。特に、ロボットでは、雑音、反響が動的に変化し、時には目的信号よりも大きくなるような劣悪な実環境でのロバスト性を実時間で扱う必要があります。こうした問題に対し、ロボットならではの動作を積極的に利用するアクティブオーディションを鍵として、音源の位置推定(音源定位)、目的音源の抽出(音源分離)、抽出音源の認識(音声認識)といった要素技術から要素技術の統合によるロバスト性向上、また、実際にこうした技術を人・ロボットコミュニケーションへ応用していく研究を行っています。
最近の研究テーマ
具体的には、以下の3つの研究を中心に進めています。
- ロボット聴覚のための要素技術の研究
- 複数音源の定位・追跡、音源分離、分離音声の音声認識
- システム統合技術研究
- 時間統合:アクティブオーディション - ロボットならではの「動作」を積極的に利用
- 空間統合:マイクロホンアレイ、複数マイクロホンアレイの統合
- マルチモーダル統合:視聴覚統合、視聴覚音声認識
- システム統合:ミッシングフィーチャ理論に基づく統合
- アプリケーション研究
- 人・ロボットコミュニケーション
- 実環境・実時間音環境理解
最近の publication
詳細な論文リストはこちら
- 村田 和真, 中臺 一博, 武田 龍, 奥乃 博, 長谷川 雄二, 辻野 広司: ビートトラッキングロボットの構築と評価, 第28回 AI チャレンジ研究会, SIG-Challenge-A802-3, 13-20, 人工知能学会, Nov. 2008.
- 村田 和真, 中臺 一博, 武田 龍, 吉井 和佳, 奥乃 博, 鳥井 豊隆, 長谷川 雄二, 辻野 広司: 人・ロボットインタラクションに向けたビートトラッキングロボットの開発とその評価, 日本ロボット学会第26回学術講演会, Sep. 2008.
- 吉田 尚水, 中臺 一博: ロボット聴覚のための音声発話区間検出の検討, 日本ロボット学 会第26回学術講演会, Sep. 2008.
- 村田 和真, 吉井 和佳,奥乃 博,鳥井 豊隆,中臺 一博, 長谷川 雄二: ロボットによるビートトラッキングにおける周期性自己発生音の影響評価, SICE システムインテグレーション部門大会 SI 2007,Dec. 2007.
- 小岩 智明,中臺 一博,井村 順一: 視聴覚音声認識における唇検出手法の検討, SICE システムインテグレーション部門大会 SI 2007, Dec. 2007.
- 小岩 智明, 中臺 一博, 井村 順一: ロボットを対象とした視聴覚音声認識の検討: 音素・口形素グルーピングとミッシングフィーチャー理論に基づくアプローチ, 日本ロボット学会第25回大会, Sep. 2007.
- 中臺 一博, 辻野 広司: 指向性スピーカを用いたロボット音声インタフェースの提案, ヒューマンインターフェース学会誌, Vol.8, No.2, 2006. (in print)
- Kazuhiro Nakadai, Hirofumi Nakajima, Masamitsu Murase, Satoshi Kaijiri, Kentaro Yamada, Takahiro Nakamura, Yuji Hasagawa, Hiroshi G. Okuno, Hiroshi Tsujino: ROBUST TRACKING OF MULTIPLE SOUND SOURCES BY SPATIAL INTEGRATION OF ROOM AND ROBOT MICROPHONE ARRAYS, IEEE International Conference on Acoustics, Speech, Signal Processing (ICASSP 2006), SAM-P1.8, 2006.
- 小岩智明, 中臺一博, 井村順一: 視覚音声認識における口形素グループの検討, システムインテグレーション部門大会 SI 2006, 計測自動制御学会, Dec. 2006.
- 山本 俊一, 中臺 一博, 辻野 広司, 奥乃 博: ミッシングフィーチャ理論を利用した音源分離と音声認識のインターフェースと複数ロボットへの適用, 日本ロボット学会誌, Vol.23, No.6, pp.743-751, 2005.
- Kazuhiro Nakadai, Daisuke Matsuura, Hiroshi G. Okuno and Hiroshi Tsujino: Improvement of Recognition of Simultaneous Speech Signals Using AV Integration and Scattering Theory for Humanoid Robots, Speech Communication, Vol.44, pp. 97-112, 2004.
- Hiroshi G. Okuno, Kazuhiro Nakadai and Hiroaki Kitano: Effects of Increasing Modalities in Recognizing Three Simultaneous Speeches, Speech Communication, Vol.43, No.4, pp.347-359, 2004.
- 中臺 一博, 日台 健一, 溝口 博, 奥乃 博, 北野 宏明: ヒューマノイドを対象にした視聴覚統合による実時間人物追跡 ? アクティブオーディションと顔認識の統合 ?, 日本ロボット学会誌, Vol.21, No.6, pp.517-525, 2003
- 中臺 一博, 奥乃 博, 北野 宏明: ヒューマノイドにおける聴覚機能の課題とアクティブオーディションによる音源定位, 人工知能学会論文誌, Vol. 18, No. 2-F, pp.104-113, 2003.
受賞歴
- 小岩 智明, 中臺 一博, 井村 順一: (社)計測自動制御学会 第7回システムインテグレーション部門 講演会SI-2006 ベストセッション賞「視覚音声認識における口形素グループの検討」.
- Kazumasa Murata, Kazuhiro Nakadai, Kazuyoshi Yoshii, Ryu Takeda, Toyotaka Torii, Hiroshi G. Okuno, Yuji Hasegawa, Hiroshi Tsujino: A Robot Uses Its Own Microphone to Synchronize Its Steps to Musical Beats While Scatting and Singing, Award for Entertainment Robots and Systems (NTF Award) Nomination Finalist, IEEE/RSJ IROS-2008, Nice, Sep. 2008.
研究室紹介
2006年度に発足した新しい研究室です。ロボットの聴覚に関する研究を核に、様々な技術や理論を如何にロボットへ適用し、知能を実現していくのかをテーマにしています。
私が HRI-JP と兼務で大学に籍を置いている関係で、あまり頻繁には研究室には顔を出すことはできません(週一度程度)。実際には、井村研、早川研 と協力しながら研究室運営を行っています。その代わりに、本研究室に配属希望の方は、HRI-JP(埼玉県和光市)にときどき来ていただき、そこで研究を進めていくことも可能な体制を整えています。将来的に企業で働こうと考えている方や企業の基礎研究機関がどのようなものか興味のある方は、企業の研究者とのふれあいを通じて、様々なことを吸収できるチャンスだと思います。