愛知工科大学 工学部

實廣 貴敏

實廣 貴敏 Jitsuhiro Takatoshi


  • 所属:工学部 情報メディア学科
  • 職名:准教授
  • 最終学歴:奈良先端科学技術大学院大学 情報科学研究科 博士後期課程
  • 学位:博士(工学) (奈良先端科学技術大学院大学)
  • 職歴:1993年4月 日本電信電話株式会社 ヒューマンインタフェース研究所(のちサイバースペース研究所)/2000年4月 株式会社 国際電気通信基礎技術研究所[ATR] 出向/2008年4月 愛知工科大学情報メディア学科 准教授(兼 2009年4月~2015年3月 名古屋大学大学院情報科学研究科 武田研究室 特任准教授)
  • 所属学会:日本音響学会/電子情報通信学会/情報処理学会/IEEE/ISCA
  • 学会および社会活動:平成25年~ 日本音響学会編集委員会論文部会委員
  • 受賞:2007年 電気通信普及財団賞(テレコムシステム技術賞)
  • 主な著書:Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: An analysis of the speech under stress using the two-mass vocal fold model, Proceedings of the Paralinguistic Information and Its Integration in Spoken Dialogue Systems Workshop, Ramon Lopez-Cozar Delgado, Tetsunori Kobayashi eds., pp.57-62 (2011).

写真:實廣 貴敏

教育・研究テーマ


  • 担当科目:[学部] AUT教育入門/コンピュータリテラシー/統計と確率の手法/マルチメディア工学/デジタル信号処理/音声情報処理/情報メディア実験II/情報セミナー/卒業研究/[大学院] 音声・音響情報処理
  • 研究分野:音声情報処理
  • 研究課題:音声認識技術を軸とした音声対話システムに関連する技術の研究/音声認識の前処理としての雑音抑圧手法,音声認識精度の向上,新たな音声対話システムの提案/音楽アプリ/環境音認識とその応用など

主な学術論文

査読有り


  • Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Modeling of Physical Characteristics of Speech under Stress, IEEE Signal Processing Letters, Vol.22, Issue.10, pp.1801-1805 (2015).
  • Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Classification of speech under stress based on physical modeling, Acoustical Science and Technology, vol.34, no.5, pp.311-321 (2013).
  • Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Classification of speech under stress based on modeling of the vocal folds and vocal tract, EURASIP Journal on Audio, Speech, and Music Processing, 2013:17 (2013).
  • C. T. Ishi, Shigeki Matsuda, Takayuki Kanda, Takatoshi Jitsuhiro, Hiroshi Ishiguro, Satoshi Nakamura, Norihiro Hagita: A Robust Speech Recognition System for Communication Robots in Noisy Environments, IEEE Trans. Robotics, vol.24, no.3, pp.759-763 (2008).
  • 實廣貴敏,鳥山朋二,小暮 潔: 実環境下音声認識のためのパーティクルフィルタを統合した複数モデル雑音抑圧手法, 電子情報通信学会論文誌D, vol. J91-D, no.10, pp.2519-2528 (2008).
  • T. Jitsuhiro, T. Toriyama, K. Kogure: Noise Suppression Based on Multi-Model Compositions Using Multi-Pass Search with Multi-Label N-gram Models, IEICE Trans. Inf. & Syst., vol. E91-D, no.3, pp.402-410 (2008).
  • Shigeki Matsuda, Takatoshi Jitsuhiro, Konstantin Markov, Satoshi Nakamura: ATR Parallel Decoding Based Speech Recognition System Robust to Noise and Speaking Styles, IEICE Trans. Inf. & Syst., vol. E89-D, no.3, pp.989-997 (2006).
  • Satoshi Nakamura, Konstantin Markov, Hiromi Nakaiwa, Genichiro Kikui, Hisashi Kawai, Takatoshi Jitsuhiro, Jin-Song Zhang, Hirofumi Yamamoto, Eiichiro Sumita, Seiichi Yamamoto: The ATR Multilingual Speech-to-Speech Translation System, IEEE Trans. on Audio, Speech and Language Processing, Vol.14, No.2, pp.365-376 (2006).
  • 實廣貴敏,松田繁樹,葦苅 豊,中村 哲,矢入(江口)郁子,猪木誠二: 歩行者支援地理情報システムにおける音声入力インタフェースと高齢者に対するその評価, ヒューマンインタフェース学会論文誌, vol.8, no.2, pp.271-282 (2006).
  • Takatoshi Jitsuhiro, Satoshi Nakamura: Automatic Generation of Non-uniform and Context-Dependent HMMs Based on the Variational Bayesian Approach, IEICE Trans. Inf. & Syst., vol. E88-D, no. 3, pp. 391-400 (2005).
  • Takatoshi Jitsuhiro, Tomoko Matsui, Satoshi Nakamura: Automatic Generation of Non-uniform HMM Topologies Based on the MDL Criterion, IEICE Trans. Inf. & Syst., vol. E87-D, no. 8, pp. 2121-2129 (2004).
  • Takatoshi Jitsuhiro, Hirofumi Yamamoto, Setsuo Yamada, Genichiro Kikui, Yoshinori Sagisaka: Language Modeling Using Patterns Extracted from Parse Trees for Speech Recognition, IEICE Trans. Inf. & Syst., vol.E86-D, no.3, pp.446-453 (2003).
  • 實廣貴敏, 高橋 敏, 相川清明: 単語音声認識における音素信頼度ゆう度を用いた未知語のリジェクション, 電子情報通信学会論文誌 D-II, vol. J83-D-II, no.2, pp.478-485 (2000).

紀要

  • 實廣貴敏: 愛知工科大学でのスマートフォン・アプリ開発およびアプリ開発講習会, 愛知工科大学紀要, 第13巻, pp.45—51 (2016).

その他

国際会議発表

  • Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Classification of speech under stress by modeling the aerodynamics of the laryngeal ventricle, Proc. of INTERSPEECH2013, pp.837-841 (2013).
  • Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Estimation of vocal tract parameters for the classification of speech under stress, Proc. of ICASSP2013, pp.7532-7536 (2013).
  • Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Physical Characteristics of Vocal Folds during Speech under Stress, Proc. of ICASSP2012, pp.4609-4612 (2012).
  • Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Classification of Stressed Speech Using Physical Parameters Derived from Two- Mass Model, Proc. of INTERSPEECH2012 (2012).
  • Kotaro Ogino, Takatoshi Jitsuhiro, Chiyomi Miyajima, Kazuya Takeda: Analyzing Grasping for Inferring Cognitive States of users, Proc. of ICASSP2010, pp.2230-2233 (2010).
  • T. Jitsuhiro, T. Toriyama, K. Kogure: Multi-model Noise Suppression Using Particle Filtering, Proc. of ICASSP2008, pp.4397-4400 (2008).
  • T. Jitsuhiro, T. Toriyama, K. Kogure: Robust Speech Recognition Using Noise Suppression Based on Multiple Composite Models and Multi-Pass Search, 2007 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU2007), pp.53-58 (2007).
  • T. Jitsuhiro, T. Toriyama, K. Kogure: Noise Suppression Using Search Strategy with Multi-Model Compositions, Proc. of INTERSPEECH2007, pp.1078-1081 (2007).
  • W. Herbordt, T. Horiuchi, M. Fujimoto, T. Jitsuhiro, S. Nakamura: Hands-Free Speech Recognition and Communication on PDAs Using Microphone Array Technology, Proc. of ASRU2005, pp.302-307 (2005).
  • Takatoshi Jitsuhiro, Shigeki Matsuda, Yutaka Ashikari, Satoshi Nakamura, Ikuko Eguchi Yairi, Seiji Igi: Spoken Dialog System and Its Evaluation of Geographic Information System for Elderly Persons' Mobility Support, Proc. of INTERSPEECH2005, pp.197-200 (2005).
  • Shigeki Matsuda, Takatoshi Jitsuhiro, Konstantin Markov, Satoshi Nakamura: Speech Recognition System Robust to Noise and Speaking Styles, Proc. of INTERSPEECH2004 (ICSLP) (2004).
  • Takatoshi Jitsuhiro, Satoshi Nakamura: Increasing the Mixture Components of Non-Uniform HMM Structures Based on a Variational Bayesian Approach, Proc. of INTERSPEECH2004 (ICSLP), vol.1, pp.697-700 (2004).
  • Takatoshi Jitsuhiro, Satoshi Nakamura: Automatic Generation of Non-Uniform HMM Structures Based on Variational Bayesian Approach, Proc. of ICASSP2004, vol.I, pp.805-808 (2004).
  • Takatoshi Jitsuhiro, Satoshi Nakamura: Variational Bayesian Approach for Automatic Generation of HMM Topologies, Proc. of 2003 IEEE Workshop on ASRU, pp.77-82 (2003).
  • Takatoshi Jitsuhiro, Tomoko Matsui, Satoshi Nakamura: Automatic Generation of Non-Uniform Context-Dependent HMM Topologies Based on The MDL Criterion, Proc. of EUROSPEECH2003, vol.4, pp.2721-2724 (2003).
  • Takatoshi Jitsuhiro, Tomoko Matsui, Satoshi Nakamura: A Successive State Splitting Algorithm Based on The MDL Criterion by Data-driven and Decision Tree Clustering, Proc. of SSPR2003, pp.43-46 (2003).
  • Takatoshi Jitsuhiro, Hirofumi Yamamoto, Setsuo Yamada, Yoshinori Sagisaka: New Language Models Using Phrase Structures Extracted From Parse Trees, Proc. EUROSPEECH2001, vol.1, pp.697-700 (2001).

国内会議発表

  • 井上拓哉, 實廣貴敏: iBeaconを利用した音声対話システムの提案, 日本音響学会2015年秋季研究発表会講演論文集, (2015.9).
  • Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Classification of speech under stress using physical features based on two-mass model, 電子情報通信学会 技術報告, vol.112, no.450, SP2012-128, pp.47-52 (2013).
  • 李津, 實廣貴敏, 武田一哉: 単一マイクロホンによる音響モデルを用いた発話者までの距離推定, 日本音響学会2013年春季研究発表会講演論文集, pp.29-30 (2013.3).
  • Yao Xiao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Detection for stressed speech based on two-mass model, 日本音響学会2012年春季研究発表会講演論文集, pp.3-6 (2012.3).
  • Yao Xiao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: Evaluation for vowel-independent classification of speech under stress based on interaction between the vocal folds and the vocal tract, 日本音響学会2012年秋季研究発表会講演論文集, pp.269-272 (2012.9).
  • 李津, 實廣貴敏: 音響モデルを用いた発話者までの距離推定, 平成24年度 電気関係学会東海支部連合大会, I3-8 (2012.9).
  • 真野雄大, 五十右準, 實廣貴敏, 小暮 潔: 2種類のマイクロホンを利用して自動同期しつつ雑音抑圧する手法, 日本音響学会2011年春季研究発表会講演論文集, pp.155-156 (2011.3).
  • Yao Xiao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda: On the Use of the Two-Mass Vocal Cord Model in Characterizing the Stress Speech, 電子情報通信学会 技術報告, vol.111, no.97, SP2011-36, pp.35-40 (2011.6).
  • 荻野恒太郎, 實廣貴敏, 宮島千代美, 武田一哉: 把持動作から認知状態を推定するための信号処理手法の検討, 電子情報通信学会研究報告, vol.109, no.374, PRMU2009-156, pp.1-6 (2010).
  • 實廣貴敏, 小暮 潔: 装着型および環境設置型マイクロホンを用いた音声認識のための雑音抑圧手法, 日本音響学会2009年春季研究発表会講演論文集, pp.151-152 (2009).
  • 荻野恒太郎, 實廣貴敏, 宮島千代美, 武田一哉: 認知状態識別のための把持ヤコビ行列の特徴抽出, 電子情報通信学会2009基礎・境界ソサエティ大会A-4-4, p.67 (2009).
  • 實廣貴敏,鳥山朋二,小暮 潔: 非定常雑音を考慮した複数モデル雑音抑圧手法, 日本音響学会2008年春季研究発表会講演論文集, pp.31-34 (2008).
  • 實廣貴敏,鳥山朋二,小暮 潔: パーティクルフィルタを統合した複数雑音モデル合成による雑音抑圧手法, 電子情報通信学会 言語理解とコミュニケーション(NLC)研究会,音声(SP)研究会, vol.107, no.406, NLC2007-66, SP2007-129, 情処処理学会 音声言語情報処理(SLP)研究会, vol.2007, no.129, 2007-SLP-69, pp.195-200 (2007).
  • 實廣貴敏, 鳥山朋二, 小暮 潔: 複数雑音合成モデルによるマルチパス探索に基づく雑音抑圧手法, 日本音響学会2007年秋季研究発表会講演論文集, pp.151-154 (2007).
  • 實廣貴敏, 鳥山朋二, 小暮 潔: 複数の雑音合成モデルを用いた探索に基づく雑音抑圧手法, 電子情報通信学会研究報告, vol.SP2007-16, pp.49-54 (2007).
  • 石井カルロス寿憲,松田繁樹,神田崇行,實廣貴敏,石黒浩,中村哲,萩田紀博: コミュニケーションロボットの音声認識システムの実環境における評価, 第24回AIチャレンジ研究会, 人工知能学会研究会資料, SIG-Challenge-06 (2006).
  • 實廣貴敏, 小作浩美, 鳥山朋二, 小暮潔: E-NIGHTINGALEプロジェクトにおける音声認識タスクの分析および初期評価, 日本音響学会2006年秋季研究発表会講演論文集, 2-P-24, pp.141-142 (2006.9).
  • 松田繁樹, 實廣貴敏, 中村 哲, 石井カルロス寿憲, 神田崇行: コミュニケーションロボットにおける音声認識性能の評価, 日本音響学会2006年秋季研究発表会講演論文集, 2-P-22, pp.137-138 (2006.9).
  • 實廣貴敏, 松田繁樹, 藤本雅清, Wolfgang Herbordt, 堀内俊治, 中村 哲: ATRにおける日本語音声認識の評価—日本語音響モデル—, 日本音響学会2006年春季研究発表会講演論文集, vol.1, 1-P-21, pp.185-186 (2006.3).
  • 松田繁樹, 實廣貴敏, Konstantin Markov, 中村 哲: パラレルデコーディングを基礎としたATR音声認識システム, 日本音響学会2006年春季研究発表会講演論文集, vol.1, 1-P-26, pp.195--196 (2006.3).
  • 實廣貴敏, 松田繁樹, 葦苅 豊, 中村 哲, 矢入(江口)郁子, 猪木誠二: 歩行者支援地理情報システムにおける音声入力の高齢者に対する評価および対話実験, 日本音響学会2005年秋季研究発表会講演論文集, vol.1, 1-7-15, pp.21-22 (2005.9).
  • W. Herbordt, T. Horiuchi, M. Fujimoto, T. Jitsuhiro, S. Nakamura: Noise-Robust Hands-Free Speech Recognition on PDAs Using Microphone Array Technology, 日本音響学会2005年秋季研究発表会講演論文集, vol.1, 3-7-20, pp.141-142 (2005.9).
  • 實廣貴敏, 松田繁樹, 葦苅 豊, 中村 哲, 矢入(江口)郁子, 猪木誠二: 高齢者を対象とした音声入力インタフェース評価および対話実験, 情報処理学会研究報告, 音声言語情報処理研究会 (SLP) , 2005-SLP-58, pp.19-24 (2005).
  • 實廣貴敏, 松田繁樹, 水町光徳, 葦苅 豊, 中村 哲, 矢入(江口)郁子, 猪木誠二: 歩行者支援GISにおける耐雑音性音声入力インタフェース, Proc. of Human Interface 2004, pp.647-652 (2004).
  • 實廣貴敏, 松田繁樹, 水町光徳, 葦苅 豊, 中村 哲, 矢入(江口)郁子, 猪木誠二: 歩行者支援GISにおける音声入力インタフェースの検討, 電子情報通信学会研究報告, vol.104, no.234, NLC2004-1, WIT2004-28, pp.1-6 (2004).
  • 實廣貴敏, 中村 哲: 時間方向分割も考慮した変分ベイズ法による音響モデル作成方法, 日本音響学会春季研究発表会講演論文集, vol.1, pp.17-18 (2004).
  • 實廣貴敏, 中村 哲: 変分ベイズを用いた逐次状態分割法, 電子情報通信学会研究報告, vol.103, no.519, NLC2003-57, SP2003-120, pp.43-48 (2003).
  • 實廣貴敏, 松井知子, 中村 哲: MDL規準を用いた逐次状態分割法による音響モデル自動構造決定, 電子情報通信学会研究報告, vol.NLC2002-50, SP2002-127, pp.37-42 (2002).
  • 實廣貴敏, 松井知子, 中村 哲: MDL規準を用いた逐次状態分割法, 日本音響学会2002年秋季研究発表会講演論文集, vol.1, pp.41-42 (2002.9).
  • 實廣貴敏, 山本博史, 菊井玄一郎: 用例型構文解析による句構造情報を利用した言語モデル, 日本音響学会2002年春季研究発表会講演論文集, vol.1, pp.159-160 (2002.3).
  • 實廣貴敏, 山本博史, 山田節夫, 匂坂芳典: 句構造間の関係を反映した言語モデル, 日本音響学会2001年春季研究発表会講演論文集, vol.1, pp.195-196 (2001.3).

競争的資金獲得状況

  • 音声対話システムを対象とした雑音に頑健な話者までの距離推定の研究, 科学研究費補助金(基盤研究C), 2014-2017, 研究代表者
  • 音声対話システムにおける音に着目した周囲状況推定技術の研究, 科学研究費補助金(基盤研究C), 2011-2013, 研究代表者
  • 装着型および環境設置型マイクロホンを用いた実環境下での音声認識, 科学研究費補助金(基盤研究C), 2008-2010, 研究代表者

特許登録(国内)

  • 特許3378547:音声認識方法及び装置,實廣 貴敏, 川端 豪, 今村 明弘,
  • 特許3496706:音声認識方法及びそのプログラム記録媒体,實廣 貴敏, 高橋 敏, 相川 清明

コンテンツサイトマップ -

PAGE TOP