神戸大学附属図書館デジタルアーカイブ
入力補助
English
カテゴリ
学内刊行物
ランキング
アクセスランキング
ダウンロードランキング
https://doi.org/10.24546/81011451
このアイテムのアクセス数:
12
件
(
2024-04-20
09:24 集計
)
閲覧可能ファイル
ファイル
フォーマット
サイズ
閲覧回数
説明
81011451 (fulltext)
pdf
8.36 MB
18
メタデータ
ファイル出力
メタデータID
81011451
アクセス権
open access
出版タイプ
Version of Record
タイトル
Convolutional Neural Networkを用いた構音障害者の音声認識
その他のタイトル
Dysarthric speech recognition using Convolutional Neural Network
著者
吉岡, 利也 ; 中鹿, 亘 ; 滝口, 哲也 ; 有木, 康雄
著者名
吉岡, 利也
著者名
中鹿, 亘
著者ID
A1279
研究者ID
1000040397815
KUID
https://kuid-rm-web.ofc.kobe-u.ac.jp/search/detail?systemId=b3ec2a1710d8267b520e17560c007669
著者名
滝口, 哲也
Takiguchi, Tetsuya
タキグチ, テツヤ
所属機関名
都市安全研究センター
著者ID
A0260
研究者ID
1000010135519
KUID
https://kuid-rm-web.ofc.kobe-u.ac.jp/search/detail?systemId=09a784b8ffbc912c520e17560c007669
著者名
有木, 康雄
Ariki, Yasuo
アリキ, ヤスオ
所属機関名
都市安全研究センター
収録物名
神戸大学都市安全研究センター研究報告
巻(号)
18
ページ
114-119
出版者
神戸大学都市安全研究センター
刊行日
2014-03
公開日
2019-05-30
抄録
近年,音声認識技術は飛躍的に進歩し,様々な環境や場面での利用が期待されている.しかし,構音障害などの言語障害を患う方を対象とした音声認識は非常に少ない.本稿では,アテトーゼ型脳性麻庫による構音障害者を対象としている.アテトーゼ型の構音障害者は,アテトーゼと呼ばれる筋肉の不随意運動を伴うため,同一内容の発話であっても,発話のバラつきが健常者と比べて大きくなるという課題が挙げられる.この発話変動はスペクトルの形状変化を引き起こし,認識精度が低下する一因となっている.この課題に対し本稿では,多層NN (Neural Network)の一種であるCNN (Convolutional Neural Network)を用いた音声特徴量抽出手法を提案し,その有効性を示す.
Recently, the importance of information technology in the welfare-related fields has increased. However, there has been very little research on orally-challenged people, such as those with speech impediments. In this paper, we investigated the speech recognition of persons with articulation disorders resulting from the athetoid type of cerebral palsy. In the case of a person with this type of articulation disorder, the articulation of the first utterance tends to become unstable due to the strain placed on the speech-related muscles, and that causes degradation of speech recognition accuracy. Therefore, we propose a robust feature extraction method using CNN (Convolutional Neural Network) instead of MFCC (Mel-Frequency Cepstrum Coefficient). Its effectiveness is confirmed by word recognition experiments. The results of the experiments showed that the CNN-based feature extraction method outperfirmed the conventional method (MFCCs).
キーワード
構音障害
音声認識
音声特微量
発話変動
CNN
カテゴリ
都市安全研究センター
神戸大学都市安全研究センター研究報告
>
18号(2014-03)
紀要論文
詳細を表示
資源タイプ
departmental bulletin paper
言語
Japanese (日本語)
ISSN
1342-9167
OPACで所蔵を検索
CiNiiで学外所蔵を検索
NCID
AA11142997
OPACで所蔵を検索
CiNiiで表示
関連情報
URI
http://www.rcuss.kobe-u.ac.jp/publication/publication.html
ホームへ戻る