◆ 概要
⇒ DPマッチングのアルゴリズムを利用し、小語彙の単語音声認識実験を行う ⇒ 音声入力~音響分析までの過程はすでに終了しているものとし、
予め用意されたテキストファイルのデータを利用する ⇒100単語のテンプレートに対して、 同じ発声内容の100単語(同一話者または別話者)を未知入力音声と 見立てて順に入力し、何単語が正しく認識できるか調べる
• データファイル
⇒ city_mcepdata.zip をダウンロード ⇒ 適当な場所に内容を展開 ⇒ city011, city012, city021, city022の4つのフォルダ ⇒各フォルダにそれぞれ100個のテキストファイル
• データの内容
⇒100地名単語データベース ⇒話者2名がそれぞれ2回ずつ発声(計4データセット、400単語分) ⇒100単語の発声内容がすべて同じ順序で格納 ⇒ ex. 先頭の単語(単語番号001)はAZABU(あざぶ)
> ファイル名
⇒ ex. city011_001.txt ⇒ city011 は話者01の1回目発声(city022なら話者O2の2回目発声) ⇒ _001 は単語番号 (100単語なので001から100まで)
ファイル構造 ⇒テキスト形式; Windowsのメモ帳やUNIXのcatコマンドで見える ⇒先頭に3行のヘッダ情報
1行目: ファイル名から拡張子 .txt を除いたテキスト (ex.city011_001) • 2行目: 発声内容(音素の略式表示)
→ 3行目: フレーム数 ⇒4行目から後がデータ(音響特徴量ベクトル)
1行が1フレームに対応 → 15次のメルケプストラム特徴量(空白で区切られた15個の浮動小数点数) ⇒ ex. フレーム数が61の場合、ファイルの行数は61 + 3(ヘッダ部) = 64行 ⇒単語によりフレーム数(発声時間長に対応)が異なるので行数も異なる
• 実験方法
⇒4データセットのうち2つを利用 ⇒ テンプレート(正解)1つ、未知入力(認識対象)1つの組み合わせ ⇒同一話者(2通り) =特定話者
→ ex. テンプレートが話者01の1回目、未知入力が話者01の2回目 ⇒別話者(4通り)
⇒不特定話者 + ex. テンプレートが話者01の1回目、未知入力が話者O2の1回目
⇒それぞれの組み合わせについて100単語×100単語の総当たり認識 ⇒ 発声内容はすべて同じ;未知入力のN番目の単語をテンプレートの 100単語とマッチングさせた結果、N番目の単語に対して最小の 累積距離が得られれば正解 ⇒ 正解数(最小の累積距離を与えた単語が入力単語と一致した数) = 単語認識率 [%]
データの読み込み
⇒1単語のデータ構造は double data[frame] [dimension] (2次元) ⇒この実験では dimension = 15で固定; frame は単語により異なる ⇒テンプレートと未知入力それぞれ100単語を予めすべて読み込んでおく
局所距離の計算(パズルにおける○内の数字に相当) ⇒ テンプレートA(フレーム数 I )と未知入力B(フレーム数 J)のマッチング ⇒Aのフレームiのデータを aik、Bのフレームのデータを bjk (k は次元) ⇒ aik と bjk の間の局所距離:
d(i, j) = √(ai,1 - bj,1)2 + (ai,2 - bj,2)2 + … + (ai,15 - bj,15)2→すべてのフレーム相互間について計算
用いる単語数
→テンプレート、未知入力ともに100単語
100×100=10000の組み合わせ
と内容はこんな感じなのですが、まずファイルを読み込むということがそもそもわかりません。C言語です。プログラミング初心者で何をやればいいのかわからず困っています。よろしくお願いいたします。
A 回答 (1件)
- 最新から表示
- 回答順に表示
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 英語 ソシュール言語観による品詞、単語、辞書理解の誤り 4 2022/11/24 12:27
- 英語 英単語の覚え方について。 ターゲットなのですが単語帳の英単語の方を見ると日本語は出てきますがいざ日本 5 2022/08/03 14:35
- 日本語 自立語/付属語という品詞区分の誤り 5 2022/09/05 00:20
- Visual Basic(VBA) EXCEL VBA 単語置き換え について質問です ブック名 ぶぶぶ シート名 ししし セル V3〜 3 2023/03/08 01:41
- TOEFL・TOEIC・英語検定 英会話の習得 4 2022/06/05 10:23
- 仕事術・業務効率化 (初体験)中日英通訳の悩み 2 2023/08/09 09:07
- 英語 1単語及び2単語の「no~」を受ける単語について 1 2022/11/07 11:54
- Visual Basic(VBA) VBA 検索と入力 Excel ブック ぶぶぶ シート ししし 列V 検索対象の列です 最終行は、お 6 2023/05/17 01:40
- 大学受験 速読英単語(必修編)の使い方について聞きたいのですが、僕は、 ①1文をしっかり精読する ②「彼は〜し 3 2022/08/24 01:09
- 日本語 脳科学の奇妙な言語獲得論 2 2022/04/04 13:13
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
C言語でしりとりのプログラムを...
-
表記のゆれを吸収する方法
-
C言語 exitの使い方
-
フォームを開くときに、コンボ...
-
Excel-vba 文字列と変数を...
-
【VBA】複合代入演算子
-
VBAでダブルコーテーション入り...
-
vbsでテキストファイル内の文字...
-
エクセルへのデータの貼付時に...
-
VB6で配列を文字列に変換する方...
-
jsp~jspにhiddenを使って変数...
-
10進数をアスキーコードに変換
-
足して100になるような乱数のア...
-
数字の位ごとの値を表示するプ...
-
java final
-
VBAの定数の使い方で、計算値を...
-
C言語 アロー演算子について質...
-
C#で動的にコントロールを取得...
-
プログラミングで変数と関数の...
-
JavaScriptをURLから直接実行し...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
C言語でしりとりのプログラムを...
-
異なる文字列のマッチングを、D...
-
全ての可能な文の生成について2
-
カウント配列
-
検索でヒットさせたくない
-
単語の頻度プログラム
-
<a href=…>がうまくいかない
-
文字列の比較のはずなのに・・・
-
CGI.pmによるプルダウンメニ...
-
表記のゆれを吸収する方法
-
解析機能の拡張について
-
emacsで辞書補完
-
C言語 exitの使い方
-
フォームを開くときに、コンボ...
-
エラーの意味は? Lvalue req...
-
VBAでダブルコーテーション入り...
-
だれがとけるの?
-
jsp~jspにhiddenを使って変数...
-
excelの、ある数式内の{}の意...
-
テキストボックスの値を変数に...
おすすめ情報