| Japanese | English |

母音「あいうえお」を測定比較
(日本語音声の分析5)

 
計測日時 2002年9月30日 23:00
計測場所 愛知県名古屋市
マイク SONY ECM-MS957
マイクアンプ SONY DAT WALKMAN TCD-D100
パソコン DELL INSPIRON 7500
OS Windows 2000 Professional
測定分析ソフト DSSF3
WAVE sound file: voice5.wav (44.1kHz / Stereo / 7.58sec / 1.27MB)


母音「あいうえお」を測定しました。ここでは、積分時間0.01秒、ランニングステップ0.005秒で再計算表示させています。

「あ」のパワースペクトラムはすでに計測済みですから省略します。

2番目目のパワースペクトラム「い」です。

グラフをみると、ピーク周波数は 300Hz、600Hz、900Hz、1200Hz、3000zなど後高域に4600Hzなどの盛り上がりがあります。非常にすっきりしたパワースペクトラムなので読みやすいです。 高域は全体的に1オクターブ6dBの減衰の音声のスペクトラムになっています。基本周波数は300Hzで、フォルマント(F1)は600Hzです。

3番目目のパワースペクトラム「う」です。

グラフをみると、ピーク周波数は 300Hz、600Hz、900Hz、1200Hz、1500Hz、3000Hzなどです。これも非常にすっきりしています。これも基本周波数は300Hzで、フォルマント(F1)は600Hzです。

4番目のパワースペクトラム「え」です。

グラフをみると、ピーク周波数は 240Hz、480Hz、720Hz、960Hz、1200Hz、2400Hz、4300Hzなどです。これも非常にすっきりしています。音程を上げた場合は、基本周波数は240Hzで、フォルマント(F1)は700Hzです。

5番目目のパワースペクトラム「お」です。

グラフをみると、ピーク周波数は 280Hz、560Hz、840Hz、1120Hz、3000Hz、4500Hzなどです。これも非常にすっきりしています。音程を上げた場合、基本周波数は280Hzで、フォルマント(F1)は840Hzです。

上記パワースペクトラムは参考にします。それではランニングACF分析を行なってみます。

「あいうえお」と5つの測定がしてあります.これは、音圧レベル(SPL)の時間経過を表しています。

「あ」の発声時の話し始めの、τe最小時のACFの波形です。

実験後 0.61秒です。 話し始めて10msec後です.低音がやってくるときの変化が最大のポイントです。

τe 3.98 τ1 1.18 φ1 0.44
前回も測定できた値です。これは「あ」です。

「い」の発声時の話し始めの、τe最小時のACFの波形です。

実験後 2.085秒です。 話し始めて10msec後です。低音がやってくるときの変化が最大のポイントです。

τe 6.78 τ1 0.27 φ1 0.97
「い」の発声の特徴である、3KHz以上に反応しています。

「う」の発声時の話し始めの、τe最小時のACFの波形です。

実験後 3.505秒です。 話し始めて10msec後です.低音がやってくるときの変化が最大のポイントです。

τe 5.05 τ1 2.18 φ1 1
「う」の発声の特徴である、400-500Hzに反応しています。

「え」の発声時の話し始めの、τe最小時のACFの波形です。

実験後 5.055秒です。 話し始めて15msec後です.低音がやってくるときの変化が最大のポイントです。

τe 15.48 τ1 0.29 φ1 0.5
「え」の発声の特徴である、3KHz以上に反応しています。

「お」の発声時の話し始めのτe最小時のACFの波形です。

実験後 6.655秒です。話し始めて15msec後です。低音がやってくるときの変化が最大のポイントです。

τe 21.80 τ1 1.18 φ1 0.35
「お」の発声の特徴である、800Hzに反応しています。

すべての分析結果を挙げておきます。

DSSF3のスクリーンコピー機能を使用してワンタッチで出力した自己相関相互相関のパラメータの時間変化を表しています。

ACFのグラフは最後の実験6.655秒後の表示です。τ1の表示にも注目してください。母音「あいうえお」の発音の違いがわかりやすく表示されています。

母音   SPL 実験後 (sec) 発声後 (ms) t1(ms)

f1

te(ms)
start -57.41 0.605 0 0.25 0.21 6.48
    -22.43 0.61 5 1.18 0.44 3.98
    -21.02 0.615 10 1.25 0.52 12.25
    -14.6 0.62 15 1.16 0.52 41.98
  max -11.26 0.625 20 1.13 0.54 44.08
    -11.52 0.63 25 1.13 0.48 49.13
start -59.03 2.075 0 0.14 0.06 9.88
    -45.37 2.08 5 0.32 0.65 9.88
    -30.26 2.085 10 0.27 0.97 6.78
    -25.26 2.09 15 2.13 0.35 17.19
  max -23.75 2.095 20 1.79 0.11 26.88
    -23.99 2.1 25 0.27 0.76 29.22
start -58.14 3.495 0 0.7 0.18 5.03
    -24.77 3.5 5 0.05 1 5.19
    -17.23 3.505 10 2.18 1 5.05
    -13.56 3.51 15 2.15 0.98 56.93
    -11.84 3.515 20 2.06 0.79 49.3
  max -11.42 3.52 25 1.97 0.58 58.22
    -11.9 3.525 30 1.86 0.38 35.99
start -59.34 5.04 0 0.18 0.08 3.88
    -30.84 5.045 5 1.84 0.7 24.14
    -27.51 5.05 10 2.04 0.43 29.05
    -21.17 5.055 15 0.29 0.5 15.48
    -17.05 5.06 20 1.59 0.36 17.98
    -15.88 5.065 25 1.63 0.36 34.68
    -15.45 5.07 30 1.61 0.34 22.88
  max -14.66 5.075 35 1.59 0.33 24.45
    -14.75 5.08 40 1.56 0.34 53.48
start -59.8 6.64 0 0.29 0.07 20.92
    -47.02 6.645 5 1.7 0.28 25.34
    -37.01 6.65 10 1 0.93 25.34
    -16.71 6.655 15 1.18 0.35 21.8
    -13.03 6.66 20 1.29 0.32 126.27
    -13.28 6.665 25 1.25 0.41 65.41
    -11.13 6.67 30 1.2 0.58 136.91
  max -9.85 6.675 35 1.22 0.5 59.52
    -10.03 6.68 40 1.2 0.49 44.89

各母音ごとの発声後の5 msecごとの音圧レベルΦ(0)、τ1、φ1、τeの開始から最大音量までの値を表にまとめました。音圧レベルの時間的変化のデータは音の識別に重要です。これらの表のみで解析できるとすれば、膨大なアナログデータの解析に比べてデータ量が少ないため便利です。たとえばインターネットを利用した研究データの転送にも、データベース化にも適しています。

前回、ドレミファソの音程で「あ」の分析をおこないました。今回その表に「あいうえお」のデータを付け加えておきます。

  実験開始後 (ms) 実験開始後 (ms) t1(ms) f1 te(ms)
あ ドの音程 0.625 35 1.13 0.27 6.8
あ レの音程 2.04 10 1.22 0.32 4.3
あ ミの音程 3.575 20 1.2 0.32 6.27
あ ファの音程 5.075 20 1.22 0.38 4.94
あ ソの音程 6.605 25 1.2 0.66 7.76
あ ラの音程 8.14 5 1.18 0.49 6.45
あ シの音程 9.65 10 1.3 0.3 4.91
あ ド(高)の音程 11.255 20 1.25 0.5 4.45
あ 母音比較   5 1.18 0.44 3.98
  10 0.27 0.97 6.78
  10 2.18 1 5.05
  15 0.29 0.5 15.48
  15 1.18 0.35 21.8

April 2003 by Masatsugu Sakurai


Back Home Next