| Japanese | English |

女性の音声を測定、対比
(日本語音声の分析3)

今度は女声を測定し、前回の男声の測定と対比します。

 
計測日時 2002年9月25日 17:00
計測場所 愛知県名古屋市
マイク SONY ECM-MS957
マイクアンプ SONY DAT WALKMAN TCD-D100
パソコン DELL INSPIRON 7500
OS Windows 2000 Professional
測定分析ソフト DSSF3
WAVE sound file: voice3.wav (44.1kHz / Stereo / 2sec / 345KB)

この測定以後は、測定精度を上げるためにマイクアンプを使用し、RAで測定結果を確認しながらランニングACF測定を行っています。

「あ」のパワースペクトラムの100~5Hzの周波数領域と縦軸の拡大表示
ピーク周波数をわかりやすくするために「レベル範囲」(Level Range)を手動で狭めてみました。

基本周波数は260 Hzに、ピーク周波数は800 Hzに、1060,1500,1750...と続きます。フォルマント周波数は800 Hzです。

参考までに、250 Hzは基本周波数(声帯の振動数)です。一般女性の基本周波数は大体 225 Hzです。男性は120 Hzであり、幼児は300 Hzです。(「音声の音響分析」レイ・D・ケント著 開文堂刊)

そこで「あ」の発音のなかでのランニングACFからフォルマント800 Hzのデータがあるかを調べてみました。

ACFの最大のピークを遅れ時間で読むと 1.25msec 800Hz

同一データ グラフ そのときのピーク 4.55 msec 基本周波数 219 Hz
(読みやすいように横軸がズームしてあります)

 

前回同様、今回も実験開始後0.33秒に発声し、その5/1000秒(5 msec)ごとの分析を順番に行います。

ランニングACF分析

▼ 発声5 msec後 (実験開始後 0.335秒)

 

τe 12.58 msec 発声からピークパワーまでの上昇過程でのτeは大雑把には減少していきます。自己相関の波形を眺めると、0.2,0.28、0.4,0.68,0.85,1,1.18、1.2,1.35,1.7、1.95... msecにそれぞれピークがあります。

▼ 発声10 msec後 (実験開始後 0.34秒)

τe 12.51 msec 発声からピークパワーまでの上昇過程でのτeは減少していきます。

上図をみると 0.2, 0.4, 0.6, 0.9, 1.1 msec 基本周波数 3.8 msecにかすかなピークがあります。この段階では、時間が早すぎて(10/1000秒しかたっていない)必要な周波数の音がすべてではありませんが、すでに基本周波数が分析されています。今回は基本周波数の取得には10 msecかかりました。

フォルマント周波数
F3 1000/0.7=1500Hz (抑圧されたピーク) F2 1000/0.9=1100Hz (抑圧されたピーク) F1 1000/1.1=900Hz  ピーク周波数

▼ 発声15 msec後 (実験開始後 0.345秒)

τe 5.20 msec、発声からピークパワーまでの上昇過程でのτeが2番目に小さいポイントです。

0.8、1.35 msec  基本周波数 4.5msec 222Hz
0.8 msec フォルマント周波数 1000/0.8=1250 Hz 第3フォルマント(F3)
1 msec 次のマイナスのピーク 1000/1=1000Hz 第2フォルマント(F2)
1.35 msec フォルマント周波数 1000/1.35=750 Hz 第1フォルマント(F1)

フォルマント周波数はいちばん低い周波数を第1フォルマント(F1)として、以後F2、F3と続きます。発声後15 msec後の自己相関は上記各ピークがフォルマント周波数に対応しています。

▼ 発声20 msec後 (実験開始後 0.35秒)

τe 8.50 msec
0.68 msec、1.21msec 基本周波数 4.5 msec 222 Hz
0.68 msec フォルマント周波数 1000/0.68= 1500 Hz、第2フォルマント(F3) 次のマイナスのピークは 0.96 msec  1000 Hz 第2フォルマント(F2) 1.28 msec フォルマント周波数 1000/1.28= 750 Hz 第1フォルマント(F1)

▼ 発声25 msec後 (実験開始後 0.355秒)

τe 23.14 msec
0.62、1.25   基本周波数  4.55 msec 219 Hz

最初のピーク 0.62 msec  1612 Hz 第3フォルマント(F3) 次のマイナスのピークは 0.9 msec  1111 Hz 第2フォルマント(F2) 1.3 msec フォルマント周波数 1000/1.25= 800 Hz 第1フォルマント(F1)

同じく25 msec後の男性の場合の測定値は、同じ25 msec後では、

最初のピーク 0.68 msec  1470 Hz 第3フォルマント(F3) マイナスの最初のピークは 1.05 msec  952 Hz 第2フォルマント(F2) 1.3 msec フォルマント周波数 1000/1.3= 769 Hz 新第1フォルマント(F1)

フォルマント周波数の比較では男性のほうが若干低い周波数です。パワースペクトラムでも明らかでしたが、男性の場合は低い周波数に広い帯域で音声を出します。大きなエネルギーです。フォルマント周波数も1ピークあたりの帯域が広くエネルギーが大きいようですが、音の高さは低く3kHzどまりで、女性の6kHz、12kHzまで高く伸びる声とは違うようです。

そのため、男性のACFがひとつのピークになっているのに、女性の場合は大きなピークの前に小さなピークができています。これは男性の声よりも、女性の声のほうが発音が聞き取りやすいことを意味しているのではないでしょうか。

April 2003 by Masatsugu Sakurai


Back Home Next