« ◇光行差があるから移動系の物体は系内では歪まない | トップページ | ◇Windows動画キャプチャ(OBS studio) »

◇第九-カラヤン'62 第4楽章Recitativoのピッチ解析

O Frerund, nicht deise TöneのTöがneより低く聞こえるはなぜ?

TöneのTöがneより低く聞こえる;カラヤン'62

TöneのTöとneが同じ音に聞こえる;カラヤン'84

 nicht diese Töneのピッチ

以前の記事◇カラヤンの呪縛(第九)で、

カラヤンの方は最後のTöneのöの音が僕の耳にはとても微妙な音程に聞こえます。楽譜ではF-Fなのですが(高めのE)-Fに聞こえるのです。
と述べました。

しかし、誰に聞いてもF-Fにしか聞こえないというのです。
なお、同じカラヤン/ベルリンの録音でも '84版ではF-Fに聞こえます。

そこで、ツール(Praat)を使って当該部のボーカルのピッチを調べてみました。

解析結果を見る限りでは、確かに、töneの音が低く始まっています。
なお、この演奏はA4=450Hzとなっています。(少し高すぎです。Praatの表示・操作系の難しさのため少し雑な値をとってしまった可能性が高い)

ツール(UVR5:ultimate vocal remover ver.5)を使いボーカルのみを抜き出してみました。不思議な事にこのボーカルを抜き出した音ではtöneの聞こえ方が違います。

ボーカルのみの解析結果ではtöが直ぐに高くなっているのに対しオリジナルでは低い音を保ちneで高く聞こえます。
オケの方ではバイオリンがボーカルと同じF音を出しますので、ボーカルが微妙に高くて、neで急に音程が上がったように聞こえるのかもしれません。

 ピッチ解析検証

音程を細かく調べてみました。

Tö音はE♭からEへ駆けあがりEで少し安定した後Fに上がっているようです。

音は当然揺れていますので、どこを自分の耳がどこをとって音程判定しているのかはよく分かりませんが、Fに到達する手前までで音程を感じ取っているようです。
伴奏がある場合、"ne"の部分でFが確定しますので、その手前までで音の高さが判断され、E+の音と聞いているのかもしれません。

Töne部を拡大します。

ビブラートがある中で、どこを「音程」として捉えるのかは議論の余地がありますが、この例ではTöの前半は明らかに低く、途中高くなりますが、後半も低くなっており、多分これをEより高いけどFより低いと感じているのだと思います。
これに対しneの部分はF前後に揺れておりFと聞いているのでしょう。

 chatGPTで調べる

Praatは周波数の読み取りがとてつもなく難しいので、chatGPTを使ってみました。

A3は446Hzの様です。

 Töとneのピッチ差

töneの部分を調べさせました。次のようなピッチグラフが得られました。

ざっくり結論:

tö の方が全体として低め、ne の方がわずかに高めに出ています。

ピッチ軌跡でも、tö区間にE〜Fを跨ぐような上昇→下降→上昇の山谷が見え、ne はよりフラットにF付近を推移します。

数値(スムージング後F0の代表値):

tö(8.00–9.15 s):中央値 ≈ {summary['Median F0 (Hz)'][0]:.2f} Hz(F3=174.61 Hz基準で {summary['Offset vs F3 (cent)'][0]:.1f} cent)

ne(9.15–9.50 s):中央値 ≈ {summary['Median F0 (Hz)'][1]:.2f} Hz(F3基準で {summary['Offset vs F3 (cent)'][1]:.1f} cent)

差(ne−tö):約 {summary['Median F0 (Hz)'][2]:.2f} Hz(≒ {summary['Offset vs F3 (cent)'][2]:.1f} cent)

※差はおおむね十数〜数十セントの範囲

てことで、やはりTöneまたはTöneです。

 ボーカル版とオーケストラ版でなぜ感じ方が違うか?

大きな疑問は、「なぜ私にはオーケストラが入った場合にneで急に音が高くなったように聞こえるか?」です。

chatGPTに「neのボーカルのピッチと、オーケストラのバイオリンのFのピッチは合ってますか?」問いました。
次の回答を得ました。

結論だけ先に:合っていません。

この「ne(9.15–9.50 s)」で

  • ボーカルF0の中央値 ≈ 179.0 Hz(=F3より**+43 cent**)
  • 同時区間のバイオリンのF(F4帯)は、声の倍音を除外して抽出すると ≈ 347.93 Hz(=F4より−6 cent)

オクターブを揃えて比較(声×2=358.0 Hz)すると、
声の方が約 +49 cent 高い(≒半音の約半分)です。

※瞬間的には重なるフレームもありますが、中央値ベースでは声が高め。

という事で、ボーカルだけの版とオケ版(オリジナル版)でのneの感じ方の差はバイオリンとのピッチ差のせいだと思われます。

 なぜ他の人にはF-Fと聞こえるか?

人は高さの揺れる音からどのように「音程」を感じているのか、、、、なぞです。

 他の演奏では

カラヤンの'84版を載せます。TöneがF-Fと聞こえます。

Töneを拡大します。安定したF-F音程であることが分かります。

 周波数<->音名変換ツール


 アプリ導入メモ

 

|

« ◇光行差があるから移動系の物体は系内では歪まない | トップページ | ◇Windows動画キャプチャ(OBS studio) »