英語の音声は音素列かストリームか

英語の発音を教えようとすると幾つかの大きな問題が発生します。最大の問題は音声を音素の並んだものとして考えるか、音のストリームと考えるかを選ぶ必要があります。現在の英語の発音教材のほとんどは音素的な考えを基本とするものです。つまり発音に必要な45の全ての音を練習することにより、あらゆる英語が発音できるというものです。これは英語の音声は音素と言う音の最小単位から成り立つと言う考えによるものです。なんでこの音素を基に教えるかと言うのは不思議な事に何の科学的根拠もありません。

どうも言い出したのは言語学者のチョムスキー氏が音素線状論と言うので説明したのが始まりのようです。私は最大の理由は一番教え易いからだと言えます。

30個でも40個でも50個でも有限の数の音を覚えると、全ての英語の発音できるのは魅力的だからです。

しかし、音声学の牧野氏が言うように音素に忠実だとロボット的な発音で、発音し難いと言う大きな欠点があります。それでも牧野氏は発音が下手なよりはましだから音素を勉強すべきだと主張しますがそれは正しいでしょうか。音素が線状に並んでいるかどうかは別にしても、し難い発音を強制するのは大変不自然な話です。最も牧野氏は音声学者は発音を良くするのが目的ではなく、音声を記述する骨組を提供するのだそうですから、発音がどうなるかは気にしないかも知れません。それよりも音声と言う物理的なものはいったいどうなっているかは解明する必要があります。
科学的な機器を駆使したいろいろな音声の研究がされております。

東京学芸大学の関口貴裕氏の研究によるとサウンド・スペクトログラムで英語の発話を分析すると音の切れ目の無しの音のストリームであると言うのです。「Can I help you? 」を分析すると一つの音の連続であり、あえて切れ目があるとすればCaとn、そしてlとpの間になるそうです。

日本放送出版協会出版、元MIT教授のSteven Pinker氏著の「言語を生み出す本能」によると話し言葉の音声は、継ぎ目無しにつながっていると言っています。つまり発音している時にも、聞き取る時にも音素を基本にしていないと言っています。

NTTコミュニケーション科学基礎研究所、人間情報研究部、感覚運動研究グループの柏野牧夫氏は長いこと音声認識の研究をしていました。しかし、音素ベースでは音声認識は限界があると言っています。つまり、音声認識で音素を取り出して認識する事は問題が多いと言っております。

日本でも音声認識に関する研究は進んでおり、慶応義塾大学の福田忠彦環境情報学部教授兼政策・メディア研究科委員は音声の認識はフォルマント遷移を感知して行っていると言っています。人間の音声の認識には音素が使われてなく、音を動的に認識している事は科学的に解明されています。


IT企業が協力している国際電気通信技術研究所(ATR)携帯機器向けに開発した自動通訳システムの翻訳モデルは日本語、英語、中国語の150万の文例を使うコーパス・ベースです。しかし音声の認識は非常に複雑な問題で、個人ごとの口や歯などの発話器官の構造の違い、発話器官の動かし方の違い、前後の発話に依存した発話器官の動かし方の違いにより引き起こされる音声信号の違いが、音声認識を困難にしてきました。さらに、複数の単語からなる文発声の認識は非常に難易度の高い課題でした。これらの課題に対し、音声の音の高さの成分分析を精密に行うスペクトル分析法、線形予測分析法が開発され、また、発話毎に長さの異なる発話の照合を行うために、時間構造正規化を含んだパターンマッチング法である動的計画法が開発されました。

音声を音素が線状に並んでいないストリームとして扱うのは非線状音韻論(nonlinear phonology)と呼ばれ多くの科学者に研究されています。日本でも東工農業大学、工学部 情報コミュニケーション工学科の助教授の都田青子氏が非線状音韻論で、音変化のメカニズムを非線状音韻論の枠組みで研究しています。都田氏は次のように言っています。

「言葉は生きているなどと言われるとおり、ことばは絶えず動いており、間断なく変化し続けるものです。ことばの変化を詳しくみてみると、ことばは変化を受けやすい面と普遍的な変わらない面の二つの側面を持ち合わせていることが分かります。私の研究は、このようなことばの変化の中の特に音変化が中心です。音変化は当然のことながら調音上、聴覚上の様々な制約がかかわってきます。このようないわば人間としての制約や限界は言語の普遍的な面とそうでない面を知る上でとても重要です。しかし、すべての音変化、音現象がこのような調音、聴覚上の制約だけでうまく説明できる訳ではありません。音変化のメカニズムはひとことでは簡単に片づけられない複雑なものです。」

音声を録音して細かく細分しても実際には音素の単位に切り取れません。それは音には切れ目が無く、常に変化し続ける音ストリームだからなのです。意図的な母音の長音であればその間は一定した音響特性がありますが、単語や文章の音素の音は常に変化をしているため音と音の継ぎ目がありません。それではなぜ連続的な音に切れ目あるように聞こえるのでしょうか。連続音が切れたように音素的に聞こえるのはどうしてでしょうか。

音声の音が階段状ではなく、スロープのように連続的に変化するのは機械ではない生物の発音器官がなせるものですが、その自然な音が音声認識の立場からも連続的に変化した方が聞き取り易いのです。音を並べた場合に音が連続的に変化して我々が話すようにした場合と、音が急激に変わるように並べた場合では、音が連続的に変化する方が聞き易いのです。音の錯覚のサイトではストリームのような音の方が聞き易い事が分かります。上記サイトに「あいうえお」を連続的に発音した場合と「あいうえお」を切り取って音素の状態で並べた音があります。音を明瞭にするためには音が急激に変わる方が聞き易いように感じますが、非常に聞き難いのです。

音をスロープのように連続的に変えた方が聞き易く、かつ音が切れて聞こえるのです。音は連続的に変化したようには聞こえずに、音が急に変わったように聞こえます。人間は音の変わり目をうまく聞き取って音を判断しているため、音が急に変わったように錯覚するのです。音声合成の場合も最も難しいのは音のつなぎで、機械的な音はどうしても連続的に変化するのでなく、急に変わるため、返って聞き難いのです。すると、音を聞きやすくするためには連続的に変化させた方が聞き易いのです。


こう考えると英語の発音で音素や発音記号を生真面目に勉強した人が単語や文章の発音が難しいと悩むのは当然な結果です典型的なのはTの音でこの音は前の音により音が変わる場合が多く英語ではかなりの幅が許されます。言葉の発音は流体ですのである音の前に何がくるかによって次は大きく変わると考えると大変良く理解できます。Tの音は息の流れを止める音であるとすればTの音で声門閉鎖の音の無い音もTの音の代わりになる事が理解できます。

このように音声がストリーム状であるのは人間が生物であるための避けられない必然性と、人間の耳で聞き取りを容易にする必要性の双方があります。人間の発音と聞き取りには密接な関係があり、聞いた音を発音しており、発音した音を聞いていますので発音し易い音が、聞き取り易いと言う関係にあります。

HOME|最適性理論とは|教材オンラインショップ|特定商取引法の記載|個人情報保護方針|お問い合わせ
Copyright(C) 2011 最適性理論で英語学習 All Rights Reserved