英語耳の松澤喜好氏の大きな間違い

英語耳の松澤喜好氏は長い事英語の音声認識システムに関与していました。以前の松澤さんは彼のサイトで次にように言っていました。しかし、松澤さんは現在では過去の経歴はソフトの開発に従事と言うことになっており、もう下記の事は公開しておりません。もしかすると次の事は松澤氏には不都合な事実なのかも知れません。

「1990年代後半の音声認識の進歩は想像をはるかに超えていました。英語の音声認識は、英語の音素の組み合わせです。子音・母音の音素は私の“発音教則本”にしたものと同じです。音声認識の開発に於いては、私の頭の中で発音の原理が整理されました。また、自分を実験台にし、毎日毎日、発音をして、そのスコアを確かめることを続けた結果、相当な量の発音の練習ができました。」

最大の誤りは人間の、音声には調音音声学で説明する45(英語耳は43音)の音素が時間軸に同格で並んでいると、信じてしまった事です。英語の音声は科学的に解明すれば、連続的に変化する音のストリームであり、音声から音素を取り出す事ができないのは、科学的に解明されています。

松澤さんは音素ベースで発音練習を始め、その音素練習の結果として自分の発音が良くなり、それにより音声認識が高まる事実を自分で確認していたのです。発音が良くなれば認識が良くなる、だから発音練習が聞き取りを良くすると考えたのでないでしょうか。

それが43音ベースの英語耳と言う本になったのでないでしょうか。

私はこれを読んだので、英語耳の松澤さんと人間の英語の音声認識について議論を望みました。松澤さんに人間の音声認識について聞きたいと思っていたのは、彼が「発音ができれば聞き取れる」と言っていたからでなく、上記の理由から彼が英語関係者では音声認識システムに最も詳しいと思っていたからです。

非常に長い議論でしたが最後に、ハム太郎氏が我々の音声認識の議論を次のようにコンパクトにまとめました。

「議論が(桜井と)微妙に噛みあわないのは、松澤さんが、基本的にはご自分の専門分野であるコンピュータによる言語処理に言及していながら、時々、あたかもそれが人間の脳内処理にもそのまま当てはまるかのような言い回しをされるからではないでしょうか。コンピュータによる言語処理では、確かにまず音素レベルで音を認識させて、それをバッファにためて行き、単語とかフレーズ単位の音の連鎖になった時点で、これらの認識された音素列を初めて蓄えられた辞書中の語彙と照合するというやり方が最も処理効率がよく、アルゴリズム的にも自然だと言えるでしょう。」

「一方、人間の脳は元々パラレル処理を得意としていますから、最初の音素を聞いた瞬間から、コンテクストなどから単語全体、あるいはフレーズや文全体さえも先回りして(しかも幾つかの候補を並列的に予測する事さえする)予測しながら、マッチング処理を進めていきます。この処理を行いながら、多少聞き取れない音素があったとしても、推測により穴埋めしていきます。この意味では、音声認識はまず音素単位の認識あり得ません。」

そして2006年に、松澤さんはハム太郎さんの音素ベース否定の意見に100%賛同しました。そして松澤さんは掲示板で音声は動的認識されていることに同意しました。そして私が良く引用する音素は錯覚で聞えると言うピンカ―氏の本を紹介してくれました。

松澤さんは2008年には英語耳のサイトのリスニングの項では英語の音は全部継ぎ目なく繋がっていると訂正をしております。

その後松澤喜好氏のとのメール交換では、英語耳の43音が根拠のないこと、そして英語耳多読の本では43音でなく、最初から音のストリームで教える方法を取っている事を教えてくれました。

しかし、2010年に英語耳改訂版が出版されました。けれど”英語の音”は43音、そして”発音できない音は聞き取れない”は訂正されませんでした。大変に残念な事です。

HOME|最適性理論とは|教材オンラインショップ|特定商取引法の記載|個人情報保護方針|お問い合わせ
Copyright(C) 2011 最適性理論で英語学習 All Rights Reserved