作者の紹介
名前
イシ・シュン。 60年代生まれ。
大学時代
オーディオが好きであったため、音声を研究している大学の研究室に入室。
そこで、音声認識を学ぶ。修士で大学を卒業。
就職
大手電気メーカーに就職したが、
はじめ映像関係の職場に配属されたが、いろいろあって、音響関係の職場に転属になる。
その後、長い間、ハードウエアのエンジニアの仕事をしていた。
引退
AIに興味を持っている。
最近流行りのLLMは、あまり使っていない。
エピローグ
「音声認識につい
て考える」
と題するホームページを作るきっかけとなっ
たのは、転勤によって毎日通勤途中にむかし通っていた大学のビルを見るようになっ
たことである。通勤電車の窓から大学のビルが目に入ると、大学院時代、どうして人は音声を認識できるのであろうかと、日々、疑問を持って暮していた
体験が、蘇ってえってきたのである。
今ではその地位は揺るぎ無いものとなっているようである
が、丁度 私が
大学を卒業したころは、HMMが日本でも流行りはじめたころであった。しかし、むかしから、音
声は確率ではなく、認識には何らかの確固たるからくりがあるのではないかと思っていた。宇宙戦艦ヤマトと言うアニメのなかで、旧地球防衛艦隊の砲弾の
威力ではたとえ近距離から攻撃してもガミラス艦の装甲板に軽傷のダメージしか与えることができない場面があり、そのとき沖田艦長が「この船では勝てな
い。」とつぶやく場面があった。丁度、当時の音声認識の方法につても、私は、同じように感じていた。その後、イスカンダルから波動エンジンのノウハウがも
たらされて、強力な攻撃力をもつ宇宙船艦ヤマトが生まれるのがアニメのストーリーであるが、音声認識の世界はいまだにすっきりしていないように感じるのは
私だけであろうか。
職業とは別個に自分の
興味ある分野を片手間に考えるのも、ひとつの生活スタイルかもしれないと思う。私は自由に考えて本音を言える方が好きである。このホームページが何らかの
インスピ
レーションを与えることになれば幸
いである。
幸い出向も解けて、また、元の勤務地に戻り、通勤途中に電車の窓から
大学
のビルを見ることもなくなった。秋空にすがすがしさを感じる
このごろである。
おわり
2006年11月10日
同年12月31日
2007年1月7日
最終更新日2011年11月20日
(追記)
大学で音声認識の研究をやっていたころから約30年経過した。この30年間の音声認識の手法の変遷を左図にしてみた。
音声認識の初期の頃は、人がどのように音を認識しているのか といったプリミティブな研究が行われていたのであろうが、現在では あまり見かけない。単一の特徴だけではなく、多数の特徴を複合して音を認識していることは間違いないと思われるが、多変量で判定の条件を記述しようとすると、例外的なパターンも数多く存在し、行き詰ってしまう。
現代では、DNNと膨大なデータを使っても最適?な解の計算ができるようになったおかげで、かなり実用的なもに進化したのは事実だ。DNNの内部でどうなっているかはブラックBOX的かもしれないが。
筆者は(物理的な配置から有限個の種類に条件付けられた)発生の仕組みがそのバックグランドにあり、たとえ、学習した分布から離れたものが入力されても、
発生の仕組みからそれをリーゾナブルに説明できる、理論の骨子のようなものが足りないのではないかと感じている。
DNNで我々が制御できるものは、入力に何を入れてやるか、出力形式はどーするか、学習手順の工夫、の3つである。
DNNそのものに制約を入れてしまうと、汎用的に複雑なものを扱えるDNNのせっかくの特色を損なうことになる。
冷静に考えて見ると、古典的な行列システムモデルにおいても、あくまで行列は汎用的でありバックグランドが潜んでいる訳ではい。モデルがフィットしやすいように近づけていくもの同じである。
微分項(差分)がそうであったように、時系列を扱うものとして、DNNではRNNやLSTMのようにフィードバックもって回る形式を使うことが自然なのであろう。
実際にシステムを構築する上で、学習手順を工夫することは重要である。
ヒトの音声の 必然性の基底に相当する多種多様な検出形態の多数の入力を持つ汎用ネットワークは、多くの種類の入力を持つことによりより、ヒトの音声の必然性を反映できるようになるのであろうか?
仕事と趣味である音響の世界もそうだが、
どの世界でも 流行り 廃れ があり、多くはその波にのまれながら 時は過ぎ去っていくのであろう。
科学は、いつも不完全なところがあり、変遷の繰り返しで、完全に満たされることはないのであろう。
(おわり)
2016年9月5日c
2017年4月6日
2018年2月25日
2021年4月18日
2021年10月31日
2022年1月29日
2022年12月15日
2023年12月18日
2024年4月14日