090613 刑事裁判は生き返るか 音声認識システムについて

裁判員裁判用 音声認識デモについて

裁判所のデモンストレーションに行ってきました。
山岸弁護士のBLOG:裁判員裁判で使用される音声認識システムと量刑検索システムの見学会に参加しました - livedoor Blog(ブログ):
残念ですが,とてもこんなに高く評価できない音声認識システム。
山岸先生は最高裁判所の模擬動画だけをみたのか,よほどきれいな日本語を喋られるかのどちらかでしょう。

津軽弁「うっと」難しい?【全国・海外ニュース/ 社会】- 大分合同新聞:
僕の印象は,どちらかというとこちらの認識に近いです。

 21日の裁判員制度開始を前に、法廷での被告人質問や証人尋問のやりとりを自動的に文字化して記録する「音声認識システム」が、「うっと(とても)」など一部の津軽弁を識別しない可能性の高いことが19日、分かった。
 音声認識システムは、証言台の前に設置したカメラやマイクで法廷のやりとりを映像と音声で記録。発言内容を自動的に文字化し、評議の際に録画映像とあわせ、裁判員が確認できる。
 最高裁が約4億円をかけて開発した自信作で、全国の約160法廷に導入。関西弁に対応できるバージョンもある。
 青森地裁でも1号法廷に設置されたが、同地裁総務課によると「じぇんこ(銭)」など津軽弁の難解な方言はシステムでの認識が難しいほか、独特のイントネーションもあるため、どの程度対応できるか分からないとしている。
システムには地名や人名など頻繁に使用する言葉の事前登録が可能。ただ「方言となると何が出てくるか予想ができない」(総務課)ため、今後は青森地裁の法廷でよく使われる津軽弁の登録も検討するという。
 最高裁は「前後の文脈から類推でき、実務に支障のないレベルは確保できる」(広報課)と説明。特有の方言がある各地の地裁は「システムは参照用で評議そのものに影響はしない」(鹿児島)、「実際のケースを見ないと何とも言えない」(那覇)などとしているが、当面は手探りの運用が続きそうだ。
大分合同新聞は,方言などに苦慮するとしています。
最高裁は「前後の文脈から類推でき、実務に支障のないレベルは確保できる」(広報課)と説明。
残念ですが,喋り方によってはこれも怪しいです。


また,大分合同新聞の記事は「方言が苦手」ということですが,僕の印象はちょっと異なります。方言かどうかだけでなく,喋り方,間の取り方,リズムが想定と狂うともう駄目。また,ちょっとくぐもっただけの喋り方でも,きちんと認識しない。

苦手なものの例。

五分の模擬尋問で実感したのは次のとおり。
とくに苦手なのは,
・いいはじめ。しゃべりはじめ。
・言葉と言葉のつなぎ
・マ行,ハ行の区別
・サ行や息を吸ったり吐いたりしながら発声する場合
・文節と文節の間に,間をおいたり,”あー”とか,”うー”という言葉を入れると,きちんと認識できない。あー,とか,うー,を交えた単語と認識してしまうので,意味不明な単語として文字化してしまいます。

ようするに,発声された音声から文字をひとつひとつ拾うのではなく,文節か単語かで認識するシステムなのでしょう。したがって,多少,”間”やイントネーションがかわるだけで,まったく違う単語として認識される。

文脈や,話者の癖はまったく考慮されていないようです。

したがって,認識されないという問題は方言に限られない。
これらの問題は標準語でも起こりうる。

最高裁が作成した模擬動画では,非常にきれいな日本語を喋っているので認識が正確なだけ。標準語でも癖が多少あると認識できない。

速記官による速記の方がおそらく優秀でしょう。

当日の質疑について。


弁護士さん:公判で,検察官が尋問で「○○」と言った筈,ということを,速記官のときに過去にしてくれたことがある。音声認識システムはそのように使えるのか。
書記官:現段階では検討中
認識率が著しく低い上に,利用方法も限定されるのでは,なんとも言いようがないです。

見た目だけのIT化。実際には不便さが増すのみです。

実用にはまだ不充分なのでは,という印象を持ちました。

なお,過去のボツネタ(いまのボ2ネタ)にはこんな記事が紹介されていました。
[司法]なんじゃこりゃ・・ 最高裁開発の「音声認識システム」
引用元の町村先生のブログはこちら。
Matimulog: court_techno:音声認識なるか?:
アメリカでは、速記官(コートレポーター)がタイプし、それがコンピュータでリアルタイムスクリプトになっている。

日本でも、速記官有志の開発したはやとくんシステムにより、同様のことが可能になる。検索頭出しが可能になるという程度の不完全なものではなく、完全なスクリプトができるシステムが出来上がっているのに、わざわざその人材をなくして、不完全な目標しか立てられない方法を選ぶのはどうしてなのだろうか?
同感です。最高裁は熟練した人間の技よりも,機械の方が信頼できるそうで。DNA鑑定万歳とも同様の発想なのでしょうか。