« 100分で名著『維摩経』 | トップページ | 『父が娘に語る経済の話』 »

2021年7月 9日 (金)

文字起こしの自動化

20210702  これまでのいろんな仕事で、音声からの文字起こしをすることは多々ありました。インタビュー内容を起こしたり、研究会の議事録作成をしたり。。。でもその当時は、自ら刈り込みながら文字起こしするか、又は外注でとりあえず素の音声を文字に起こしてもらい、自身は後から無駄な部分を削除したり推敲したりする作業に専念できたのですが。。。
 今月頭に、出版社時代の友人から急遽、某インタビューの文字起こしを依頼され、まぁ時間のある時だったため安請け合いしてしまったのですが、これがまぁ大変大変。スマートスピーカー 華やかなりし今、AI を使った音声認識も、以前よりだいぶ進化・自動化されているものと思い、アレコレと文字起こしアプリ等を検討してみたのですが、どれも今一つな感じ。結局Googleドキュメントで試してみたところ、まったく使いものになりませんでした。別にGoogleドキュメントの音声認識の性能が低いということではなく、“人の自然な会話を正確に聞き取る”というのは、生身の人間にとっても相当大変なことだというのを痛感させられたのです。
 そんなことは、これまでの経験からも分かっていたことではありますが、いざ仕事として、責任持ってきちんと仕上げようとすると、専門用語の語彙や、話すスピードの違い、文脈を外れた会話や脱線、方言やイントネーション、活舌の良し悪し等々、対応すべきことが盛りだくさん。AI がこれに柔軟に対応する日は、まだだいぶ先のように思われました。かつて数時間の議事録を素で起こしてくれていた外注先の手腕に脱帽(汗)。そして、素で起こすよりもむしろ、概要を把握して編集しながら起こした方が余程効率的だと思いつつ、そうすると主観が結構入って危険だな…とも感じた次第。議論の繊細なニュアンスまで把握したい場合は、文字起こしされたものよりもむしろ、音声や動画そのものの記録を3倍速で視聴する方が、よほど実相がわかるようにも思います。どんな分野の人の会話も一字一句間違いなく精緻に文字起こしする仕事は、全知全能・博覧強記の猛者でなければ務まらないと感じました。
 いやはや、どんな仕事も奥が深い。。。^^;;;

JILISシンポ】 今月はJILISのシンポジウムで、またイロイロ興味深いテーマが提示されています。中でも「AIが作る著作物」に関しては追いかけるつもりでいましたが、今回のことで、“意味を分かってないAI ” の音声認識の未熟さを再確認してしまい、ある意味ちょっと、人間の能力を見直してしまいました(苦笑)。一方で、書かれた文章を読むAI 俳優のリアルさは、(意味が分かってないと思えば思うほど)驚愕モノ^^;;;。

|

« 100分で名著『維摩経』 | トップページ | 『父が娘に語る経済の話』 »

フリーランス喜怒哀楽」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




« 100分で名著『維摩経』 | トップページ | 『父が娘に語る経済の話』 »