2016年11月現在
キーボード入力と並行できれば
無料で使えるGoogleの音声入力もほぼ実用レベルになってきた。
と感じたのでお伝えしておきます。
Googleの音声認識も
2,016年になってかなり進化しています。
絶賛していた人も多かったのですが
2015年ぐらいはまだまだ実用に耐えられるレベルではなかった
と記憶しています。
この音声入力の認識率は
「半年前は全然だったのに今は恐ろしく正確になっている」
みたいな業界?です。
日々の進歩が本当にハンパないです。
ということで今回は
Google Chromeブラウザの「グーグルドキュメント」のみで無料で使える
Googleの音声認識で1400文字ほど入力してみました。
適当に思いついたことを話しただけなので
おそらく10分くらいしかかかってないはずです。
ちなみにまったく修正を行っていません。
誤字脱字には、赤で修正を加えていきたいと思います。
(ご存知のとおりGoogleの音声入力は改行や句読点などの音声コマンドは使えません。普通に喋っているだけではスペースも何もないギチギチの文章になってしまいます。なので、ここではパソコンのキーボードを使って毎回Enter押して改行しています。)
google音声入力の変換精度のサンプル
下の文章から始まります。
今回は google ドキュメントでの音声入力です
改行などのコマンドは使えないのでキーボードを使用する必要があります。
句読点などは音声コマンドは使用できないのでキーボードを使用するようにしましょう。google の音声入力は とにかく進化がすごいです
適当に話しているだけでもリアルタイムで十分変換してくれます。
スマートフォンなどでは音声入力とソフトウェアキーボードが同時に使えないのがネックですが
それでもこの進化は素晴らしいです安物イヤホンマイクでもほぼ100%の割合で変換してくれます
今現在はパソコンでは google chrome ブラウザを使って google ドキュメントでしか
音声入力は使用することができませんが近い将来ほぼ完璧な形になって
我々を 驚かせてくれると思います2年ぐらい前までは google の音声入力は実用レベルではありませんでした
ただいまは90パーセントぐらいの認識率です
しかも提供しているのは google ですので
この先更なる進化が見込めるはずですこうなると他の音声認識ソフトはちょっと 太刀打ちできない感じになるんでしょうか
音声認識がいつストップするかというのがよくわからないのですが
それを覗いてもこの進化は本当に素晴らしいですドラゴンスピーチなどはパソコンのスペックにかなり影響します
変換率とかもしかし google の音声入力は chrome ブラウザさえあれば 誰でも無料で使用することができます
おそらく今でも google は音声データを集めていることでしょうこの音声認識の進歩にはめまぐるしいものがあります
はっきり言って1か月前と今では比べ物にならないくらい進化している
そういう業界です現在では パソコンで入力する時はキーボードと併用する必要がありますが
改行や句読点などが入力できないため
それでも音声入力をしている時の修正の仕方が他のソフトと比べて比べ物にならないくらいすごいです長い文章を打つと段落からしっかりとどのような 文字を打ちたいのかを認識してくれます
我々がやるべきことは本当に画面に向かって話すだけです
リアルタイム変換の中でも前後の文脈に応じて 文章を的確に修正してくれますこのリカバリーの広さはおそらく google 音声入力が一番だと思います
またさらに1か月後には劇的な進化をしているでしょう
本当に 恐ろしい会社だと思います1年前には落第生だったのか今は東大に合格しているみたいな感じ
どの会社も音声入力には躍起になっていると思いますが google の音声入力はとにかく目を見張るものがありますただものすごく早く喋ってはだめです
文字の修正がついてきませんただ音声入力の場合はそこまで早くしゃべる必要はないのでちょうどいいスピードと言えると思います
キーボードで改行を一つ
適当に喋っていればそれなりの文章が出来上がります後は音声入力する時間に制限が無ければ完璧になのですが
認識精度のテスト終わり。
ゆっくり話してあげればほぼ誤認識のないレベル
本当にこの業界は進化しています。
それも、日進月歩といった感じでとにかくレベルアップが半端ない感じです。
個人的には
とうとうグーグルの音声入力もここまで来たか!
みたいな感じでかなり嬉しく思います。
「 Androidケータイで、音声入力とキーボード入力を併用できるのか? 」はわかりませんがもしできたらandroidでも快適に文章を入力することができるはずです。
(音声入力をしている最中にキーボードを使えるというのが条件)
この文書の中でも書いてますが
実際にテストしていて凄いなと思ったことがあります。
それは、
「 1つの文を言い終わると、それが多少間違った変換をしてても強引に正しい文字に直してくれるという修正能力」
これがとにかく抜群です。
予測変換みたいな感じです。
「正しく聞き取ると言うよりも、前後の文脈を考え膨大なデータベースからそこに入る正しい文字を導き出している」といったほうが正しいのではないでしょうか?
ゆっくり話す必要はありますが
多少詰まったり滑舌が悪くても大丈夫です。
そのまま変換するわけではなくて
「あー、あなた今噛んじゃったけど、実際はこう言いたいんですよね。うんうん」
みたいな感じで、最終的に自分の言いたかった文章に修正してくれます。
ドラクエで言うと
間違いなく「賢者」の位置づけかなと
実際に試しみてください。
ちょっと早口が苦手なような感じがしましたがゆっくり話すと多少間違えていてもその後優しく修正してくれます。
冒頭でも書いたように句読点など音声コマンドで入力できません。
これは諦めるしか無いようです。
ただもう一つ不満点があります。
それは、音声入力が終わるタイミングがいまいちつかめない。
画面は入力している画面になっています。
でも入力できないといったことが多々ありました。
この度に、画面の入力ボタンをマウスでクリックするのは面倒です。
パソコンでGoogle音声入力を使うなら絶対にショートカット覚えて下さい。
Ctrl + Shift + Sで音声入力のオンオフを切り替えできます。
音声入力の終了を教えてくれないのです。
途中で完全に無視される感じです。
そんな時は、ショートカットキーを連打するだけで回避することができます。
それ以外にも変換ミスがあったときなども頻繁に切り替えることがあります。
なので絶対にショートカットキーだけは覚えておくようにしましょう。
実際、今回使ってみて1年前と比べてあまりの進化にびっくりしました。
認識率や音声コマンド使えるという点ではまだまだドラゴンスピーチかなとも思います。しかし、これからGoogleのさらなる進化に期待したいところです。何よりも無料。しかもインストールも何もいらないという手軽さが嬉しいですね。
ということで、 Google音声入力の制度のテスト2,016年版でした。
かなり前の記事では
Google音声入力はまだまだ実用には耐えない」とか書いていますが今現在は結構すごいことになってます。
この記事の文字数:3000文字程度
合計入力文字数:30万6000文字程度
記事数:147記事