わたしとSurfaceとSwitchと

ガジェット好きのガジェットブログ(になるはずだった)

Windows VS Google 音声認識精度バトル! 音声入力はどちらを使うべき?

私がブログを書くとき、またクラウドソーシングで作業をするとき

 

必ずと言っていいほど使うのが音声入力です。

 

もちろん音声入力でやることは文章の下書きまでで、清書する時はもちろんキーボードとマウスを使うわけですが

 

それでも音声入力を使えば作業効率が大幅UPでアゲアゲ↑↑

 

ある日、いつもと同じように作業してた時にふと思ったんです。

 

Windows標準の音声認識機能とGoogleの音声入力機能、どっちが精度がいいの?」

これは検証してみりゃならん、ということでやってみました。

 

音声入力対決 検証方法

バトルするのは以下の2つの音声入力機能

・トレーニングをしていない状態の「Windows 音声認識

Googleドキュメントの音声入力機能

 

この2つそれぞれで同じ文章を読み上げ、精度の違いを検証していきます。

 

マイクはメルカリで買った500円ぐらいのどこのメーカーのものかも分からないマイク。性能はそこまで良くないと思います。たぶん。

 

検証結果

検証結果の赤字は認識ミスを表しています。

その1 ゼルダの伝説 トライライトプリンセスのパッケージに書いてあった文章

この文章ではどちらもほとんど正しく認識してくれています。

Googleのほうは冒頭の「ひのひかり」を「日野光り」と変換ミスをしているのがおしいところ。

 

原文

Google 音声入力

光り輝く平和な世界

そこかつて神々の力によって丸くを封じ込めたかぎの世界の支配が忍び寄る

勇者としての宿命を背負う主人公リンクは光の世界を取り戻す旅に出る

 

Windows 音声認識

日の光輝く平和な世界

そこへかつて神々の力によってマルクを封じ込めた影の世界の支配が忍び寄る

有智さん宿命を背負う主人公リンクは光の世界を取り戻す旅に出る

 

その2 小説「虚白ノ夢」の冒頭

なかなかおもしろい小説だったのでリンクのっけときます。

虚白ノ夢

虚白ノ夢

 

小説の中身はさておき、音声認識の結果ですが

ちょっと差が出てきた感じですね。Googleは変換ミスがあるにしても音自体はほぼ完璧に認識しています。

Windowsは全体的に誤認識が目立ちます。

 

ちょっとオドロキなのは、変換ミスこそあるものの

固有名詞の「うすいみしろ」を両方とも正確に認識しているところですね。

原文

認識させる文章はこの小説の冒頭部分。

文章の部分を出すとヤバそうなので表紙だけ出しときます。

Googleの音声入力を見ていただければそれがほぼ原文です。

「薄い御城」は「うすいみしろ」という主人公の名前

「みよう」は「身を」

Google 音声入力

思えばつまらない人生だった

楽しいことがひとつもなかったとまでは言わない

しかしもう一度同じ人生を歩みたいかと問われれば全力で否定できる

どちらかといえばもう全てが嫌になったので私の人生が初めから存在しなかったことにしてほしい

だから私薄い御城は17回目の誕生日を迎えることなくこうやってみよう投げるのだ

Windows 音声認識

思えばつまらない人生だった

楽しいことが一つもなかったとまでは言わない

しかしもう一度同じ前世われにかえ価格割れれば全力で否定できる

どちらかといえばすべてがになったので私の人生が初めから存在しなかったことにしてほし

だから私臼井三代は17回目の誕生日を迎えることなく HOYAで身を投げるのだ

 

その3 日本人がしゃべる中国語

せっかく中国語がしゃべれるので、中国語の文章でも検証してみました。

もちろん私は生粋の日本人、中国語はネイティブではありません。

 

検証してみて率直な感想を言えば「Googleマジすげー、やべー」

ネイティブでもない、事前になにかトレーニングをしたわけでもないのに

まあまあの精度で認識してます。

 

Windowsの方はもうほぼ全滅ですね。そもそも文章になってないし。

 

原文

百度百科という中国版ウィキペディアみたいなサイトにのってた

けものフレンズ第1話のあらすじです。

Google 音声入力

兽娘薮猫间再去上打盹

突然他感觉到了草丛里有生物在移动

兴奋的手毛车而过去

开始跟这个项目玩起了宿列游戏

知道车祸所毛发现这个女孩是个面孔

她居然不知道自己是什么动物

好心的手毛决定帮女孩去图书馆调查一

他暂时给女起名叫卡帮

就这样熊猫带着卡一起踏上了前往图书馆的旅程

 

注:中国語の「彼」と「彼女」を示す「他」と「她」は両方とも同じ発音のため変換ミスがあっても赤字にしていません

注:「かばん」は原文では「卡邦」ですが「卡帮」も全く同じ発音のため赤字にしていません

 

Windows 音声認識

娘手保健在世上打盹

就让他感觉到了草丛里有钱我在一个

兴奋地说忘却过去

开始真正贤娃既然狩猎游戏

车到了。宿茂发现这个妞儿昔日的县面孔

他居然不知道自己是什么动物

好心的扫盲决定女孩是出去玩掉卡以防

他在序言女孩麒麟叫卡

这样说话带着卡一起踏上了前往丑袖管本质全

 

Google 音声入力の勝ち!

さすが世界のGoogleせんせー。無料で使える音声入力機能としては十分すぎるほどの性能です。

 

文章を入力する目的で有料の音声認識ソフトを買う意味ってあるのかな?

って思ってしまうぐらいの認識精度です。

 

Windowsのほうは、う~んもうひと頑張りといったところ。

しかしながらWindows XPが全盛期だった時代に遊びでWindows音声認識を使ってたんですが、その時と比べると格段に認識精度は上がっています。

 

がんばれWindows

 

今回の音声認識バトル

Winner is Google