[PR] Dragon Dictation: 「声」でテキストを入力できる、高性能の音声認識アプリ。TwitterやFacebookへの投稿も楽らく!無料。

カテゴリ: iPhoneアプリ , 仕事効率化 , 無料アプリ , PR | ライター:


iPhoneやiPad・iPod touchといったiOSデバイスが、いまいちPC/Macの代わりにならないと筆者は考えているのですが、その一因は文字入力のインターフェースがiOSではまだこなれていないことにあります。とりわけ、標準のかな漢字変換が低い精度のままなのが気にさわります。しかし残念ながら、PCやMacのようにOS標準のかな漢字変換ソフトをサードパーティ製品に置き換えられる仕組みはiOSにありません。その一方、メモアプリという形で、かな漢字変換ソフトの大手がApp Storeに参入してきたのは以前話題になりましたね。

今回は、「メモアプリとして新しいテキスト入力インターフェースを提供する」とっておきのソフトを紹介します。Nuance CommunicationsのDragon Dictationです。


Dragon Dictation


「Dragon Dictation」は、マイクから吹き込んだ音声をテキストに変換し、それをメールやSMSで送信できるメモアプリです。‥‥と、一言でいえばあっさりしたものではありますが、シンプルな内容であるからこそ、その背景にある高い技術力は使ってみないと実感できません。ぜひ実体験してほしい、と筆者が声を大にしたいほどの出来です。

このアプリは、マイクを内蔵したiPhoneとiPadだけではなく、iPod touchにも対応しています(App Storeでの説明文では第2世代・第3世代に対応しているとありますが、もちろん現行の第4世代でも使えます)。このときiPod touchでは、付属イヤフォンのような外付けのマイクを使います。対応機種が広いものの、OSがiOS4以上でないと使えない点に注意が必要です。

App Storeでの説明文を読んでみると、「プライバシー」に関する仰々しい注意書きがあります。レビューなどを見てもそこを気にする人が多いようで、ユーザーにとって使う前の心理的ハードルになってしまっているのは否定できません。「Dragon Dictationは、ユーザーの事前許諾を受け、製品の変換精度向上のために電話帳に登録されている名前リストを一度だけアップロードします」から始まる文章に、もしかして個人情報が取られてしまうのでは?と心配になる人が多いわけですね。この注意書きは、アプリを実際に立ち上げた時にも表示されます。

しかし実のところ、ユーザーが電話帳に登録した知り合いの名前を変換候補にあらかじめ登録しておくだけのことです。名前リストのみをサーバにアップロードして、そのデータはユーザーごとに管理され他人がアクセスすることはない仕組みなので、セキュリティ面でそれほど心配することもないでしょう。アプリを使い始める前に、アップロードを許可するなら「はい」、拒否するなら「いいえ」を選択します。


当然、友人の名前をNuance Communicationsのサーバに上げるのは嫌だ!という方もいるでしょう。その時は遠慮なく「いいえ」をタップしましょう。実は、ここで名前リストをアップロードをしなくても、知り合いの名前が絡む文章で変換精度が若干落ちるくらいで、ソフト自体は普通に使えるのです。このハードルを嫌がって最初から使わないなんて勿体ない!

大事なので2度言います。プライバシーを気にしてソフトを使わないという選択をする必要はありません。住所録(名前リスト)のアップロードを拒否しても普通に使えます。

プライバシー絡みではもう一つ、「Dragon Dictationの使用は、3Gネットワークに接続している必要があります」と説明されている点を気にする人もいるかも知れませんね。つまり、音声の吹き込みから認識・テキストへの変換をしている間、Nuance Communicationsのサーバとアプリとが通信します。書いているテキストの中身が通信でやりとりされるわけですから、使っていてそれを嫌と思うかどうかですね。(なお3Gネットワーク必須のように書かれていますが、iPod touchにも対応していることで分かるように、3Gが無くても無線LANでネットと繋がっていれば大丈夫です。)


通信環境にはくれぐれも注意して下さい。接続が不安定だと、変換に待たされたあげくタイムアウトのエラーが出て、吹き込んだ音声がパーになってしまいます。ネットに安定して繋がるところへ移動してからソフトを立ち上げましょう。

さて、使い始める前の大切な注意事項があったので前置きが長くなりましたが、Dragon Dictationを実際に使ってみましょう。ソフトが立ち上がったら、中央に赤い●のボタンが出てきます。これを押して音声を吹き込みます。つまり録音ボタンですね。


「録音中」の文字が出てきたら、マイクに向かって文章を吹き込みましょう。失敗した時は「キャンセルボタン」を、うまく言い終えたなら「完了」ボタンを押します。ちなみに、吹き込んだ後でしばらく沈黙があると、そこで文章が終わったと判断されて自動的に変換が始まるようにも設定できます(後述する設定メニューで「終話を自動検知」をONにします)。変換させるのに、完了ボタンを押すか少し待つか選択はお好みでどうぞ。せっかちな私は「完了」ボタン派です。


吹き込まれた音声はサーバと通信しながら文字への変換処理をされていきます‥‥。この時点でも「キャンセル」ボタンは利きますので、もし操作を間違えてこの画面に来てもキャンセルできます。


ハイ、文字が出てきました。かな漢字変換で他に変換候補がある場合には、文字をタップすると表示されます。これで変換ミスをある程度修正することはできます。「削除」をタップすれば青色で反転した部分の文字が削除されます。青色の反転はテキスト編集時の「選択」に当たるものですが、テキストをドラッグすると選択範囲を適宜調整できます。(なお、テキストの任意の部分を青色反転させた状態で録音ボタンを押すと、その選択部分が新たに吹き込んだテキストに置き換えられます。)


このアプリを使ってみてすぐに感心するのが、この変換精度の高さです。吹き込みと分析がうまくされるよう、ユーザー側で「ハッキリ読み上げる」「速すぎないようにする」などの工夫が必要になりますが、自分の発声に左右されるとはいえ、初期状態でもおおむね満足できるレベルに達しています。どんどん使い込んでいって変換効率が改善されていくことを考えると、ワクワクしてきます。

入力したテキストは、iOS標準のソフトウェアキーボードを使って編集することもできます。録音ボタンの左にあるキーボードアイコンをタップすると、画面の下半分にキーボードが出てきます。標準のキーボードなので、使い方は皆さんよくお分かりですよね?


画面右下のアイコンは、入力したテキストを送信するボタンです。ご覧の通り、TwitterやFacebookに投稿ができる他、SMSやメールとして送信するアイコンが用意されています。


テキストをコピー&ペーストしたい場合には、「コピー」アイコンを使います。入力したテキストがすべてコピーされます。ペーストの方は、アイコンを探す必要がありません。テキストが表示された状態でダブルタップすれば、そこに貼り付けられます。


「eメール」アイコンをタップすると、入力したテキストがメール本文に貼り付けられたメール作成画面が出てきます。あとは宛先を入れて、通常のメール送信操作をするだけです。


「SMS」アイコンをタップするとSMSの送信画面になります。メッセージ入力欄にテキストが入っていますね。あとは宛先を入力して送信。


最近のテキスト入力系アプリでは、TwitterとFacebookとの連携も定番となっています。それぞれIDとパスワードを最初に入力する必要があります(後述の設定メニューでも入力できます)が、それさえしてしまえば投稿もラクラクです。


歯車アイコンをタップすると「設定」です。「言語」メニューへ進むと分かるのですが、このアプリは外国語に細かく対応していて、たとえば同じ英語でも国や地域によるアクセントなどの違いを認識するのが特長です(日本語はさすがに1種類ですけれども)。


さて、いかがでしょうか。先の例文があまりに短いので、まだ変換精度についてピンと来ないかも知れませんね。ここからは幾つかの変換実例を見ていきましょうか。「東京特許許可局」「庭には二羽ニワトリがいる」は難なく一発変換。


「入れたてのお茶」。「立て」と出てきましたが、変換候補にはあるので良しとしましょう。ちなみに、2枚目の画像は「入れた手」と出てきていますね。おそらく筆者の発声(イントネーション)が1度目と2度目で異なり、それで変換結果も変わったものと考えられます。


長めの文章を入れてみました。これは高確率で正しく変換できました。原文と違うのは「京美人」が「超美人」と出た部分のみ。「きょう」が「ちょう」と認識されたのは、おそらく筆者の発声の問題でしょう。語の頭をハッキリ発音するのがコツなのかも。


この種の変換テストでよく登場する例文「貴社の記者が汽車で帰社した」も一発変換。ただ、それをもじった「貴社の記者が汽車で貴社に帰社した」「貴社の記者が汽車を使って帰社した」「貴社の記者が汽車を使って貴社に帰社した」だと少し怪しくなってきます。それでも、まあまあの正答率ですね。ちなみにDragon Dictationの名誉のために述べておくと、もじった方の文章は某大手の変換ソフトでも「貴社の記者が記者を使って」とやってしまい、一発変換できません(笑)。


難しい文章だとどうなのだろう?と、適当な法律の条文を読み上げてみました。これもかなりの正答率です。ところどころ「あれ?」というところもありますが、このあたりは筆者の読み上げも関係するので、アプリだけのせいにはできませんね。


なお、読み上げの際に句読点やカッコも入力できます。「、」が「てん」、「。」が「まる」、()は「かっこ」「かっことじ」、「」は「かぎかっこ」「かぎかっことじ」といった具合です。編集段階でキーボードを使って入力するのでも構いませんが、音声で入れるコツを掴むと、案外イケますよ。(その代わり、文章に「点」や「丸」が入るときに変換精度が落ちるように思えます。)


以上のような例文でも、おそらくアプリの変換精度を示すのには足りないと思います。ぜひ、皆さんも思い思いの例文で音声入力を試してみて下さい。もしかしたら、iOSで一番手に馴染む入力手段になるかもしれませんよ!


Dragon Dictation
  • 販売会社URL:Nuance Communications
  • 掲載時の価格:無料
  • ビジネス
  • 容量: 5.4 MB
  • 執筆時のバージョン: 2.0.10
iPhone アイコン
Dragon Dictation

この記事に付けられたタグ

, , , , ,

ライター / 記事カテゴリ

awesomeB | 2011.7.1 7:00 am | iPhoneアプリ , 仕事効率化 , 無料アプリ , PR

Twitterで@appbankをフォローして最新情報をゲット!



最近話題のレビュー記事一覧 ( 直近2週間の記事のRT数順 )


週間PVランキング(仕事効率化 カテゴリ)


このエントリーをはてなブックマークに追加

サイト内検索

例: カレンダー、カメラ、デコメ、なめこ


究極の神iPhone特集


「教えて!AppBank」始めます。iPhoneに関する疑問・質問にお答えします。


【保存用】Google カレンダーの使い方完全まとめ。iPhoneのカレンダーを使いこなそう!


AppBankのiPhoneまとめ・特集一覧。アプリ・ケース・使いこなし他