click

どうやって Siri は言葉を理解しているのか?その仕組みやプライバシーとの関係を解説します。

カテゴリ: ニュース , 教えて! | ライター:


日本全国の iPhone 4S ユーザーにとって待望の機能「日本語で使える Siri」。

しかし、一口に「Siri」と言ってもできることは多岐に渡ります。音声でメールを書いたり、音声でウェブ検索を行ったり、音声でリマインダーを作ったり…。

そこで不思議なのが Siri はどうやって言葉を理解しているのか。また、Siri がプライバシーを侵害するかもしれないという噂もあります。

そこで今回は Siri の仕組み、そして Siri とプライバシーの関係を解説します。

はじめにお読みください

この記事の大部分は Apple あるいはその他の企業によって公開されている情報に基づいていますが、一部は執筆者の推測によって構成されています。

推測となる部分には「考えられます」「思われます」などの表現が語尾に付いたり、推測である旨を記述しています。

また、この推測が事実とは異なる場合もあります。そのような部分については追加で取材を行い、本記事の内容を修正することがあります。

あらかじめご了承ください

iOS 5.1 へのアップデートについて

日本語版 Siri が利用できる iOS 5.1 には執筆時点でバグがあります。詳しくは以下の記事をご覧ください。

【重要】iOS 5.1 にアップデートするとセットアップ画面でループする問題について。

Siri とは

Siri とは iOS 5.1 にアップデートされた iPhone 4S に限って利用できる機能。App Store からダウンロードできるアプリではなく、iOS に組み込まれた機能の1つです。

ちなみに先日発表された「新しい iPad」、いわゆる第三世代 iPad にはこの Siri は搭載されておらず、これをベースにしたと思われる音声入力機能が搭載される予定です。

Siri にできることは大きく分けて3つあります。

  • 音声による文字の入力(声でメールを書く)
  • 音声による操作の実行(A さんに電話する)
  • 音声による検索(東京の天気を表示する・今日の予定を表示する)

現在、Siri に対応しているのは標準アプリと一部の Apple 製アプリ、そして iOS 標準の機能に限られています。具体的には以下のアプリが対応しています。

  • 電話
  • FaceTime
  • ミュージック
  • メール
  • メッセージ
  • カレンダー
  • リマインダー
  • メモ
  • 連絡先
  • 天気
  • 株価
  • 時計
  • Safari によるウェブ検索
  • Wikipedia 検索
  • 友達を探す

Remember the milk や OmniFocus といったサードパーティ製アプリも Siri には間接的に対応しています。というのも、リマインダーアプリを介してこれらのアプリに ToDo を追加できるからです。よって「間接的」という表現を使っています。

しかし今後、サードパーティ製アプリが標準アプリ並に Siri を使えるようになる可能性は現時点ではあまり高くありません。詳しい理由については後述します。

Siri の仕組み

Siri は iPhone 4S の中だけでは完結しません。何故かというと、話しかけられた音声を処理して iOS が理解できる形に変換するには iPhone 4S では力不足だからです。

コンピュータが音声の持つ意味を理解するにはデータベースが必要です。入力された音声を解析し、データベースに合うものがないかを検索しなければなりません。これは、英語の文章を英和辞書を引きながら読むという感覚に近いです。

しかし、Siri が相手にするのは文字ではなく音声。そのため、同じ意味を持つ音声でも人によって声色や発音などが違います。ですから、辞書のようにシンプルな構造とはならず、Siri が利用するデータベースはおのずと巨大なものになるでしょう。

そんな巨大なデータベースを iPhone に収録することは困難です。例え収録できたとしても検索するだけでバッテリをかなり使ってしまいます。

そこで Apple は Siri への命令を録音したデータを、iPhone から自社のデータセンタにいったん送信し、そこで解析することにしたと考えられます。そのために Siri を利用するには 3G 回線あるいは Wi-Fi 回線に接続した状態でなければならないのです。

そして、解析したデータを元にデータセンタでは iPhone に行わせる「コマンド」を探すはずです。例えば解析結果が「今日の天気は」という内容だったら、「天気アプリで情報を取得して今日の予報を表示する」というコマンドになります。

そして、そのコマンドはデータセンタから iPhone に送信され、これを iPhone が受け取って実行します。こうして Siri は音声による命令を実行すると考えられます。

より複雑な命令を実行するためには個人情報も必要

iOS 5 と iPhone 4S の利用規約によれば Siri は音声だけでなく、Siri に命令を発した時の位置情報も Apple のデータセンタに送信しています。

例えば「ここを出たらメールするように覚えておいて」という命令を実行する為には「ここ」、つまり Siri に命令を発した時の位置情報が必要です。「ここ」と「現在位置」を関連付けてリマインダーを表示するきっかけとして設定するため、位置情報は Apple のデータセンタに送信されるのです。

また、Siri をオンにしている間は、連絡先アプリに登録されている連絡先の氏名やニックネーム・ユーザーとの関係、設定アプリの【Siri】において【自分の情報】として選択した連絡先の氏名、同期されている楽曲名も Apple のデータセンタに送信されます。

加えて Siri に対応した標準アプリに登録されているデータも利用されるとしています。これらが常に Apple へ送信されるかは不明です。

まるで Apple が iPhone ユーザーの個人情報を欲しいがままに集めいているように思えますが、実際には Siri をより快適に利用できるようにする為なのです。

例えば「妻に電話する」という命令を最初に出した場合、Siri は誰が「妻」に該当するのかを尋ねてきます。ここで連絡先に登録している氏名を言えば、この関連付けのデータは Apple のデータセンタに保存され、次回から Siri は「妻」が誰であるかは尋ねません。

カレンダーの情報を Siri が利用するのも、例えば「次の会議の場所は?」という質問が出された時にカレンダーに登録されている予定を解析しなければならないからです。

Siri がサードパーティ製アプリに対応する可能性

先程サードパーティ製アプリが Siri を利用できる可能性は現時点では低いと述べましたが、それは Siri が個人情報を直接的に扱うためだと考えられるからです。

また、Siri がサードパーティ製アプリに対応した場合、いま以上にデータセンタに送られてくるデータが増えるでしょう。そうなると送られてくるデータの量がデータセンタの処理能力を超える可能性が高く、Siri が機能しなくなってしまいます。

そうしたことを防ぐ意味でも Siri はサードパーティ製アプリに対応する可能性は現時点では低いと言えます。

Apple は送られてきたデータをどう取り扱うのか

Siri を利用すると送信されるデータは Apple とその子会社・代理人が利用できると規定しています。そして利用の形態は送信・収集・維持・処理・使用となっています。

そして利用の目的は、これが記載されている利用規約の表現から、Siri とその他の Apple 製品・サービスを提供・向上するために限られていると推測されます。

また、Siri を介して収集したデータは AppleID などの Apple が取得した、他の情報とはリンクされません。

以上の内容は iOSソフトウェア使用許諾契約4の c に記載されています。

こういった規定は iPhone 4S の利用規約ならびに iOS 5 の利用規約に含まれています。

iPhone 4S の利用規約は契約時に提示されています。iOS 5 の利用規約は iPhone の初回セットアップ時・復元後のセットアップ時に表示され、すでに電話・Safari などのアプリをお使いであれば【同意する】ボタンをタップしているはずです。

Siri の将来

先程述べたように、Apple は Siri の品質向上のためにデータを収集し、利用することができます。

これが意味するところは、Siri は今後も進化していくということです。

今は認識しにくい言葉でも、利用者が増えていくことでデータベースがより豊かになっていくので、今後は認識しやすくなる可能性があります。

また、利用規約によれば、これらのデータは Apple の他の製品・サービスにも活用できるので、Siri から Apple の新しい製品やサービスが生まれるかもしれません。

Siri とプライバシー

Siri が音声データだけでなく、位置情報や標準アプリに登録されているデータも送信することは先ほど述べた通りです。よって、Siri と個人情報とを簡単に分け隔てることはできません。

それでも Siri に対する影響が比較的少ない、位置情報についてはユーザーの側で送信するか否かを設定することができます。設定方法は、設定アプリを開いて【位置情報サービス】をタップし、【Siri】をオフにするだけと簡単です。

この設定を行った場合、位置情報を使ったリマインダー・予定の作成、マップの表示といった命令を Siri は実行できなくなります。

Siri が学習してしまったことをリセットするには、設定アプリを開いて【一般】→【Siri】→ Siri をオフにする→数分待つ→ Siri をオンに戻します。

ただし、学習内容をリセットしたからといって、Apple のデータセンタに送られた個人情報までが削除されるかは Apple が言及していないため、不明です。

そもそも Siri 自体をオフにすることは、設定アプリを開いて【一般】→【Siri】→ Siri をオフにすれば可能です。また設定アプリの【一般】の【機能制限】でもオフにできます。

Siri に足りないもの

残念なことに、現在の Siri は個人情報を送って利用するか、個人情報を送らないから利用できないという2つの選択肢しかありません。

Siri の機能の中には標準アプリに登録されているデータを使わずとも、利用できるものがあります。例えばウェブ検索や Wikipedia 検索、メール/メッセージを書く機能です。

よって、今後は利用する機能を絞って Siri を利用できるようになると、プライバシー侵害に対して懸念を持つ人でも利用しやすくなるでしょう。

オプトインサービス

また、Siri にはオプトインサービスもありません。

このサービスの目的はユーザーに選択の余地を持たせることです。実際にこれを導入しているのが Google の音声検索です。

Google の音声検索は Google アプリなどで利用できる機能の1つ。検索したい単語を話すことで Google 検索が実行できます。Siri のウェブ検索と同様の機能です。

Google の音声検索はユーザーが許可を出した場合には音声データを収集して活用します。これもデータベースを充実させ、音声認識の精度を向上させるためです。

しかし、ユーザーがそれを拒否することはいつでもできます。また、これを拒否すればその収集を終了させ、データを破棄させることができるのです。これが Google の音声検索におけるオプトインサービスです。

もちろん、その代償として音声認識の精度は落ちてしまいますが、Google の音声検索サービス自体は利用できます。

このように音声データの蓄積を行うか否かを選択できるサービスを導入する余地は Siri にもあるように思われます。

参考


この記事に付けられたタグ

, , ,

ライター / 記事カテゴリ

asyunin | 2012.3.11 8:08 am | ニュース , 教えて!


最近話題のレビュー記事一覧 ( 直近3日間の記事のRT数順 )


AppBankの最新情報をゲット!


AppBank for iPhone | iPhoneアプリ
AppBank for iPad | iPadアプリ

サイト内検索


特設ページ を探す

ゲーム好きのAppBank
iPhoneユーザのAppBank
ガジェット好きのAppBank

今日のアクセサリーレビュー

AppBankチャンネルを見る>>







AppBankのアプリ

AppBank2新しいAppBank(無料)
iPhone5対応!最新のAppBankアプリはこちらから(使い方を読む


AppBank2AppBank Store(無料)
AppBank Storeでのお買い物はこのアプリ!(使い方を読む


iPhoneの説明書iPhoneの説明書(無料)
iPhoneをもっと便利に楽しめるようになる。そんなアプリです。(使い方を読む


ダンゴル ゴルフゲームトキノラビリンス(無料)
謎を解きながらラビリンスを進む、迷宮アクションRPG(使い方を読む


もっと見る>>