言葉を「解釈」するスマホ 音声認識がますます進化
スマートフォン(スマホ)やスマートデバイスに搭載されている音声認識機能。音声入力により、"できること"が飛躍的に増え、存在感が日ごとに高まっている。特にクルマ社会のアメリカでは、運転中でもハンズフリーでスマホを操作できるのが魅力だ。
こうした音声認識機能は、スマホのOS(基本ソフト)ごとに独自の技術が搭載されている(図1)。
アンドロイドでは、「OK、グーグル」のひと言で音声認識機能が起動する。その後は、ウェブ検索をしたり、目覚ましをセットしたり、地図アプリに行き先を入力したりといったことが、すべて音声で実行できる(日本語版では「グーグル検索」などのアプリに限られる)。
iPhone/iPadでは、「Siri(シリ)」が音声入力の窓口になる(図2)。こちらは、フェイスブックやツイッターなどSNS(ソーシャル・ネットワーキング・サービス)への投稿も可能。音声のみで音楽や本などのコンテンツの購入もできてしまう。
いずれも、頻繁にアップデートされており、ある日突然新しいことができるようになって驚かされることもしばしばだ。
そこに打って出るのがマイクロソフト。開発途上ながら注目を集めているのが、ウィンドウズフォン8.1から搭載された「コルタナ」だ。基本的な音声入力の機能に加え、「帰宅時に」「電話をかけることを」「通知する」といった指示にも対応するよう、柔軟な"思考"ができるという。今のところ米国版限定だが、今後、他の地域や言語に対応していく予定だ。
こうした動きが、ウェアラブルコンピューターにも引き継がれていくのは必然だろう。音声認識の進化により、ユーザーが画面をタッチしてアプリを起動する時代に終わりが来たとき、使い勝手はどれだけ変わるのだろうか…。音声認識への期待は高まるばかりだ。
(ライター 瀧口範子)
[日経PC21 2014年12月号の記事を基に再構成]
ワークスタイルや暮らし・家計管理に役立つノウハウなどをまとめています。
※ NIKKEI STYLE は2023年にリニューアルしました。これまでに公開したコンテンツのほとんどは日経電子版などで引き続きご覧いただけます。