MONO TRENDY

デジモノNAVI

言葉を「解釈」するスマホ 音声認識がますます進化

2014/11/5

日経PC21

スマートフォン(スマホ)やスマートデバイスに搭載されている音声認識機能。音声入力により、“できること”が飛躍的に増え、存在感が日ごとに高まっている。特にクルマ社会のアメリカでは、運転中でもハンズフリーでスマホを操作できるのが魅力だ。

図1 「OK、グーグル」は、アンドロイド機で呼び出せる音声認識機能。検索や音楽の再生、電話をかけるといったことができる

こうした音声認識機能は、スマホのOS(基本ソフト)ごとに独自の技術が搭載されている(図1)。

アンドロイドでは、「OK、グーグル」のひと言で音声認識機能が起動する。その後は、ウェブ検索をしたり、目覚ましをセットしたり、地図アプリに行き先を入力したりといったことが、すべて音声で実行できる(日本語版では「グーグル検索」などのアプリに限られる)。

iPhone/iPadでは、「Siri(シリ)」が音声入力の窓口になる(図2)。こちらは、フェイスブックやツイッターなどSNS(ソーシャル・ネットワーキング・サービス)への投稿も可能。音声のみで音楽や本などのコンテンツの購入もできてしまう。

図2 iOSでは「Siri(シリ)」が音声認識を担当(左)。公開中の映画の検索や、レストランの予約も可能。ウィンドウズフォン8.1から本格的に搭載された「コルタナ」は、先行する2社の機能に加えて、認識した言葉を柔軟に解釈して対応する機能も持つ(右)

いずれも、頻繁にアップデートされており、ある日突然新しいことができるようになって驚かされることもしばしばだ。

そこに打って出るのがマイクロソフト。開発途上ながら注目を集めているのが、ウィンドウズフォン8.1から搭載された「コルタナ」だ。基本的な音声入力の機能に加え、「帰宅時に」「電話をかけることを」「通知する」といった指示にも対応するよう、柔軟な“思考”ができるという。今のところ米国版限定だが、今後、他の地域や言語に対応していく予定だ。

こうした動きが、ウェアラブルコンピューターにも引き継がれていくのは必然だろう。音声認識の進化により、ユーザーが画面をタッチしてアプリを起動する時代に終わりが来たとき、使い勝手はどれだけ変わるのだろうか…。音声認識への期待は高まるばかりだ。

(ライター 瀧口範子)

[日経PC21 2014年12月号の記事を基に再構成]

MONO TRENDY 新着記事

MONO TRENDY 注目トピックス
日経クロストレンド
個店開拓の領域 QR決済事業者は3陣営に収れん?
日経クロストレンド
KDDI社長が先読み 5G時代はリカーリングが全盛
日経クロストレンド
コンビニを侵食 ドラッグストアは「小売りの王者」
日経クロストレンド
楽天OBがアットコスメでバカ売れ施策 その内容とは
ALL CHANNEL