検索朝刊・夕刊LIVEMyニュース日経会社情報人事ウオッチ
NIKKEI Prime

朝夕刊や電子版ではお伝えしきれない情報をお届けします。今後も様々な切り口でサービスを開始予定です。

検索朝刊・夕刊LIVEMyニュース日経会社情報人事ウオッチ
NIKKEI Prime

朝夕刊や電子版ではお伝えしきれない情報をお届けします。今後も様々な切り口でサービスを開始予定です。

検索朝刊・夕刊LIVEMyニュース日経会社情報人事ウオッチ
NIKKEI Prime

朝夕刊や電子版ではお伝えしきれない情報をお届けします。今後も様々な切り口でサービスを開始予定です。

NIKKEI Primeについて

朝夕刊や電子版ではお伝えしきれない情報をお届けします。今後も様々な切り口でサービスを開始予定です。

/

「音声文字起こし」7サービス 3つの視点で徹底検証

詳しくはこちら

NIKKEI STYLE

日経トレンディ

話した言葉をテキストデータに変換できる「音声文字起こしサービス」。テレワーク時代の情報共有ツールとして大いに役立つものの、気になるのはその実用性だ。発言の認識精度に加え、大まかな流れや会話の文脈を後から振り返るのに使えるのかどうか。主要な7つのサービスを使用し、比較した。

深層学習(ディープラーニング)やビッグデータの活用が進み、音声認識の精度が大きく向上。話した言葉をテキストデータに変換できる「音声文字起こしサービス」が相次いで登場している。

会議の内容を振り返ったり、他の人にシェアしたりなど、テレワーク時代の情報共有ツールとして注目されているこれらのサービスは、どこまで実用的なのか。主要な7つのサービスを実際に使い、比較してみた。

(1)認識方式

音声文字起こしサービスを選ぶ際のポイントは3つ。まず重視すべきは音声の「認識方式」だ。進行中の会議の音声をリアルタイムでテキスト化していくものと、アップロードした会議の録音データをテキスト化する2つの方式がある。リアルタイム方式であれば会議中でも直前の発言などを確認できて便利だが、会議の間はインターネットに接続しておく必要がある。

(2)直接編集

生成されたテキストを、サービス上で「直接編集」できるかどうかにも違いがある。特に再生している位置をテキストでハイライト表示できると、後から文字修正する際に便利だ。

(3)保存

さらに、会議の音声やテキストをクラウドに「保存」するかにも違いがある。保存した会議の内容を後から確認したり共有したりできるサービスもある。

総合的に優れていたサービスはこれだ!

今回比較した音声文字起こしサービスは、正確な議事録を作るにはテキストの修正が必要になるものの、会議の大まかな流れや会話の文脈を後から振り返る用途にはどれも使えそうな印象だ。口語で自由に議論する会議ではなく、文章を読み上げてテキスト化する目的であれば認識精度はさらに高まる。

比較した7つのサービスの中で、使い勝手が総合的に優れていたのは「toruno(β版)」(リコー)だ。パソコンに専用ソフトをインストールする必要はあるが、リアルタイムで音声をテキスト化。会議の途中でも聞き逃した発言などをすぐに読み返せるのは便利だ。

秀逸なのが独自の画面キャプチャー機能。パソコンのディスプレー画面を30秒に1度自動で撮影し、テキストデータと合わせて時系列に保存していく。オンライン会議で画面共有されたスライドや資料などを見過ごしてしまっても、後から確認できるのは他には無い便利機能だ。

torunoはオンライン会議での利用を想定したサービスだが「ICレコーダーの録音データをパソコンで再生しながらtorunoを起動することで、音声認識機能を使うこともできる」(リコー)。現時点では「β版」のサービス(正式版の時期は未定)だが、記録した音声やテキスト、画面キャプチャーを容量無制限で保存できるのも大きな魅力だ。

◆toruno(β版)(リコー)

【実際の使用例】

ユーザーインターフェースがシンプルで使いやすかったのが「RimoVoice」(Rimo)。ブラウザーでサービスにアクセスして録音開始ボタンを押すか、ICレコーダーなどで録音しておいた音声データをアップロードする方式だ。今回のテストでは、約30分の音声データをテキスト化するまでにかかった時間は約5分と高速だった。

特に便利なのが、音声の再生箇所のテキストをハイライト表示する機能だ。保存された会議の音声を聞き返しながら、文字の修正や編集などの作業がラクに行えた。スマホにも対応しており録音や再生が可能なだけでなく、パソコンと同じように再生時のハイライト表示や直接編集に対応。移動中でもスマホで議事録を整理できるのは便利だ。

◆RimoVoice(Rimo)

【実際の使用例】

翻訳機能を組み合わせたユニークな音声文字起こしサービスもある。「AI GIJIROKU」(オルツ)はリアルタイムに音声をテキスト化するサービスだが、認識したテキストを英文などに変換し、人工知能(AI)の自動音声で再生できる。対応する言語は約30カ国語。会議の内容を記録しながら同時通訳のように使えるため、海外との商談時などに役立ちそうだ。

◆AI GIJIROKU(オルツ)

【実際の使用例】

AI GIJIROKUや「音声議事録システム」(ユーザーローカル)、「Sloos」(QuantumCore)は、発言者を識別する「話者識別機能」も売りだ。サービスによっては会議前に参加者それぞれの声紋を登録したり、会議用URLを共有したりなどの準備が必要になるが、生成されたテキストに発言者の名前が自動で付加されるのは便利だ。実際のオンライン会議では話者を比較的識別できていたが、一つのマイクを共有する対面会議では識別精度が低かった。

◆音声議事録システム(ユーザーローカル)

【実際の使用例】

◆Sloos(QuantumCore)

【実際の使用例】

今回、7つのサービスをテストして分かったのが、音声の認識率は録音環境に大きく左右されるということ。部屋の反響音や雑音、声の大きさや話し方、マイクの性能や距離など、様々な要素に認識率は影響される。大事な会議でこれらのサービスを使う際は、必ず事前に試しておきたい。

◆TRASC(フォトロン)

【実際の使用例】

◆AutoMemo(ソースネクスト)

【実際の使用例】

(注)テスト結果および機能や料金などのサービス内容は21年3月中旬時点のもの

(日経クロストレンド 佐々木淳之)

[日経トレンディ 2021年5月号の記事を再構成]

春割ですべての記事が読み放題
有料会員が2カ月無料

有料会員限定
キーワード登録であなたの
重要なニュースを
ハイライト
登録したキーワードに該当する記事が紙面ビューアー上で赤い線に囲まれて表示されている画面例
日経電子版 紙面ビューアー
詳しくはこちら

ワークスタイルや暮らし・家計管理に役立つノウハウなどをまとめています。
※ NIKKEI STYLE は2023年にリニューアルしました。これまでに公開したコンテンツのほとんどは日経電子版などで引き続きご覧いただけます。

関連企業・業界

セレクション

トレンドウオッチ

新着

注目

ビジネス

ライフスタイル

新着

注目

ビジネス

ライフスタイル

新着

注目

ビジネス

ライフスタイル

フォローする
有料会員の方のみご利用になれます。気になる連載・コラム・キーワードをフォローすると、「Myニュース」でまとめよみができます。
春割で無料体験するログイン
記事を保存する
有料会員の方のみご利用になれます。保存した記事はスマホやタブレットでもご覧いただけます。
春割で無料体験するログイン
Think! の投稿を読む
記事と併せて、エキスパート(専門家)のひとこと解説や分析を読むことができます。会員の方のみご利用になれます。
春割で無料体験するログイン
図表を保存する
有料会員の方のみご利用になれます。保存した図表はスマホやタブレットでもご覧いただけます。
春割で無料体験するログイン

権限不足のため、フォローできません

ニュースレターを登録すると続きが読めます(無料)

ご登録いただいたメールアドレス宛てにニュースレターの配信と日経電子版のキャンペーン情報などをお送りします(登録後の配信解除も可能です)。これらメール配信の目的に限りメールアドレスを利用します。日経IDなどその他のサービスに自動で登録されることはありません。

ご登録ありがとうございました。

入力いただいたメールアドレスにメールを送付しました。メールのリンクをクリックすると記事全文をお読みいただけます。

登録できませんでした。

エラーが発生し、登録できませんでした。

登録できませんでした。

ニュースレターの登録に失敗しました。ご覧頂いている記事は、対象外になっています。

登録済みです。

入力いただきましたメールアドレスは既に登録済みとなっております。ニュースレターの配信をお待ち下さい。

_

_

_