日経トレンディ

AI GIJIROKUや「音声議事録システム」(ユーザーローカル)、「Sloos」(QuantumCore)は、発言者を識別する「話者識別機能」も売りだ。サービスによっては会議前に参加者それぞれの声紋を登録したり、会議用URLを共有したりなどの準備が必要になるが、生成されたテキストに発言者の名前が自動で付加されるのは便利だ。実際のオンライン会議では話者を比較的識別できていたが、一つのマイクを共有する対面会議では識別精度が低かった。

◆音声議事録システム(ユーザーローカル)

無料で使えるサービス。今後の有料化も予定していないという。発言内容をAIで「ポジティブ」「ネガティブ」などに分析したり、頻出単語を抽出するなどユニークな機能を搭載。音声データはクラウドに保存しない仕組み

【実際の使用例】

◆Sloos(QuantumCore)

時間無制限でリアルタイムの音声文字起こしを使える無料のサービス。話者識別も可能だ。生成されたテキストをダウンロードするとクラウド上から音声とテキストが消える仕組み。21年3月下旬にアップデートを行い、音声認識の精度が改善された(今回のテストはアップデート前に実施したもの)

【実際の使用例】

今回、7つのサービスをテストして分かったのが、音声の認識率は録音環境に大きく左右されるということ。部屋の反響音や雑音、声の大きさや話し方、マイクの性能や距離など、様々な要素に認識率は影響される。大事な会議でこれらのサービスを使う際は、必ず事前に試しておきたい。

◆TRASC(フォトロン)

録音データのテキスト化に対応。直接録音機能は無い。別料金だがアップロード時に言語を選ぶことで生成テキストの翻訳も可能だ。RimoVoiceと同様に動画ファイルをテキスト化し、字幕データ(.srt)としても出力できる。音声、動画/3分110円(税込み。クレジットカード払いの場合)

【実際の使用例】

◆AutoMemo(ソースネクスト)

本体のボタンを押すと録音を開始し、終了後にクラウド上でテキスト化が行われる仕組み。スマホアプリでハイライト表示しながら音声を再生できるが編集はできない。認識精度は他よりも低めだが話の概要は読み取れる。本体/実勢価格1万9800円(税込み)、音声認識/月額980円(税込み。30時間まで)など

【実際の使用例】

(注)テスト結果および機能や料金などのサービス内容は21年3月中旬時点のもの

(日経クロストレンド 佐々木淳之)

[日経トレンディ 2021年5月号の記事を再構成]

MONO TRENDY連載記事一覧