ライフスタイル テレワーク・ビデオ会議に超便利!音声認識技術がすごい自動文字起こしレコーダー

女性が使いやすく、毎日がちょっと楽しく便利になるデジタルガジェットを、ライターの太田百合子さんが解説! 豊富な知識と自腹買いであれこれ試した経験からガチのオススメを紹介します。

★★★

12月9日、ソースネクストが新製品『AutoMemo S』と『ポケトーク字幕』を発表しました。どちらもAIを用いた音声認識技術をベースにしたもの。最近の音声認識技術の進化には驚くばかりですが、またも驚きと実用性を備えた製品が登場しました。

AIが文字起こし&自動保存

『AutoMemo S』は、自動文字起こしの機能を備えたボイスレコーダーです。
手のひらサイズの小さなディスプレイ付きのデバイスで、画面下のセンサーに触れると録音開始。再び触れると録音を停止できます。録音後、音声データを選んで「テキストに変換」をタップすると、あらかじめ設定したWi-Fi経由でクラウドにデータが送信され、自動で文字起こしされるしくみ。試しに5分ほどの音声を録音してテキストに変換してみましたが、ほとんど待たされることなく、あっという間に変換されました。

デスクの上のラップトップの画面を見ている少年

低い精度で自動的に生成された説明
手のひらサイズのコンパクトなボイスレコーダーで自動文字起こしができます。

文字起こしの精度は話者の話し方や滑舌、周囲の環境音にも左右されますが、比較的静かな場所で2人での会話を録音したところ、ところどころ間違いもあるけれど、固有名詞もちゃんと変換されていて、内容をしっかり把握することができました。テキストの該当個所をタップして、聞きたいところの音声を再生できるのも便利です。

スマートフォンの専用アプリと連携し、アプリでテキストを確認することもできますし、事前に登録したDropbox、Google Drive、OneDriveといったクラウドストレージにデータを保存したり、メールアドレスに送信することも可能。さらに日本語以外の文字起こしにも対応するなど、インタビューや会議、セミナーなど、いろんなシーンで活用できそうです。

会議の議事録を作成し、クラウドストレージに保存&共有するといった使い方ができそう。
画面下のセンサーに触れると録音開始。再び触れると録音を停止できます。
USB-Cポートでスマホのように充電できます。マイク、ヘッドフォンの2つの端子も備えています。

価格は2万4800円で、発売は2022年1月21日の予定。サービスの利用はサブスクリプションとなっていて、1か月1時間分の文字起こしが無料で利用できるほか、月額980円で30時間分を利用できます。

PCにインストールするだけ!ビデオ会議を瞬時に翻訳

一方の『ポケトーク字幕』は、人気の翻訳機「ポケトーク」の機能を、ビデオ会議でより簡単に、より高速に使えるようにするPC向けのソフトウェアです。

現在利用できるバージョンは「ポケトーク」に話しかけて、それをパソコンに表示する仕様になっていますが、2022年1月に提供開始される新しいバージョンは、パソコンだけで動作するとのこと。ZoomやMicrosoft Teamsのようなビデオ会議システムの画面に、それぞれが設定した言語の字幕が表示されます。発表会で行われたデモンストレーションでは、日本語と英語でビデオ会議を行い、それぞれが話した言葉が瞬時に翻訳され、字幕として表示されていました。ソースネクストの松田憲幸代表取締役会長兼CEOによれば、そのスピードは「他社製品より3.2倍以上速い」ということで、実際にタイムラグはほとんど感じられませんでした。

『ポケトーク字幕』のイメージ。キーを押しながら話すだけで字幕が表示されます。
同時に2つの言語で字幕を表示できるので、3か国語でのトークも可能。

以前紹介したスマートフォン『Google Pixel 6』もそうですが、AIによる音声認識とそれを活用した自動文字起こし、さらには自動翻訳技術はここ数年で劇的に進化しています。松田会長も話していましたが、本当に技術の力で言葉の壁が越えられる時代がやってきたのかもしれません。

なお『ポケトーク字幕』は82言語に対応。月額使用料は1100円で、年額の場合は1万3200円。Windows版は2022年1月、Mac版は2月に提供開始予定です。

文/太田百合子