ソースネクストから機材を借用またはライセンスを供与していただき、試用しました。
ソースネクストのAutoMemoとは
以前、ソースネクストの“翻訳機”ポケトークの紹介をしました。色々な言語でこのデバイスに話しかけると、すぐに他の言語に翻訳してくれると言うもの。
ポケトークはその翻訳機能も凄い訳ですが、そのベースとして「喋った言葉をすぐに文字データに変換してくれる」という機能が備わっています。「今日はいい天気ですね」と喋れば、このように“解釈”してくれる訳です。で、その後にそのデータを元に翻訳をする。
AutoMemoの特徴
さて、その基本部分の「話された言葉を文字データにする」という機能をまた別の形にしたのがこのAutoMemoのようです。「AIボイスレコーダー」と銘打っていますが、単にボイスを録音するだけではなく、その音声を文字データに変換してくれるのです。
会議の議事録作成や、インタビューの文字起こしなどなど、話された言葉を文字(データ)にしなければいけないシーンってよくある話。長時間にわたる会話を文字にするって、かなりの重労働ですよね。それが、自動的に文字データになっちゃう訳ですから、これは便利。
しかも、複数人で喋り合っていても、“ある程度”解析してくれるようです。もちろん、喧嘩のように同時に言い合っていたら厳しそうですが。
ただし、デジタル音声(Web会議での、スピーカーから流れる相手の声など)は認識率が下がるそうです。高音・低音がカットされるからですかね。
例えばZoomでの会話の場合、抵抗入り3極ケーブルで繋げると認識率が上がるようです。
連続録音できる時間は約5.5時間で、待機時間は電源が入った状態で約6.5時間とのこと。
日本語、英語、中国語はもちろん、全部で72言語をテキスト化できます。録音を始める前に、テキスト化したい言語をアプリから設定できます。翻訳機能はありません。一度の録音では1言語のテキスト化となります。
文字データ化にはサブスクリプション契約が必要
本体価格は19,800円(税込)。
ただ、AutoMemo本体には音声の録音機能しかなく、音声データをサーバー側に送って文字データ化をする仕組み。このサービスを利用するには、というか利用するしかないのですが、サブスクリプション契約が必要になります。
ベーシックプラン | プレミアムプラン | 10時間チャージ |
無料 | 月額980円(税込) キャンペーン中、最初の六ヶ月は無料 | 一回980円(税込) |
毎月1時間までの録音データをテキスト化 繰り越しなし | 毎月30時間までの録音データをテキスト化 繰り越しなし | 一回のチャージで10時間分の録音データをテキスト化 余った分は翌月繰り越し可 |
お試しとしては無料の「ベーシックプラン」でしょうけど、月に一時間分しかないので、本当に使うとなったら「プレミアムプラン」にすることになるでしょう。
初期設定でまずはこのサービスの「ベーシックプラン」に加入する形でサーバーとの接続がされます。
そのサーバー側では
- 録音データは自動保存:本体がWi-Fi接続でサーバー側にデータを自動的に転送。
- 保存件数・期間は無制限。専用アプリ(スマートフォンにインストール)で利用。
- 文字データ化されたデータはアプリ上でキーワード検索可能。
- 文字データ化されたデータは、自動でメール転送も可能。
となっています。
外観チェック
まずは見た目のチェックです。
同梱品としては、初期設定の仕方などを記したスタートガイドなどのドキュメント類。
充電用ケーブル。本体側端子はUSB Type-Cです。最近のスマートフォンやノートパソコンもUSB Type-Cになってきているので、使い回しができてグッド。AC電源アダプター自体は付いていないので、スマートフォン用などをそのまま使えば大丈夫でしょう。
見た目。青面にあるのは大きな二つの丸いボタン。大きい方が録音開始・停止ボタン。小さいのは録音中にマーキング(ブックマーク)をデータに挿入するためのものです。
側面には電源ボタン。長押しでオン・オフできます。録音ボタンが光って(光がクルクル廻る感じ)オン・オフの指示を受け付けたことを教えてくれます。
電源ボタンの下にあるのはWi-Fi接続状態を示すLEDランプ。そう、入力された音声をサーバーにWi-Fi経由で送ってデータ変換をする仕組みなので、Wi-Fi接続が必要になります。
底面には左からマイクロホン用ジャック端子、充電用のUSB Type-C端子があります。あと、右側の小さな孔はリセットボタンかな?(追記:と思ったら、充電時に光って教えるLEDランプでした。)
天面にはマイク用の穴が開いています。
スマートフォンと並べるとこんな感じ。写真じゃ分からないけど、AutoMemoの方が厚みはあります。約130×41×12 mmで、重さは約86 gとのこと。
いざ、セットアップ
初期設定ですが、まずはスマートフォンに専用アプリをダウンロード&インストールします。そのアプリを起動すると初期設定のガイドが出てきますので、それに沿って行えばOK。
本体電源を入れると、BluetoothでAutoMemoとスマートフォンが接続され、本体側の設定が始まります。
上記の通り、AutoMemoは単体でWi-Fi接続してサーバーとやり取りする仕組み。そのWi-Fi接続の設定がスマートフォン側のアプリでする形になります。接続するWi-Fiの名前を選んでパスワードを入力すればOK。プロキシ設定などの項目もありますが、基本的にはいじらずにそのままで大丈夫なはず。
その他設定項目はこちら。対応言語(文字データ化対象言語)は日本語に設定されているので、他の言語で使いたい場合はここで変更しましょう。
あと、AutoMemo本体側の「ソフトウェアの更新」の指示がある場合はアップデートしましょう。これもアプリ経由で指示すれば、あとは自動的にアップデートされます。
文字データ化されたデータをメール転送したい場合は、転送先のメールアドレスを設定します。複数設定できます。
これで終了。10分くらいで済みましたかね。
録音・文字データ化を試してみた
実際に会議でも使ってみたのですが、さすがにそのデータを公開する訳にはいかないので、サンプルとして朗読してみました。選んだ作品は青空文庫に掲載されている「魯迅 井上紅梅訳 孔乙己」です。
大昔、魯迅の作品にはまっていた頃に上海旅行をして、この作品に出てくる「咸享酒店(かんこうしゅてん)」をリスペクトした(?)店にも行ったことがあったのでした。残念ながら名物の「茴香豆(ういきょうまめ)」は食べなかったのですが。
さて、冒頭はこんな感じ。朗読自体が慣れている訳ではないので、何度もつっかえてしまっているんですが、まあ、ご愛敬と言うことで。
変換されたデータをアプリで表示させるとこんな感じ。固有名詞は厳しいものがありますが、まあ、それなりに変換されているのではないでしょうか。
便利なのが音声データに同期されているので、音声データを再生すると、該当箇所の文字の背景色が変わります(薄い色なので、ちょっと分かりにくい。もう少し濃くてもいいかも)。変換がおかしいなと思った点はこれで修正していけるでしょう。
メールにも転送してみました。文字データがそのままメール本文になっていて、音声はMP3形式でダウンロードできるようにリンクが張られています。
その音声データがこちら。こんな風にぼそぼそ喋ってもちゃんと解釈してくれるのがありがたい。
ちょこっと考察
実は、マイクロソフト社のWordでも、そしてGoogleからも音声入力アプリが提供されていて、「喋った言葉を文字データ化する」こと自体はこれまでもできていました。キーボードを使わずにデータ入力を音声でするだけならばこれらのツールでも充分でしょう。
AutoMemoは、基本機能はこれらと同じなのですが、そこは「AIボイスレコーダー」と謳っているだけあって、文字データ化されたデータとも連携されて音声データの管理をしてくれるのが大きな違い。
また、専用機だけあって本体の操作はとてもシンプル。ボタンを押せばすぐに録音できるのは“現場”で強い味方となるでしょう。
会社で議事録を作る機会が多い人、インタビューをよくする人(どんな人?)、そして音声でメモをするのが好きな人におすすめです。作家・詩人の人も、思いついたときにAutoMemoで録音しておいて、あとで文字データとして作品に組み込むなんて使い方もあるのかな。
実際に私も会議で使ってみましたが、固有名詞を除いて変換はいい感じでした。議事録作成もかなり楽にできましたよ。思ったよりも使えそうです。
ここで買えます
ソースネクストのオンラインストアで販売中。下記バナーをクリックしてください。
もうしばらく試用期間があるので、また使ってみてレポートします。
コメント