ipemoの日記

読んだ本や買ったもの等

Pixel 6の文字起こし(レコーダーアプリ)と音声入力

Pixel 6の文字起こし(レコーダーアプリ)と音声入力

12月に文字起こし目的のためにiPhoneからPixel 6(無印)に移行していました。 目的は、12月頃から担当事案の重要性・緊急性が上がったため、正確な議事録作成が必要になったこと*1により、自動での議事録作成がしたいと思ってのことです。

Pixel 6aが出てきましたし、そのうちPixel 7が出てくるでしょうので半年以上使用した使用感を書いておきます。 以下、「Pixel 6」と書きますが、使用しているのは無印です*2

文字起こしの性能と効果(レコーダー)

色々と工夫をしてみているのですが、「そのままで議事録になるか」といえばならないです*3。誤変換がかなり多いためです。ただ、誤変換はあるものの、会話の起こし漏らしは多くはないかなと考えています。

そのまま議事録を作成したい場合には、そのようなものがあればですが、他のツールやサービスを使用しましょう。

レコーダーアプリでの文字起こしの効果

誤変換があろうと、会議の内容がそのまま記録されるのは非常に有用であり、テキストになっていると振り返るのが早いんですよね。

Teamsその他で録画ができるようになっていますし、その他の一般的なボイスレコーダという方法もないわけではありません。ただ、動画と音声で振り返るのは、(シークバーでスキップ等ができるとしても)常に順方向に再生する必要があり、また、再生時間に応じた時間(できても3倍速)を使用することとなります。一方で、テキストの場合は、より速いスピードで振り返ることができます*4

また、半年以上使用していますが、音声は聞き直したことが一度もありません。また、内容も業務上のものなので、私用アカウントに紐付いたクラウド上にはアップロードせず、Pixel 6内で消去しています。

たまに失敗すること

なぜなのか今ひとつわからないのですが、文字起こしは、音声を入力しながらでないと行われません。内部に記録した音声の再生させて、それをテキストファイルやWordファイルに起こすことができません。

また、レコーダーアプリは、設定した言語文字起こしを行います。これ自体は現在の技術からは不思議ではありませんが、英語の会議と日本語の会議がある場合、言語設定忘れで、レコーダー使用したが、全く有用な文字起こしができなかったということはたまにあります。注意しましょう。リカバリは、再度外部からPixel 6に、録音した音声を流し込むしかありません。

代替手段:マイクロソフトOnenote Web)

なお、文字起こし自体は、例えばMSのOnenote (現状Web版)あたりでも可能です*5。PC備え付けのマイクで文字起こしさせても意外と高めの精度で文字に起こしてくれますよ。ただ、Onenote(現状Web版)の場合は、文字起こしだけであり、音声は保存されませんので、何かしらのエラーがあればそのまま失われます。また、Onenote(現状Web版)で文字起こしする場合、作業しようとするとすると文字起こしが止まることとなり、そのPCは基本的に作業ができません。

アクセサリ

Pixel 6は、当然ながら充電用のUSB-C経由でオーディオ系のデバイスを使用することができます。

USBインターフェース機能付きポータブルレコーダー

これをポチ、レコーダーでの文字起こしをしてみましたが、あまり性能は良くなかったですね。

USBインターフェース機能付きポータブルレコーダー

外部記事

news.mynavi.jp

Pixel 6 音声入力は、スマートフォンのマイクのみ?

Pixel 6の文字起こしの活用シーンは、以下に分類されます。

  1. レコーダーアプリ(音声保存+文字起こし)
  2. 音声入力(文字入力(フリック入力)を音声で行う)

ここまでは、レコーダーアプリについ書いてきました。レコーダーアプリについては、USBでマイクや場合によっては、オーディオインターフェースを接続*6して、

検索してもPixel 6の音声入力に関する記事はほとんどなく、完全には確認はできていないのですが、音声入力の方については、スマートフォンの音声取り込み口からしか、音声入力ができないようです。わかりやすく「具体的にはBluetoothイヤホン等にマイク機能があっても、そのマイクは使用されない」ようであるということです。

特に最近のBluetoothイヤホンは、ノイズキャンセリングのために、マイクが複数搭載されており性能が良いはずなのでこれについては改善してほしいのですね。

まとめ

まとめるとPixel 6の文字起こし・音声入力については下記のとおりです。

  1. レコーダーアプリでの文字起こしと音声入力は異なる。
  2. 文字起こしは、仕事の効率化にはなるが、議事録ができるというレベルではない。また、言語設定を間違えると、単なる録音になる。
  3. 音声は、Pixel 6のマイクに最適化されている可能性があり、高音質の外部機器を買ったら性能が良くなるとは限らない。

*1:上位者の指摘を正確に実行する必要がある。また、あるあるですが、理解もせず言うことがコロコロ変わる人もいるので・・・

*2:Proも同性能との理解です

*3:記録レベルでテキストを保存していることはあります。

*4:文字起こししてみるとわかりますが、意外と会議での文字数は多くなりません。基本的に1名しか話さないからです。

*5:機能の名称はディクテーション

*6:電池の減りが早いですが