■ChatGPTと文字起こし
(リンク »)
ChatGPTは幅広いあらゆる分野の質問に対して、不自然さが感じられない詳細な回答をすぐに生成するため注目を集めています。
※内容については事実とは異なることもあり、その点は指摘されています。
ChatGPTはあくまでもテキストが主体のため、単独で文字起こし作業を代行することはできません。Whisperのような別の音声認識システムを利用する必要があります。
ChatGPTと同じくOpenAIが開発したWhisperは、音声データを入力データとして受け取り、解析し、その結果をテキストデータに変換する音声認識モデルです。
ほかのAI音声認識でも同様ですが、自動音声認識での文字起こしは、句読点が入らない、複数人の対話だと発言者の区別がつけられないなど、非常に不自然なまるでお経のような文章が生成されることがよくあります。
【AIによる文字起こしについて】
(リンク »)
【トランスクリプトで文字起こし】
(リンク »)
【音声認識と文字起こし】
(リンク »)
【方言と文字起こし】
(リンク »)
そこで自然な言語生成に長けたChatGPTの出番となります。
Whisperによって文字起こしされた分かりにくい文章を丸ごと渡して、誤記の訂正や句読点の適切な挿入などを依頼すると、可読性のあがった文章に生成しなおしてもらえます。
Whisperを使用した文字起こしでは、Webから収集されたデータでトレーニングされているため、一般的な会話や話題に対して高い正答率を示します。
しかし、医療用語や大学の講義などの特定の専門用語やテクニカルな話題に対しては正答率が低下する傾向があるようです。
※専門用語に関しては、AIに特定の学習データを追加することで改善することはできるそうです。
<比較テスト>
非常に音質が良い場合は、Whisperを含め、他のAI音声認識でも文字起こしの正答率は悪くないため、自動文字起こしが難しい「音質が悪いデ ータ」「環境音などのノイズが大きい音声データ」を使って文字起こしをした結果を比較してみます。
●文字起こし比較テスト その1(ノイズが多く音質が悪いデータ)
[Whisperによる文字起こし結果]
おはようございます。
以前コマックを破ってから、調子があまり良くない。
[データグリーンによる文字起こし結果]
ご無沙汰しております。
以前鼓膜を破ってから、調子があまり良くないので。
音質が悪いためはっきりと聞き取りできませんが、「ご無沙汰しております」と聞きとることができました。
「コマック」に関しては、「ま」と「く」の間にノイズが入っていたため、Whisperは誤った認識をしているようです。
●文字起こし比較テスト その2(周囲の環境音が大きい音声データ)
[Whisperによる文字起こし結果]
誰も一人で来てねえだろうみたいなのリーダーも
[データグリーンによる文字起こし結果]
誰もほめてくれないだろみたいなノリになって
周囲の声が大きく「ほめてくれない」「ノリになって」が聞き取りにくい状態で、Whisperでは誤認識しています。
このように音質の良くないデータ、ノイズ・環境音が混じってるデータをAI音声認識を利用して自動文字起こしをしても、不十分な品質になります。
やはり経験をつんだ人間の確認、修正作業が必須となります。
また ChatGPTによる補正を行うにしても、例えば一般化されていない専門用語や最新のニュース用語などになると対応できません。
文字起こしの精度を向上させるためには、専門知識やコンテキストを適切に扱うことも重要です。特に専門的な話題においては人間の知識との組み合わせが必要となります。
■データグリーンについて
データグリーンでは、音声データの解析技術と熟練ライターの豊富な経験・ノウハウを組み合わせた「精度の高い文字起こし」を提供しております。
AI音声認識では対応できない音質の悪いデータ、専門性の高い音声等、長時間の文字起こしにも低価格、年中無休で対応可能です。
プライバシーマークおよび情報セキュリティマネジメントシステムの国際規格「ISO27001(ISMS)」の認証も取得しておりますので、秘匿性、機密性の高い 音声データの文字起こし、テープ起こしもおまかせください。
【文字起こし、テープ起こしのデータグリーン】
(リンク »)
【データグリーンの特徴】
(リンク »)
【文字起こしの種類(ケバ取り、素起こし、整文)】
(リンク »)
【文字起こしの用途(インタビュー、講演、会議、面談、裁判訴訟等)】
(リンク »)
【文字起こし・テープ起こしの料金、費用】
(リンク »)
【文字起こしデータ校正サービス】
(リンク »)
【文字起こし 納品実績一例】
(リンク »)
【データグリーンをご利用いただいているお客様の声】
(リンク »)
【文字起こし、テープ起こしの特集一覧】
(リンク »)
【文字起こしとは(文字起こしの歴史)】
(リンク »)
【音声データの品質と文字起こしの精度|文字起こし、テープ起こしの料金を抑える方法】
(リンク »)
【音声データの品質を上げるためのチェックリスト】
(リンク »)
【特殊フォーマットへの対応】
(リンク »)
【おすすめのボイスレコーダー、スマホ用マイク】
(リンク »)
【文字起こし、テープ起こしに役立つアプリ】
(リンク »)
【Web会議・オンライン会議の録音・録画】
(リンク »)
【メディアの種類からみる文字の特性】
(リンク »)
【文末表現(敬体と常体)について】
(リンク »)
【表記ゆれについて】
(リンク »)
【言い淀み(フィラーワード)について】
(リンク »)
【OCR、Googleドライブを使った文字起こし】
(リンク »)
【YouTube字幕と文字起こし】
(リンク »)
【文字起こし、テープ起こし用語集】
(リンク »)
■会社概要
会社名:株式会社アラジン
文字起こし事業:データグリーン/DATA GREEN
データ復旧事業:データレスキューセンター/DataRescueCenter (※)
登録商標:データグリーン、データレスキューセンター、データレスキュー等
保有特許:特許第4090494号、特許第4236689号、特許第5512470号
電話:092-720-6633(代表)
本社:福岡県福岡市中央区薬院1-5-6 ハイヒルズビル3階
資本金:9,000万円
設立:2002年5月31日
代表者:代表取締役 長濱慶直
認定:プライバシーマーク、ISO27001(ISMS)
加盟団体:
一般社団法人日本データ復旧協会(常任理事)
(リンク »)
一般社団法人文字起こし活用推進協議会(正会員)
(リンク »)
福岡県弁護士協同組合(特約店)
(リンク »)
(※)データ復旧事業
・データレスキューセンター【公式】データ復旧
(リンク »)
・データレスキューセンター【公式】Twitter
(リンク »)
・データレスキューセンター【公式】コラム
(リンク »)
《本リリースに関するお問い合わせ先》
課長代理 平川 竜士
TEL:092-235-5024、0570-550-729
このプレスリリースの付帯情報
お問い合わせにつきましては発表元企業までお願いいたします。
ChatGPTと文字起こし 
