W
WhisperWhisper
OpenAI🇺🇸
OpenAIが開発した高精度音声認識(文字起こし)モデル。98言語に対応し、APIで利用できるオープンソースの音声認識技術。
WhisperはOpenAIが開発した音声認識AIモデルです。98言語に対応し、音声・動画ファイルから高精度なテキスト変換を行います。OpenAIがオープンソースとして公開しており、ローカルで無料実行することも、OpenAI APIを通じて使うことも可能です。多言語音声認識・自動翻訳機能も持ち、字幕生成・議事録作成ツールのバックエンドとして広く使われています。
料金プラン
| プラン名 | 月額 (USD) | 月額 (JPY) | 課金サイクル | 無料 |
|---|---|---|---|---|
| OpenAI API(従量課金) | $0.00 | 0円 | monthly | - |
| 無料(オープンソース) | $0.00 | 0円 | monthly | 無料 |
ツール属性
日本語品質
★★★★★初心者向け
★★★★★商用利用
✓API提供
✓モバイルアプリ
✗デスクトップアプリ
✗強み
- 98言語の高精度音声認識
- オープンソースで無料ローカル実行も可能
- OpenAI APIで簡単統合
- 日本語認識の精度が高い
弱み
- リアルタイム文字起こしは別途実装が必要
- ローカル実行はGPUがないと低速
- 話者識別(ダイアライゼーション)は別ライブラリが必要