Whisper

Open-source speech recognition model for transcription, subtitles, and audio processing workflows.

Speech to text Subtitle Transcription Open source

Overview

Whisper 常用于语音转写、字幕生成、长音频初稿和多语言音频处理。它适合给视频剪辑、会议纪要和播客工作流提供第一版文本。

转写结果需要人工校对,尤其是专有名词、数字、口音、背景噪音和多人对话。

在目录中,Whisper 归入 AI Voice、AI Subtitle 和 Open Source AI,常与剪辑工具、文档工具和 LLM 润色流程配合。

Key Metadata

  • Pricing: open source
  • Platforms: python, cli, local
  • API support: no
  • Chinese support: yes
  • Open source: yes
  • Source confidence: 0.8
  • Last checked: 2026-05-13