任务类型 · automatic-speech-recognition

共 5 个 (跨 3 天)

2026-05-26

Mega-ASR (THU) 面向远场、混响、重叠语音等严重声学退化的鲁棒语音识别

2026-05-25

speaker-diarization-3.1 (pyannote) 多说话人分割模型,从音频中区分谁在何时说话

2026-05-20

XEUS (CMU WAVLab) 覆盖4000+语言的语音基础模型,供ASR/翻译微调 Whisper Large v3 MLX (mlx-community) Apple Silicon 上运行的 Whisper 语音识别模型 Whisper-large-v3-turbo (mlx-community) Mac端Whisper large-v3-turbo,MLX低延迟转写