AI 情报 · 每日更新
任务类型 ·
automatic-speech-recognition
共 5 个 (跨 3 天)
2026-05-26
Mega-ASR (THU)
面向远场、混响、重叠语音等严重声学退化的鲁棒语音识别
2026-05-25
speaker-diarization-3.1 (pyannote)
多说话人分割模型,从音频中区分谁在何时说话
2026-05-20
XEUS (CMU WAVLab)
覆盖4000+语言的语音基础模型,供ASR/翻译微调
Whisper Large v3 MLX (mlx-community)
Apple Silicon 上运行的 Whisper 语音识别模型
Whisper-large-v3-turbo (mlx-community)
Mac端Whisper large-v3-turbo,MLX低延迟转写
Esc
输入关键词,跨模型 / 数据集 / 空间 检索