Follow

英伟达开源了一个超强的语音识别模型:Parakeet TDT 0.6B V2,登顶 OpenASR 榜单。

它能够在 1 秒内实现高质量转录 60 分钟的音频,而且参数仅仅 0.6B,轻松击败了所有主流闭源模型。

模型下载:huggingface.co/nvidia/parakeet-tdt-0.6b-v2

排行榜单:huggingface.co/spaces/hf-audio/open_asr_leaderboard

不过目前仅支持识别英文,采用的是 CC-BY-4.0 开源许可,允许商业使用。

:icon_weibo: weibo.com/5722964389/Pqy3qgLRM

Sign in to participate in the conversation
小森林

每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。