Microsoft Azure语音识别与Rev Ai语音到文本API

>博客>资源>其他资源>语音到文本API>Microsoft Azure语音识别与Rev Ai语音到文本API

你是否对下一个有一个好主意物联网(IOT)设备,您希望将实时标题添加到媒体流服务,或者您正在为移动应用程序创建免提语音用户界面,您将需要一个自动语音识别(asr)解决方案,即工作。无论他们尝试多么努力,都没有什么可以让用户关闭用户的挫败感。

如果您正在挑选Azure认知服务和rev.ai.对于您的项目,您希望沿着几个指标进行比较这些解决方案。根据您的独特需求和用途,有些人比其他需求更重要。无论如何,您希望获得每种技术的整体画面以及它们如何互相叠加。

准确性

赢家:rev ai

到目前为止,最重要的比较点是准确性。毕竟,如果ASR发动机汇总了太多的单词,使用它将在最佳状态下难以困难。准确性基准测试的金标准是单词错误率(WER),测量ASR技术删除,将插入或替换为整体百分比的单词。例如,20%的WER意味着它有20%的单词错误。因此,较低的WER更好。

在我们的播客转录基准,我们将Rev Ai与微软的ASR进行比较为30播客,发现Rev的WER,14.22%,比微软的2%左右,达到16.51%。Rev的Ai优于其他人的原因是我们超过60,000人的人类转录员的网络贡献了我们用来不断改进模型的数据。

Rev Beats Google Microsoft Amazon

扬声器ID和日益增估

赢家:rev ai

识别谁正在谈话,何时是高性能ASR系统的关键功能。微软声称他们的技术支持日益增长,但他们没有说它可以处理多少个扬声器。另一方面,Rev Ai承诺支持8名英语人员或6名非英语扬声器。

两个解决方案都可以识别扬声器同样良好。

语言支持

赢家:微软天蓝调

如果您想为国际客户群提供服务,或者如果您正在构建任何涉及翻译的东西,则支持多种语言至关重要。REV工作31种不同的语言,包括德国,法语,西班牙语,俄语,日语,中文,韩语,阿拉伯语和土耳其语等不同选项。

Azure与...类似地执行支持44种总语言对于语音到文本用例,虽然该数字下降到30种语言,用于实时翻译语音。但请注意,它们对其翻译服务的平均转录相当更多的费用,超过两倍多。

周转速度

赢家:未知

ASR有多快地将文字变成文本?我们可以将这个问题分为两个一般类别:同步和异步用途。前者包括用于文本应用程序的实时语音,例如为流媒体提供实时标题。Rev看到1到3毫秒的平均延迟,而Azure未指定。

另一方面,异步ASR处理不实时发生的任务,例如从录制生成成绩单。rev ai使用批量转录要将录制分解为多个块,以便我们可以并行处理它们以实现更快的结果。实际上,我们达到以下基准标记度量:

5分钟文件=〜154秒

30分钟文件=〜9.5分钟

300分钟/ 5小时文件=〜7分钟

不幸的是,Azure认知服务没有公开列出周转时间。

便于使用

赢家:这取决于你的技术堆栈

我们如何快速登记服务,以便在生产中进行第一个API呼叫?Rev一直来自我们的客户,他们能够在几小时内获得概念和运行的证明,与蔚蓝的认知服务等服务的日子甚至几周有很大的不同。

您需要考虑的一件事是软件开发套件(SDK)支持的编程语言。Rev有Python,Java和Node JS的SDK,而Microsoft则为C#,C ++,Go,Java,JavaScript,Objective-C / Swift和Python。但是,Azure只能处理通过Azure服务器的音频,并存储在其云平台上,而Rev采用任何URL。

一般来说,Azure的产品将更努力地用于那些已经在Azure基础设施的人以及已经利用Azure生态系统的人使用。如果您已经存在,那么这是注册Azure认知服务ASR的最佳原因。否则,使用更好的平台 - 无话样的产品通常更好,如Rev Ai。

价格对比

赢家:rev ai

当然,价格将永远是挑选正确选择的最重要的考虑之一。Azure和Rev都使用每次使用付费定价模型,您只需支付您使用的费用。Rev Enterprise AI以每小时1.20美元的音频(或每分钟0.20美元),用于语音到文本服务,包括完全灵活性选项,如能够添加多达6000个自定义词汇单词。随着您添加更多卷的价格,Rev Ai的价格从0.20美元下降。

从Azure进行类似的报价,他们的自定义文本为语音,每小时花费1.40美元,这可以显着加起来。但是,它们的标准,不可定制的选项有点便宜,每小时为1.25美元。他们也收取各种其他费用(例如每次调查他们识别不同的扬声器,每小时为翻译为2.50美元收费。

结论

总体而言,Azure和Rev提供了伟大的ASR解决方案,每个解决方案都有他们的优势和劣势。特别是在Azure的演讲中,他们的演讲到文本提供与其他蔚蓝的产品有很大的整合,因此如果您已经在Azure生态系统中,它绝对值得考虑。

但是,REV演示了更高的准确率,平衡更便宜,提供了其他巨大功能。虽然Microsoft客户必须注册Azure帐户,但是免费试用其认知服务,Rev提供免费试用,没有任何条纹。我们邀请您尝试为自己申请,并经历今天的差异。