跳到内容

谷歌语音识别API vs. Rev AI API

2021年5月21日

谷歌语音识别API VS Rev AI

>博客>人工智能>谷歌语音识别API vs. Rev AI API

Rev的50,000人网络网络每天完成数千个项目。这为Rev AI转录API提供了一个广泛的培训。

但是,足以叠加像谷歌这样的科技巨头的自动语音识别(ASR)?让我们比较两个流行的ASR解决方案的准确性,速度,功能和成本:谷歌语音识别API与Rev Ai API。

哪个更准确:谷歌语音识别API或Rev AI API?

在我们的播客转录基准,我们将Rev AI和Google视频型号的单词误差率(WER)与30播客进行了比较。对于30个媒体文件中的24个,Rev Ai比Google更准确。Rev AI的平均水平为14.22%,而谷歌演讲识别为15.82%。

Rev Beats Google Microsoft Amazon

功能比较:谷歌语音识别API与Rev Ai API

说话人识别和日记

扬声器识别和日期对于具有多个扬声器的音频文件至关重要。这些功能将音频文件打破到每个扬声器的单独流中。

这样,成绩单可以表明谁说谁说哪个词。Rev Ai包括我们服务中的全额扬声器鉴定和日益增估。谷歌演讲识别也有这些服务,但它们仍然在Beta。

语言支持

谷歌包括对总共125种语言和变体的支持。他们目前有对各个语言的自动检测的beta支持。这个特性可以在多达四种预先指定的语言的情况下工作。

Rev Ai支持全球英语模型以及其他30个其他世界语言。这包括:

阿拉伯语 芬兰 韩国人 罗马尼亚语
保加利亚 法语 拉脱维亚 俄语
加泰罗尼亚州 德语 立陶宛语 斯洛伐克
克罗地亚 希腊 马来语 斯洛维尼亚语
捷克语 北印度语 普通话 西班牙语
丹麦 匈牙利 挪威 瑞典
荷兰人 意大利 波兰的 土耳其
英语 日本人 葡萄牙语

全球英语模型识别和透转来自几种英语变体的演讲。它甚至包括德国或法语扬声器所说的英语。

Google语音识别API的周转速度和Rev AI API

对于短文件(10秒),Google提供了令人印象深刻的转录周转时间。对于更长的文件,Google的转录大约需要媒体文件的运行时间大约一半。Rev AI的转录对于短文件有点慢。但是,Rev AI能够以显着的速率转录长文件 - 它甚至可以在5-10分钟内录制1-2小时媒体文件。

易用性:谷歌语音识别API vs. Rev AI API

谷歌与其他Google服务具有广泛的集成,对于复杂的应用,它非常棒。可识别的用户界面是其ASR的大优势。如果您已经使用了Gmail或其他Google产品,您将在演讲API中感受到家中。在Google Ecosystem中也是一个决定的优势,如果您计划将您的应用程序与其他Google服务集成。

Rev AI是为了易于使用而构建的作为独立服务。您的应用程序更简单或依赖于Google Integation的较少,更有利的Rev Ai成为。Rev AI的输出文件易于阅读和使用,因为它们可用作.txt或.json成绩单。.json文件包含每个单词的文本,扬声器ID,时间戳和置信分数。

价格比较:谷歌语音识别API与Rev Ai API

对于我们的ASR服务基础计划,Rev AI收费为每分钟0.035美元(四舍五入至最近的15秒增量)。对于大量用户,Rev AI还提供了一个企业计划,起始价格为每小时1.2美元(0.02美元/分钟),随着用户数量的增加,价格也会降低。

谷歌有两层ASR服务:一层是标准模式,另一层是更精确的增强视频模式。谷歌视频模型,用于上述精度比较,是$0.036每分钟(四舍五入到最近的15秒增量)。标准款每分钟0.024美元,也以15秒的增量收费。如果你选择加入数据记录,他们会提供折扣。

注:这些服务的价格是不断变化的,这些价格在撰写本文时是准确的。为最新的价格检查rev ai定价页这里和谷歌演讲识别这里的价格。

如何选择转录API?

Google语音识别API和Rev AI API都提供了优秀的ASR解决方案。谷歌的API提供了令人印象深刻的强大的语言覆盖范围。此外,它还与其他Google产品集成了很好。这对于已沉浸在谷歌生态系统中的应用程序很棒。

Rev AI的解决方案提供更好的准确性。

对于需要扬声器识别和日记的媒体文件尤其如此。Rev AI也更容易为独立应用程序设置和使用,并且对于长媒体文件具有更快的周转速度。但是不要拿我们的话,试试rev ai api.今天免费,尝试Rev的免费的单词错误率计算器和语音识别基准测试工具自己运行这些测试