跳到内容

标点符号在语音识别技术中的重要性

2021年6月22日

自动语音识别 - 技术 -  Rev的重要性

>博客>人工智能>标点符号在语音识别技术中的重要性

在阅读任何进一步之前,请看看最后一章尤利西斯由詹姆斯乔斯。如果你不知道,现在你真的看到标点符号或完全缺乏它的差异。

没有标点符号的转录物或标题对它们具有更糟糕的案例。远远不受乔伊斯的意识溪流的文学赞同,这些文件只是普遍的不可读。这主要是由于我们的大脑处理书面字样;而不是逐字,我们读了块。我们预计在我们到达之前,我们会在达到句子之前结束,因为我们提前注意到这一时期。当我们阅读时,试图“想象”标点符号严重迷失方向。

在给我们的节奏之上,标点符号提供清晰度。它解决了歧义。一个常见的例子是这些两个短语之间的区别:“让我们吃,奶奶!”和“让我们吃奶奶!”另一个伟大的例子是亲爱的约翰信,它给出了不同的标点符号,以创建两个非常不同的字母。

问题为自动语音识别然而,(ASR)是,在以与写作时这样的方式说话时,我们不会明确地包括标点符号。早期的ASR发动机(市场上的许多较低质量产品)完全忽略了标点符号,让我们以后或通过混乱语法的沼泽手动插入它们。

事实上,研究已经找到了研究没有标点符号的成绩单甚至更有害理解而不是a单词错误率(WER)为15或20%。它不仅仅是我们没有标点符号的斗争。表演的人工智能系统自然语言处理(NLP)在面对缺乏人的界限时,也会降低准确性。

有些东西必须改变。

Rev的讲话工程师永远不会退出挑战。在本文中,您将看到我们所面临的障碍以及我们如何克服它们,为您带来一种自动包括标点符号的最先进的语音识别解决方案。

挑战

没有标点符号的ASR可能很糟糕,但是自动标点差更糟糕的是。如果你试过了。阅读文章。写作。这可能不会让它太远。

很多这个问题来自试图根据语言学家呼叫的划分标点韵律,基本上是伴随着我们演讲的词语(语调,拐点等)之外的所有填充物。逻辑是这样的:如果有人停止稍后一段时间,请插入一段时间并开始新句子。

这个问题很明显。人们经常在没有暂停的情况下一起运行多个句子,就像他们经常停止思想或犹豫的中间句子。虽然这些信号确实在ASR标点符号中发挥作用,但它们远非傻瓜。一个上升的拐点可以表明问号,但它可以轻松地划分演讲者的主题真的,真的关心。

应用程序喜欢流媒体ASR.(如标题直播电视),更加复杂,因为我们无法在弄清楚我们所需要的标点符号时出现“未来”。请记住,标点符号是通过将其互相相关的构建思想来实现。这是针对成对的标点符号的特别粘性问题,例如引号和括号,因为ASR必须在我们甚至意识到我们处于报价或括号之前插入第一个标记。

一些ASR系统完全放弃,而是依靠用户手动地说“逗号”或“逗号”如果他们想要点缀他们的句子。这可以用作决定短信或电子邮件的停止差距措施,但它永远不会用于使用案例生成播客转录物或者智能家居助理

解决方案

我们的努力得到了回报,我们很自豪地说,我们的ASR服务提供准确的自动标点,尤其是像逗号,句号和问号常见的标记。我们是如何做到的?

启用ASR标点符号的主要技术突破是一种类型深度学习叫A.变压器神经网络。没有进入太多的小熊牢金,这是一个主要的吸引力机器学习(ml)技术是其能够随着训练数据集的大小变大而变得更加准确。简单地放置,当我们更好的音频和相应的时,它变得越来越好地面真理转录物。大量的高质量数据产生了所有的差异。

幸运的是,这是我们在Rev的锹中的一些东西。我们的军队超过60,000岁的转录员为我们提供权力专业转录服务和我们的rev.ai.通过提供丰富的原材料,演讲到文本应用程序编程接口(API)。由此产生的模型使用统计数据来考虑影响标点符号的韵律和语法因素。

永远不要通过再次缺乏标点符号的文档斗争。联系我们今天。

实惠,快速转录。100%保证。