跳到内容

人工智能和机器学习在语音识别中的作用

牧师

2019年8月25日

shutterstock_771481822 (1)

牧师;博客;自动转录;人工智能和机器学习在语音识别中的作用

众所周知,自从IBM推出语音识别技术以来,语音识别技术已经取得了长足的进步第一台语音识别机在1962年。随着技术的发展,语音识别越来越多地嵌入到我们的日常生活中,比如亚马逊的Alexa、苹果的Siri、微软的Cortana或谷歌的许多语音响应功能等语音驱动应用。从我们的手机、电脑、手表甚至冰箱,我们带入生活的每一个新的语音互动设备都加深了我们对人工智能(AI)和机器学习的依赖。

人工智能和机器学习

1956年由约翰·麦卡锡,人工智能可定义为“机器展示了人类的智慧”。在人工智能最初被用于分析和快速计算数据的地方,现在它让计算机能够执行通常只有人类才能完成的任务。

机器学习是人工智能的一个子集,指的是能够自我学习的系统。它涉及教计算机识别模式,而不是用特定的规则编程。训练过程包括向算法输入大量数据,并允许它从这些数据中学习并识别模式。在早期,程序员必须为他们想要识别的每一个对象编写代码(如人类和狗);现在,一个系统可以通过展示许多例子来识别这两种情况。因此,随着时间的推移,这些系统在没有人为干预的情况下继续变得更加智能。

机器学习是人工智能的一个子集,指的是可以自我学习的系统。它涉及教计算机识别模式,而不是用特定的规则编程。

机器学习有许多不同的技术和方法。其中一种方法是人工神经网络,产品推荐就是一个例子。电子商务公司经常使用人工神经网络向你展示你更有可能购买的产品。他们可以从所有用户的浏览体验中获取数据,并利用这些信息做出有效的产品推荐。

人工智能的其他一些常见应用包括物体识别、翻译、语音识别和自然语言处理。牧师的自动转录由自动语音识别(ASR)和自然语言处理(NLP)驱动。ASR是口语词到语篇的转换,而NLP是对语篇进行语义推导的过程。由于人类经常使用口语、缩写和首字母缩略词,因此需要对自然语言进行大量的计算机分析,以产生准确的转录。

时间尺度上的机器学习历史

语音识别技术面临的挑战

语音识别技术面临的挑战很多,但它们正在缩小。它们包括克服糟糕的录音设备、背景噪音、困难的口音和方言,以及人们声音的不同音调。

教机器像人类一样学习阅读口语,这是一项尚未完善的工作。倾听和理解一个人说的话远比听他说的话重要得多。作为人类,我们也能读懂对方的眼睛、面部表情、肢体语言、声调和语调的变化。语言的另一个细微差别是人类倾向于缩短某些单词(例如,“我不知道”变成了“dunno”);我们说缩写单词的时间太长了,以至于我们的发音不像刚学时那么准确了。这种人类的性格给语音识别中的机器学习带来了另一个挑战。

倾听和理解一个人说的话远比听他说的话重要得多。

机器正在学习“听”口音、情感和音调变化,但仍有相当长的路要走。随着技术变得越来越复杂,特定算法使用的数据也越来越多,这些挑战很快就被克服了。

支持语音接口的技术非常强大。随着人工智能的进步,大量的语音数据可以被轻松地挖掘出来用于机器学习,它成为下一个主导用户界面也就不足为奇了。

语音识别与Rev

在Rev,我们利用了数十年的语音识别研究和开发,创建了一种快速、易于使用和负担得起的自动转录服务。如果没有其他公司在语音识别方面的所有基础,我们就不可能创建Rev speech。

免费电子书:如何过渡到使用更多的人工智能

便宜、快速转录。100%的保证。