跳到内容

人工智能和语音识别趋势:媒体和娱乐

牧师

2021年6月29日,

AI-and-speech-recognition-trends-media-and-entertainment-rev

牧师;博客;人工智能;人工智能和语音识别趋势:媒体和娱乐

没有什么比一个好的倾听者更让我们感激的了。感觉被倾听和理解是每一段关系的关键,而正是这一点导致了生活中许多最有价值的东西:信任、忠诚和其他牢固的纽带。

如果你的媒体可以与你的受众建立类似的关系呢?各大品牌早就明白倾听顾客心声的重要性,但现在人工智能(AI)和自动语音识别技术,倾听比以往任何时候都更有可能。这些用户体验不仅更加个性化,而且这种直观的互动模式也更加吸引人。

你知道,到2021年,消费者可以在哪里找到内容。你如何让自己脱颖而出,建立品牌忠诚度,让用户不断回访?

这很简单。开始听

为了让你开始,我们挑选了3种在媒体和娱乐中使用语音识别的方法。其中一个会让你的生活更轻松,其他的会帮助你为你的观众创造更好的体验。

它们可以归结为我们所说的三个I:

  • 交互性
  • 的见解

语音识别创造了丰富的和身临其境的经验,因为它邀请观众交互这种方式在数字领域可能是新颖的,但却是完全自然和直观的。同时,您的企业可以利用ASR来产生强大的功能的见解关于你的内容,以帮助你更有效率。

1.媒体资产管理

是否你是一个大玩家在娱乐行业或者仅仅是一个广告公司多媒体资产或培训的目的,你知道它可以保持准确的标签内容,找到正确的剪辑当你需要他们,并管理和组织年复一年的产品。

音频和视频文件的问题在于它们本质上是非结构化数据类型。你不能像在文档中那样在其中搜索关键字或短语。没有任何全面的方法来编目文件,我们只剩下标题和元数据,例如文件的创建日期、大小和类型。

那么,当你需要从一年前的面试中找到一段特定的引用时,你会怎么做呢?如果没有一种简单的方法找到它们,你如何分析你的资产和它们的表现?

答案往往是放弃。其实不需要这样。

ASR用于媒体资产管理通过为这些以前不规范的文件类型自动生成可搜索的、可索引的转录本来改变这种范式。除了让你更好地控制你的资产,它还通过提供标题使你和你的用户的生活更容易。

2.互动媒体

我们已经看到人工智能影响娱乐的一种方式是,利用算法为消费者提供更具个性化的内容,实现超精准定位。在面试中对数据的科学,康卡斯特应用分析高级总监Christopher Whitely解释说:“现在有一种趋势,即使用机器学习模型向消费者提供最相关的内容,以保持他们的参与,无论是他们可能会看的节目或他们感兴趣的广告。”

ASR进一步推动了这一趋势,实现了真正的互动产品,让我们可以用自己的声音与数字字符互动或控制数字环境。虽然我们预计这将在许多行业中发生,如电视选择你自己的冒险风格媒体,收益最大的是电子游戏。

它已经走过了很长的路。2014年,一家加拿大游戏开发商发布了一款游戏机器人的殖民地在这个游戏中,“你用英语与能听懂你的话的机器人对话”,让它们采取各种行动,比如拿起公文包。然而,如果你看这到底是怎么回事当它不起作用时,我们会感到非常沮丧。在一段时间内,这可能是有趣的,但如果你一遍又一遍地说同一句话,毫无效果,它就会很快变老。

的教训吗?如果你打算在游戏中使用ASR,请确保正确使用。

幸运的是,像深度学习这样的技术进步使我们能够做到这一点。看一个最近的例子,streamer使用语音命令玩剑和魔法在美国,语音识别几乎是完美无瑕的,以至于流光管称之为“不真实的体验”。

语音技术杂志他总结道:“语音识别让游戏更具有沉浸感,感觉更真实,因此增强了玩家的体验。”

3.虚拟现实

导致这种“不真实体验”的另一个因素是,它发生在虚拟现实(VR)中。声音是其中的关键部分。VR依赖体现让我们在虚拟现实要求我们加入的虚拟世界中感受真实。能够四处走动并拿起东西是很棒的,但如果没有说话的能力和被倾听的感觉,我们就永远不会真正感受到虚拟空间的存在。

电子游戏显然是第一个应用,但绝非唯一。我们最喜欢的方法之一是使用ASR和VR进行急救人员培训。一个为国家科学技术研究所撰写的文章(NIST)解释说:“在《健康学者》的虚拟场景中,用户戴上虚拟现实头戴式耳机,对着内置麦克风讲话,指导一组虚拟角色通过心脏骤停。利用语音识别和动作捕捉技术,用户可以命令虚拟团队成员进行电击、心肺复苏和用药。”

ASR和VR的一个更有野心的应用是用这种技术和死者对话.是的,你没看错。这样的公司以后Eternime正在开发一种技术,可以让你建造一个栩栩如生的已故亲人的化身,以便在虚拟现实中与他们“对话”。如果训练数据集没有答案,你可能无法问奶奶你一直想问的问题,但多一次和亲人说话的机会仍然是一个很好的机会。

结论

我们喜欢与世界分享我们的ASR技术的一个主要原因是人们梦想的不可思议的应用程序。无论你决定如何将语音识别融入你的产品,我们保证,如果你专注于交互性、沉浸感和洞察力那你就不会出错了。

准备好开始了吗?了解更多关于Rev.ai,我们的语音到文本的API,让开发人员可以立即访问一个完整构建的语音识别引擎。

便宜、快速转录。100%的保证。