跳到内容

什么是机器生成的封闭字幕?

牧师;博客;资源;其他资源;人工智能与语音识别;什么是机器生成的封闭字幕?

封闭字幕经常被忽视,但在你的视频内容中包含它们有很多好处。

首先,封闭字幕可以让你的内容被欣赏聋人或听力有障碍的人。其次,并不是每个人都听视频音频。你知道80%的社交媒体用户都在观看吗视频静音,和周围69%的人在公共场所无声观看视频?所以,如果你想真正最大化你的观众,封闭字幕是必不可少的。最后,封闭字幕有助于提高你的搜索引擎优化工作,让你的内容在正确的人面前。

有了这些神奇的好处,你可能会考虑你自己试试吧。但如果你没有技能,没有时间,或者创造高质量的封闭字幕的预算?

机器生成的关闭字幕,或自动关闭字幕(ACC)可能是答案。

什么是封闭字幕?

闭字幕(CC)以文本形式出现在屏幕上,代表视频和直播流中的语音和声音。与字幕不同,CC包含额外的元素,如背景噪音、音乐、说话人的区别和描述。另外,那些重要的非对话音频提示,如“叹息”或“大笑”。

高质量的闭式字幕能做的不仅仅是在屏幕上提供文字。它们可以帮助你在搜索引擎中排名更高,提高参与度,并提高整体浏览者体验。

什么是机器生成的封闭字幕?

机器生成的封闭字幕或自动字幕是使用非人工方法创建的。作为一个标准,软件由三个部分组成。自动语音识别(ASR)技术、机器学习技术(ML)和人工智能(AI)都有助于提供自动语音到文本的实时字幕视频。

ASR组件至关重要。它是能够立即识别人们所说的话并将其翻译成语言的东西屏幕上的脚本.这种技术有两种工作方式;脱机或生活。离线ASR适用于电影、电视或预先录制的媒体。

住ASR允许用户实时创建标题。这使得它非常适合任何正在直播的东西,比如电视、演示、会议、视频电话或其他直播内容。

而自动语音识别技术则是不断发展的改善,机器生成的封闭字幕的准确性可能会有所不同。比如麦克风质量,说话者清晰度,说话者口音,方言,背景噪音,同音异义和专业术语会影响文本的结果。

人类vs.机器生成的字幕

如果你是一个节俭的内容创造者,你可能会被机器生成语音到文本技术所提供的可负担性和快速周转时间。然而,对于它在速度和价格方面所能提供的,它仍然缺乏准确性。单词可能会被误解,拼写错误,句子可能会完全混乱。

对于耳聋或听力障碍的人来说,准确的字幕是至关重要的。当部分对话出现错误时,人们最终会错过部分叙事内容。许多自动化服务的准确率仅超过80%。这个比例远不及人类的经验能够破译复杂的音频。像“嗯”、“啊”这样的自然对话,以及人们之间的交谈,仍然不完全在ASR的能力范围之内。

机器生成的字幕在哪里使用

如果你曾经在YouTube上看过视频,看过某人的Instagram故事,或者有通过极速和你老板见面您可能遇到过机器生成的封闭字幕。

对于许多平台和企业来说,他们的努力得到了改善他们的实时字幕技术令人难以置信。情况只会越来越好。例如,Zoom、谷歌Meet和微软现在都在视频通话时提供自动字幕。

然后电视上就有直播了。从体育赛事直播到早间新闻节目,它们都使用机器生成的封闭字幕

关闭字幕和法律

当涉及到视频内容创作时——尤其是在公共领域——了解隐藏字幕背后的法律总是好的在美国,公共电视关闭字幕是在1990年实施的吗美国残疾人法(ADA)。这项法律的概要意味着所有的公共媒体必须是可访问的。所以,如果有什么东西在公众场合播放地方,法律要求有字幕。

1973年,美国通过了《康复法案》以预防残疾歧视。从那时起,有一些修正案,包括504,无障碍作为一项公民权利。此外,508号修正案规定,某些类型的电子媒体必须有标题,特别是教育资源。

在当今这个高科技、视频紧缺的世界里,封闭字幕是必不可少的。无论您的预算或日程安排如何,都有自动或人工服务帮助您创建所需的用户友好内容