Revinar

添加智能到您的媒体与Rev +图标



网络研讨会转录

丹尼·兰伯特
今天的网络研讨会有一个非常激动人心的话题。是我自己,丹尼·兰伯特,我是Rev营销团队的一员,与偶像和迈克·斯祖姆林斯基合作,你们看到我下面的人。我们会讲到如何在媒体中增加智慧。我们的意思是使用人工智能的力量,使管理媒体资产更容易,更高效,更快。

所以在我们开始之前,让我们通过几个家庭物品,这将使您的体验更好地和我们的体验。所以这是一个网络研讨会,这意味着它只是对与会者的看法。你应该能够听到并看到我和迈克,但我们听不到或见到你。因此,如果在网络研讨会期间的任何时候,您觉得您想在屏幕底部提出一个问题或聊天,您将看到一个Q&A选项。如果您可以使用它的问题,它使得更容易解决问题并在我们最终拥有的Q&A部分回答它们。然后,如果您只想在任何意见或疑问中聊天,您也可以在底部的聊天部分中执行此操作。

我们也为你准备了特别的礼物。我们在这个网络研讨会上有现场字幕。如果你在屏幕底部看到一个用CC图标表示的关闭标题选项,你点击它,你可以显示或隐藏字幕,你可以改变它们的格式。真正酷的是,他们将讨论Rev AI的人工智能和ASR技术,而这些字幕实际上是由我们说话的时候驱动的。所以狗食,如果你愿意的话,那就是ASR技术在发挥作用,体验起来真的很酷。我们也会在记录事件发生的两天左右之后发送一份带有字幕和幻灯片的录音。如果你有任何问题或者你想和任何人分享,我们会在活动结束后分发给大家。

所以在我们开始的时候,我的名字是Danny Lambert。我在Rev的营销团队中,它是一个绝对的荣幸,让Mike Szumlinski与我一起。他是Iconik的首席商务官,并将做一个真正的演示和介绍ICONIK如何运作以及Rev Ai和Iconik之间的伙伴关系。迈克,非常感谢加入。您介意仅向您简要介绍您今天的人的话吗?

Mike Szumlinski.
是的。谢谢丹尼。正如丹尼说,我的名字是Mike Szumlinski。我是Iconik的首席商务官。所以当你们知道的时候,我是那个人对你的所有关于产品谈论的人,并说服你值得看看。自成立以来,我一直在与团队合作,并以某种方式,塑造或形式达到了大约七年。我一直在媒体和娱乐中围绕数据管理,档案策略,现在大约20年的事情。上帝。男人。所以是的,这是我的一部分背景。 I'll hand it back over to you Danny to dive in.

丹尼·兰伯特
是啊,我绝对喜欢前后的Covid爆头,留胡子和胡子之后,现场和现在在家里。这就像完美的现实。

Mike Szumlinski.
外面和里面,对吧?

丹尼·兰伯特
太棒了。所以我们今天要讲的是,我们要谈谈用人工智能管理媒体资产,然后用人工智能和丰富的元数据来改善你的生产流程。接下来是真正的肉和土豆,最激动人心的部分是迈克将会进行现场演示,演示你如何使用人工智能,使用iconik,让你当前的媒体工作流程更快更简单。就像我说的,最后我们会进入问答环节,在我们演讲的时候提出你们的问题,这样我们就有机会回答所有的问题。

所以说到用AI管理媒体资产,我认为人工智能是最有趣的事情之一,人工智能作为一个类别可能是过去几年里最流行的词汇之一。很多时候,人们并不知道它是如何影响他们的世界的,不知道它是否真的存在,或者它只是品牌用来卖给你各种闪亮物品的流行词。我们这次演讲的目标是揭开这一问题的面纱,向你展示你可以并且应该如何使用人工智能,让你的生活,无论是个人生活还是商业生活,变得更容易。

所以如果你曾经和雷夫共事过或者听说过雷夫,你可能对我们的人力服务最熟悉。所以人类转录,字幕,字幕,你把一个音频或视频文件交给Rev,然后我们有人类转录员在另一边处理,通常在24小时内返回字幕,字幕,或文字记录文件。它和ASR(自动语音识别)的区别在于,Rev AI提供的是自动处理音频和视频。这是一个语音识别引擎,对超过50000小时的训练的人类记录和处理数百万分钟的音频和视频每月提炼,总是训练成为一个更精确的语音识别引擎,这样你可以在音频和饲料回到文本和标题。最终它的输出是一个高度精确的,易于集成的API,你可以插入任何你想要使用的软件输出字幕和文字记录就像Mike将要展示的iconik是如何做到的。

如果你是ASR的新手,或者即使你有经验,语音识别技术好坏的最大性能指标之一就是单词错误率(WER)。这本质上是计算语音识别引擎处理的单词量和它在每个单词基础上的错误率。实际情况要复杂一些,我会在聊天中分享一篇博客文章,更多地讨论如何计算单词错误率。但在一项研究中,不同的ASR技术供应商,us,谷歌,speech hatics, Amazon, Rev实际上拥有最低的单词错误率,而且是相当不错的差距。你可以看到我们的市场份额是15.7%,谷歌是20%,亚马逊是27%。这就是我们所说的持续处理数百万分钟的音频。语音识别引擎只是学习它,并变得越来越好,最终更准确。

人们购买像我们这样的ASR服务,从准确性角度来看,这通常是一个单词错误率的组合,以及与Rev集成的难易程度,这可能与市场上的其他选择相比。所以我相信Mike在谈到iconik将Rev AI整合到iconik产品的过程时,会涉及到这两件事。闲话少说,我把这个交给Mike Mike会告诉你们更多关于图标的知识,他们是做什么的,最后向我们展示它是如何运作的。

Mike Szumlinski.
伟大的。谢谢丹尼。所以,Yeah,正如Danny所说,我们是媒体管理,或者在云中真正协作工具。所以它是一种作为服务平台的软件。以及我们真正关注的事情是能够随着时间的推移组织,查找和种类恢复媒体内容。这是通过各种不同的方式完成的。元数据标记是一个很大的部分。通过将AI集成到我们第一次启动ICONIK时,它具有可用的简单AI对象识别标记。但现在我们已经与Rev集成了,允许我们在所有不同项目中使用转录作为搜索媒体或元数据。

所以这真的允许你做的不仅是搜索镜头中的内容,而且在拍摄中所说的是在音频饲料中所说的是什么,因为我们有很多客户使用它的两个音频和视频。当我们进一步进入演示时,你们会看到这一点。这真的允许您做的是简化您如何组织内容的方式。因为Iconik是我们所谓的混合云模型,这意味着高分辨率数据实际上可以生活在云中或前提。因此,与许多其他解决方案不同,在那里需要您将100%上传到云端的内容,我们通过将内容带到云端,我们完成了,我们通过允许您在Prem或遥控器上携带自己的存储来实现这一目标云提供商,从该内容生成低分辨率代理,然后我们可以使用通常生成AI标记的,这意味着如果您拥有价值600个数据的数据,则不必将全部移动到云端通过云服务来搜索它。如果您有不同的供应商或提供商的不同存储器,那么所有的运作。当你把这个全部捆绑在一起时,它意味着我们能够建立这种组织结构,这些结构是一个超级存储的存储,而不是过去,你的存储是你唯一的组织结构,你总是在尝试 to tie the storages together under one big namespace. Now disparate storages can be brought together, searched by any different number of metrics, and that data doesn't all have to live in the same place. So we can kick over to the next one here.

所以,我们在AI范围内的重点是提供对系统内部的数据的可见性。因此,无论数据是否足够重要,对您保持周围,但可能对您有一个人来说不够重要,我们可以通过简单地AI对象标记标记或转录该数据来恢复大量数据的值或转录该数据的数据。这将允许您的生产过程快速增长,从而在某种意义上,如果您拥有此归档内容,并且此归档内容在文件和文件夹中功能上,但那里有10,000小时的口语单词,您将如何?知道谁说什么时候没有与它相关的这种数据?

现在你可以看下一个了。这就是我们整合人工智能的地方。或者,我们整个模型背后是雷夫的人工智能转录。我们能做的是非常非常简单地整合任何有音频轨道的内容,然后自动发送给Rev.我们要把声音转换成文本。我们要记录每个单词的时间戳这样我们就能知道它的确切位置。我们可以在你回放内容的时候追踪它。你可以修复这些数据,所以如果有错误,Rev就非常好了,我相信它是第86个百分位数,Danny?仍然有14%的东西是你未来可能想要解决的。你可以在iconik中修复它,并将它永远保存在那里,你还可以将它用作导出工具。因此,您对iconik内部的文字记录所做的任何添加或修改都可以导出为原始文本记录,甚至字幕文件。 So we're going to show all of that here in a few seconds.

所以,只要有点重申我们在这里谈论的东西,在Iconik中,我们有能力分享任何内容,无论它在世界上的任何地方都在何处,因为代理和元数据生活在云中,甚至如果您有大型在预款的沙子,您可以向户外用户提供数据。我相信你们很多人都在你有一个大型共享存储系统的情况下,但是你在企业内有其他利益相关者无法进入那个沙子,甚至更差,可以进入沙子或纳米,但甚至没有必要的软件播放它上面的内容。因此,Iconik以这种方式打开它。

您获得的另一个选项是Iconik确实允许您从多条路径中找到资产。我们不仅有搜索功能,我们还拥有这些东西,称为虚拟文件夹结构,我们还保存了搜索,我们还有能力在系统内进行关系管理,这意味着仅关联个人资产通过任意关系彼此,这意味着许多不同的兔孔,您可以潜入到多个不同的组织结构中找到同一块内容。

这一切都流入了Adobe,这意味着您可以获得所有这些信息,找到您正在查看的内容,甚至可以制作可以流入首映的标记和笔记,从成绩单中,真的,当你绑定所有这在一起,这只是让您更容易推进一些您想要的东西。

说到这里,我想我们可以做一个演示。

丹尼·兰伯特
我们将停止分享我的屏幕,我会让你捡起来。

Mike Szumlinski.
是的。所以亚伦将在这里分享我的,我们将完成桌面。所以我们现在在Iconik内部,而我要做的第一件事就是炫耀了一个能够在Rev中有一些能够的速度。所以我要搜索有些人可能的剪辑实际上已经在河内,但我们做了一个遥控编辑网络研讨会,这个遥控编辑网络研讨会是蒂姆和来自我们团队的蒂姆所做的。你可以看到它是一个小时20分钟。你可以看到我的胡子的一点点较短,所以它又一段时间了,我不再在厨房里了。所以嘿,男人,时代的变化。但是我将在Iconik内做的是我只是打算点击“转录”按钮,它会说,“嘿,你想要哪种语言?”这是英文,所以我将继续前进并击中“转录”,这将是什么,实际上将转录作业提交到背景中的Iconik。


我想做的原因首先是为了得到一些人,这是一个想法这件事实际上的速度。因为一个小时20分钟,我会让你们弥补你对你认为这应该回来有多快的期望。与此同时,我将在这里真正快速地跳到一些内容,即我已经开始转录,并让您在Iconik中看到有点不同的视图。所以这是另一个更长的形式剪辑。这是一个大约一个小时,11分钟,我不久前做了一点,我可以很快点击剪辑本身内的任何单词,这将立即跳到此特定剪辑中的该位置。


我可以做的另一件事是,如果我只是点击播放,它实际上会跟随实时播放的内容。所以当人们说话时,我们会实时得到这个白色的小轮廓的反馈,我现在已经静音了音频,但我可以很快地取消静音。

所以希望在那里拿起一些麦克风,但是你可以看到我们很快就刚刚做出了关于这个的笔记,或者实时获得反馈。

我有能力的另一件事是你可以看到这里有日复速度。所以有不同的扬声器。这些不同的扬声器有不同的名称,Rev给了我们有多个发言者的事实,但在这种情况下,我实际上知道这些人有名字,他们是谁,以及那种东西。所以我可以在这里开始,说“管理扬声器”,我能够通过各种不同的扬声器并给予他们的名字,所以我们知道谁在任何一段时间都在谈论谁。一个相当强大的能力,所以当你在未来寻找时,你不仅仅卡,扬声器2,扬声器2。

您也可以直接从页面搜索转录,所以如果您搜索某些短语或其他任何短语,我们立即带回。如果他们多次说,我们会突出显示它们。在这个演示文稿中,您可以看到“笔记本电脑”据说了几次。我们可以跳到一个被说的人,无论是什么特定的时间。我们也可以在这种摘要视图之间切换到我们称之为公共视图。这允许我们做的是修改整个语句。所以,如果出于某种原因,搜索语句。

因此,如果出于某种原因,搜索会返回不正确,我将在这里迅速搜索标志性,因为我知道有时Iconik拼写错误。我可以进入和在这个词上,我可以解决它。这是单词时机的词。所以我们可以确切地看到它的位置。但有时候这并不容易。有时你实际上想在一个短语级别这样做。因此,如果我们踢进时间短语视图,我们可以说“我为修女喝啤酒”。也许这不是我们实际所说的。也许我们可以说名词,我不知道在这里的实际说是什么,但我们可以改变整个短语,它保持该剪辑中的时间。我们仍然可以点击这些短语中的任何一个,以便在out点中播放。 If we click the little play point, it plays just that in to outpoint as part of this particular clip.

所以你可以看到这个是一分钟32秒,七帧到一分钟41秒和七帧。因此,在这种情况下,这正是九秒钟长的是,进出点也会去这里玩。这么大的能力只是改变各种不同的人。这是我们也可以改变发言者所在的地方。所以,如果约翰尼实际上没有这么说,也许他听起来像我这样做。而且我是那个说它或杰森所说的那个,我只能踢到其他人,然后在该特定项目同时获得适当的转录。

现在,我们可以做到的另一件事是我们也可以突出整个短语。所以也许我想在这里突出这个短语,因为我们正在进行DOC系列,我想把它转换为首映的标记。所以我可以说在我的剪切中使用它并进行快速评论。这使得基于时间的评论,那些评论可以作为标记流入首映式。所以,如果我真的很快就把首映放在这个屏幕上,所以你们可以看到它并登录iconik,回到首映,宾果,我们将打开完全相同的剪辑。

在这种情况下,我可以做的是我可以打开资产或资产代理。如果我打开资产,那实际上要指向高分辨率。如果高分辨率在本地文件系统上为我提供本地可用,它将立即链接到它。但在这种情况下,它在云中,它是一个半小时,我现在不想在我们在这个网络研讨会上下载整个小时半。所以我要点击打开资产代理。这将是什么,现在只是抓住该项目的代理,我们可以追踪其方式的状态。希望我的互联网现在的工作很好,所以我们可以看看我们的转移,并看看我们已经有了半小时和20分钟的长电话或剪辑下载了20分钟的拨打电话或剪辑。

到这个剪辑完成的时间,它只扔进我的首映时间表。在那里我们去,繁荣,导入文件。还有我们的剪辑。您还会注意到剪辑中有一个标记。你会注意到标记是,“在我的削减中使用它”已经与它相关联。所以我使用了来自我的Iconik面板内部的转录。我用它来制作更多或更少的纸张切割,然后在评论中迅速转换它们,这些评论也给了我在首映中的所有进出标记。现在,超越这一点,很多这很多都会下来搜索。所以我们在这里去了这个特定的剪辑。我们看到了它。 We saw that there was a transcript. Maybe sometimes you want to search at a higher layer.

所以你现在可以看到在这边有转录文本,我将用同样的搜索词。我会查看我所有的记录,看看有没有人说过笔记本电脑这个词,我们可以看到这两段视频。你也会注意到这个东西在4分钟前没有转录,那是1小时20分钟的时间,已经有了转录,因为它返回的结果是“笔记本”这个词。如果我跳进去看这个片段,现在我们可以看到那整个一小时二十分钟的讨论传回来的文字记录,很明显我很啰嗦,因为大部分时间都是我在讲话。

但总的来说,这意味着我们有了一个非常非常强大的工具,可以使用人工智能和转录来驱动内容搜索,驱动编辑评论,以及驱动……特别是通过长格式的档案,或者如果你是做纪录片的,只要快速浏览文字记录,就能发现某些短语被快速地说了。我认为这里需要注意的是,使用Rev服务的成本实际上略低于每小时2美元。因此,通过该系统运行数小时、数小时的视频并不像其他服务那样成本高昂。好了,我想我要把它交给丹尼因为我想我们已经讲过了大部分关于转录服务的演示我们会从那里开始。

丹尼·兰伯特
迈克,而你仍然有演示,你介意只是展示这个过程是那些已经使用Iconik的人或那些想要的人,实际上建立了两者之间的集成?

Mike Szumlinski.
两者之间没有集成。当我们运送ICONIK并且您有一个帐户时,您只需访问所需的任何资产,然后单击“转录”按钮。你将要恢复转录。如果您有一个与Rev的企业协议,您在购买折扣定价的地方,我们也支持将其作为您自己的AI。所以你可以说,“嘿,我有一个新帐户,它是rev.”而且您放入与您的帐户相关联的访问令牌,然后直接账单来而不是我们。也就是说,不要告诉那个人在手机上,我们实际上比仅使用Rev如果没有企业账户,我们实际上有点便宜。所以我们是一个非常强大的驾驶员,能够有效地完成这些东西。

丹尼·兰伯特
是的。迈克,我不能告诉你令人印象深刻,而不仅仅是对成绩单的回应,而只是能够搜索所有资产,能够以这种无缝方式将这些削减到Adobe Premier中。我的意思是,如果你正在等待你的团队中的某个人来转录它或者人类版本,那么真的很令人难以置信,然后只能能够如此迅速地整合所有这一切,真的令人印象深刻。

Mike Szumlinski.
在讲这个的时候,我忘了讲另一件事。我之前讲的时候提到过,你们也会注意到我们有文本下载和网络VTT下载选项。这实际上允许你下载你所做的修改的日记记录作为一个直接的文本文件。我们开始吧。现在我可以打开Word,把它放到谷歌文档中,做任何我想做的事情,让它直接阅读文本。

我们还支持将其作为Web VTT文件执行,这是一个实际的True转录文件。所以现在你可以看出我是否打开它,它实际上是按标准化格式的每个语句的所有定时标记,其时间是Web VTT重要的时间。很快就在这里,我们也将支持SRT,SCC还有一些其他格式的转换。并相信它也不是导入。所以,如果你只是......你一直在使用Rev,你已经有很多与你的资产相关的标题信息。你不必重新重新转崇他们谈论。您实际上可以将标题文件本身导入成绩单。它们不会显然对日复一衰,但您至少会将时代的成绩单达到系统,然后一切都向前移动,您可以使用AI生成。嗯是的。

丹尼·兰伯特
这真是令人印象深刻。迈克,如果你不介意放弃你的屏幕分享,我可以在这里拔出我们的近距离。好的。

好吧,所以在我们跃起问题之前,如果你们中的任何人都感兴趣,在一个地点组织所有媒体资产,使用迈克已经向您展示并制作所有资产搜索并简化了您的工作流程可以访问iConic.io并开始使用此目的。我的意思是,它立即可用。这不是一些beta或类似的东西,这是一个可以立即开始使用媒体工作流程的过程,如果您对任何一个流程的Rev AI API感兴趣,您只能转到Revai.com。所以我知道我们在这里看到一个问题,以便任何对最终裁员的支持。迈克,你想和那个说话吗?我知道你已经键入了答案。

Mike Szumlinski.
是的,因为我也可以大声说出来。我们计划在今年的季度或明年季度初的Q4中释放我们的最终削减X.我们只是在等待最新的FCPX下降,因为它有很多有趣的新功能,我们想要实施,刚刚发生在两周前,一周和半前发生。所以现在我们可以在最早的剪切X和标志性的初期致力于涵盖我们想要做的所有事情。

丹尼·兰伯特
太棒了。我没看到其他问题了。让我停止我的份额,确保没有任何聊天。噢,是的。如果一个视频文件已经有了我们支付的转录并被纠正了,它是如何工作的?我认为Mike,你可能在最后提到了这个,但你可能想重申一下上传功能。

Mike Szumlinski.
是的。因此,我们将很快添加导入现有封闭字幕文件的能力。因此,如果您拍摄了成绩单,修改过它,并将其保存到我们支持的标题格式中。所以SRT,SCC或最受欢迎,或网络BTT最受欢迎。我们将能够实际上上传与资产关联的该文件,并基本转换为我们的转录视图,以便您可以继续使用它。

丹尼·兰伯特
谢谢,迈克。未来对Rev非AI人类处理服务的任何支持?

Mike Szumlinski.
所以有一个API。如果我们的客户有足够的需求,我不明白为什么我们不会看看它,因为显然我们已经建立了框架。我们现在有多个工作的概念,即我们有助于亚马逊冰川,这可能需要48小时或72小时或类似的东西。因此,在标志性中,可以坐在和等待某些事情的概念等待发生的事情。我们只需要有足够的客户需求来推动向前发展。

丹尼·兰伯特
谢谢你的问题[听不清00:02:55]。看起来就是这样了。迈克,你能像你说的那样分享这段录音吗?抱歉,我在拍纪录片,我想把我所有的资产放在一起进行搜索,而不是CC文件。

Mike Szumlinski.
因此,除非您的数据有与它相关的时间,否则我们不会明显地完成所有定时信息。将文本与成绩单相关联并不困难,就像我们称之为段的那样困难,但我们必须使用API​​来执行此操作。因此,您可以基本上提取所有数据,使其成为我们系统内的转录标签,并且它将显示出来,但如果您没有时间信息,您的搜索性仅限于顶级资产本身和如果这是半小时的长剪辑,你仍然会手动搜索它。我们不会知道第二件事发生的事情,但它是可行的。它不是点击性的点击。

丹尼·兰伯特
然后他们跟进时序,但它读取时间代码吗?我认为这就是被问到的东西。

Mike Szumlinski.
它必须以标准化格式的格式。因此,如果您只需在各种不同位置的原始时间码中的文本文件,那就是标准化的格式。所以它不一定很容易做到。它可以通过我们的API和脚本来成为可行的,我们还有一个可以帮助的集成商。因此,任何手段都不是不可能的,但它不会是一个点,点击或拖放和删除的东西。

丹尼·兰伯特
太棒了,看来这就是我们收到的所有问题了。迈克,如果有人在我看录像的时候或之后有问题,如果他们想到了什么,他们有什么最简单的方法向你的团队提问?

Mike Szumlinski.
如果您想要一般询问,您可以在info@iconic.io上击中我们。你可以打我,它只是迈克·甲克。如果你想,很好地了解我得到了很多电子邮件,所以响应时间可能会有所不同,并且如果您是现有的客户,您只想了解更多信息,您可以随时与我们打开支持机票或联系您的CSR,他们也可以帮助您解决这种问题。

丹尼·兰伯特
太棒了。如果您想询问任何REV AI相关的问题,您可以随时直接给我发电子邮件。它是danny@rev.com。虽然我们在说迈克,但我们确实有另一个问题进来,而且价格是多少?

Mike Szumlinski.
因此,我们所有的定价都是基于,主要是我们的消费量定价,意味着有多少人登录日历月,主要用于代理,我们不会为您的存储费用。然后AI本身显然是花费的钱来贯穿。这一切都可以在Iconic.io上获得。如果点击页面顶部的计划按钮,实际上有一些估计,然后在页面中间单击小创建自定义估计按钮,实际上在计算器上有完整的估计,因此您可以使用所有不同的不同定价,并恰好看出它可能会花费多少费用。如果你在用它玩它并说“嘿,嘿,我不太明白这一点。”只是打了我们。我们很高兴地走过它。

丹尼·兰伯特
太棒了。好吧,如果没有更多的问题,迈克,不能谢谢你来了。这真是一个惊人的演示。它表明这么好,功能,我相信它可以节省大量的人和吨媒体工作流程,很多努力和很多时间。所以,如上所述,如果您想向我们中的任何一个联系,您可以通过我们提供或访问我们的Revai.com或Iconic.io的电子邮件地址来完成此操作。迈克的任何关键词?

Mike Szumlinski.
不,每个人都应该通过标志声,因为它是我所知道的,这就是我所说的。

丹尼·兰伯特
很好。再次感谢你抽出时间,迈克,我真的很感激。

Mike Szumlinski.
是的,谢谢大家。祝你有美好的一天。