转录文件格式:不同转录格式指南

牧师;博客;资源;录制;转录音频到文本;转录文件格式:不同转录格式指南

你可以自己抄写视频和音频内容,或者使用专业的抄写服务,比如Rev.无论你采用哪种方式,重要的是要知道不同的抄写文件格式。

转录文件格式的选择将取决于每个任务的要求。需要考虑的一些问题包括:

  • 视频/音频托管平台
  • 该平台支持哪种文件格式?
  • 您的网站主机或嵌入视频吗?
  • 是否需要可下载的成绩单?
  • 你是想让成绩单具有交互性,还是想进行播放列表搜索?

让我们检查一些可用的布局选择。

标准布局

有几种标准布局如下所述。

纯文本转录格式

纯文本格式是最常见和更简单的类型。他们是:

  • 纯文本文件(.txt):这些文件的扩展名是.txt,并且没有任何格式。使用纯文本编辑器(如记事本)打开纯文本文件。
  • Microsoft Word文档(MS Word .docx):这些是Microsoft Word成绩单,包括文本格式。它们很容易阅读和编辑。
  • PDF.:可移植文档格式是锁定的,不能格式化或编辑。它们也很容易阅读。

带有时间戳的转录文件格式

顾名思义,这些文件对所说的是时记本。时间戳可以是几秒钟,分钟或小时。文档通常是MS Word格式。

带有SMTPE(美国电影和电视工程师协会)时间码的文件也带有帧标签。时间戳有助于将音频与视频内容同步。

HTML转录文件格式

HTML文件格式在你的网站上托管和嵌入视频时很有用。音频或视频文本是用HTML格式的,可以通过浏览器在线访问。它通常也为屏幕阅读器进行了优化。

JS和JSON文件格式

JS和JSON不太常见。它们是机器学习转录软件使用的主要输出。这些格式的主要优点是唯一的时间同步,其中每个单词都有一个精确到毫秒的时间戳。这对于交互式文本是很有用的,因为每个单词都变成了一个链接,链接到说话的视频或音频部分。

JS和JSON格式还可以从视频或音频内容数据库查找转录程序。

缺点是他们不是用户友好的。它们很难阅读,而不是下载的理想选择。

表格中的文本Vs段落中的文本

将文本抄写成表格不像文本分段那么简单。大多数转录软件将文本输入为纯文本,不支持表格。必须将文本转换为表格格式,将其导出为制表符分隔的文本或逗号分隔值(CSV)文本文件。

在选项卡分隔的文本文件中,使用表示每行一个记录的列的选项卡分隔信息。

在逗号分隔值(Comma Separated Values, CSV)文本文件中,信息使用逗号分隔,表示每行有一条记录的列。

下面是一个如何以表格格式创建数据的例子:

标签分隔文本

时间戳扬声器成绩单

00:00:04.19 Mark在这个视频中,我们将学习内容营销的基础知识。

John在下一节中,我们将学习买方的角色。

CSV文本

时间戳,扬声器,成绩单

00:00:04.19,Mark,在此视频中,我们将学习内容营销的基础知识。

00:00:08:20,John,在下一节中,我们将学习买方角色。

结果表:

行业成绩单布局

除了标准布局外,还有特定于某些行业的布局,如下所示:

编辑决策列表(.edl)

这种格式在电影行业很受欢迎,通常用于脚本编辑的后期制作过程。它是一种有序的、带有时间戳的文件格式,用于识别文本中的关键时刻,并将它们与视频中的确切时刻联系起来。

在“脚本编辑器”中突出显示选择并导出到列出源视频数据和时间码的EDL文件。然后可以将此数据上载到像Adobe Premiere Pro,Final Cut Pro,Avid Media Composer或Davinci Decorve的视频编辑软件,以即时创建装配序列。此格式对于大型视频编辑项目非常宝贵。

Avid Scriptsync(.txt)

ScriptSync是一款安装在Avid Media Composer内的产品,这是Avid Technology的一款视频编辑软件。它帮助制片人和视频编辑快速同步视频和音频剪辑直接到脚本的台词。要么有人提前写好剧本,要么就像纪录片或真人秀一样,有人把节目中说的话抄下来,然后在后期制作中构建剧本。

Avid Scriptsync文件是纯文本文件。该软件为每行文本创建视频/音频同步标记。

法律成绩单

法律文本记录是在法律程序中进行的,如法庭会议、取证和国会/参议院听证会。会议通常在稍后录制和转录。该文件通常是Microsoft Word文档。

然而,文本格式取决于律师、法庭书记员协会或法庭系统提供的风格指南。例如,加州法院记者协会,一个由法庭速记员组成的专业团体,已经在他们的网站上公布了最低誊写标准格式。

在Rev,我们提供人类转录服务精度为99%和几个转录物格式选项。