Frame IO Workflow 07 Sound | 翻译

The best reading materials for people in the media industry

tshaveanidea
September 25, 2020
Film

前文此前已经有过一篇同类型的翻译Frame IO的文章，不过那一篇是仿照Frame IO进行排版的，同内容的post，post在那上面需要花更多的时间。
目前就不更新在那篇文章上面了，等未来有心情了再更新吧。
如果错误欢迎指正，如需转发请标明出处。最后，本着专业术语不翻译的原则，如果你觉得那你还是不能理解，你可以自己再去查查资料。

声音

Sound

声音是隐秘在电影中的一部分。声音团队会录制新的音效、打磨已有的声音，并且把他们通过混音技术混合到一起。

专业的声音(后期制作)团队会在项目中做很多增光添彩的工作。这一部分的工作会为叙述增添更多的刺激感、亲密感、沉浸体验还有氛围。同时，专业的团队会确保在任何平台上的技术规格规范正确，也能确保在任何的播放环境中都能有最好的体验。为了了解声音的制作是如何从这些一个个独立的声音物料到混音和最后完成制作，我们需要了解接下来这一系列的内容。

需要交付给声音团队的物料

Materials Needed for Post Sound

绝大多数的项目会要求交付一个OMF/AAF，一个压缩编码的视频文件还有一张交付规格需求的清单。如果录制的声音有多个麦克风可以选择，有一个声音报告是非常不错的，但不总是必要的。

什么是OMF/AAF？

What’s an OMF /AAF?

OMF和AAF是一个特殊的中间格式，用于在不同的剪辑软件中传输或转换项目。他们能让后期声音处理软件能够从你的剪辑软件的时间线中导入声音片段。他可以让声音片段保持在剪辑软件中的相对位置、淡入淡出和一些其他功能，例如：平移、自适应声音和一些声音处理。本质上，这就是一份你剪辑软件上项目的快照，并且这个快照可以导入至数字声音处理软件（例如 Pro Tools）。

OMF vs AAF

这两个文件都是为了同一个任务——从一个软件的时间线上导出、从而可以导入到其他软件中。AAF相较于OMF是一个新的格式，并且相比于OMF，它可以携带额外的元数据（像是轨道名称）。但是并不是所有的视频制作软件都可以导出AAF。无论如何，它们在传输物料和发布声音的时候都是可以被接受的。

导出设置

Export Settings

导出OMF/AAF在每一个软件中都不太一样，接下来是几个最常用的剪辑软件的导出指南。

来自译者 :

I skip this part , if you want to know more info ,you can read on Frame IO.

Summary :

Premeire can only export OMF. Avid can export AAF. FCPX can export AAF by using X2Pro Audio Convert or Logic Pro X.

导出视频

Video Export

这些是Pro Tools 11以及之后的版本比较倾向使用的视频编码。

（你可以在Avid的官网上搜索到这些内容的梗概 https://www.avid.com/search）

* DNxHD (Preferred)

* Apple ProRes 422 (including HQ, LT and Proxy)

* DV25

* DV50

* H.264 (Performance may vary)

对于声音后期来说，720P和1080P的分辨率已经足够用了。这会帮助操作者节省下更多的处理资源用在声音处理上。1080P依然能为你的声音设计师提供足够的画面细节，而且更小的文件会在渲染导出、上传、下载上节约时间。

规格需求

’’Spec’’Requirements

每一个项目都有它独特的需求。这些是一些交接时所需要确认的相关信息，以确保最后混音制作符合项目要求。

* 内容的发布渠道（广播电视、网络、电影节、特定投放、等等）

* 混音所需要的格式（立体声、5.1环绕声、7.1环绕声、杜比音效、等等）

* 任何其他相关的音频规范（对于广播电视来说，这些规范通常包含在播出现场广播的视频指南当中）

后期声音处理流程

Post Audio Workflow

基础的循序渐进处理流程

Basic Step By Step Process

1. 轨道管理

2. 对话片段

3. 音乐片段

4. 粗混（可变的）

5. 声音设计/声音效果片段

6. 最终混音

7. 检查和修正

8. 交付

轨道管理

Track Management

从AAF/OMF导入到数字声音处理软件中，第一步要做的事就是管理轨道。在后期声音处理开始之前，每一条类似类型的声音片段，都井井有条的在同一个轨道上，这点对于之后的工作来说是非常重要的。（对话和对话在一条轨道上，声音效果和声音效果在同一轨道上，等等）

为了让这一过程更快更顺，这些轨道应该在剪辑软件创建OMF/AAF之前就对内容打好标签或是组织好内容。比起合并不同种类的片段让轨道数量减少，发送一个有许多轨道数量但整齐规划的文件显然是更好的选择。

组织声音轨道的种类主要有：

* VO(Voice Over) | 旁白/解说词

* Dialog | 对话

* Production Effects (anything recorded from set other than principal dialog) | 姑且可以理解为同期声or画外音or底噪之类的吧（英文解释其实说的更清楚一些）

* Sound Effects (separate from Production Effects, anything that was added in post) | 效果音

* Music | 音乐

如果你在剪辑中混合处理了单声道和立体声道的文件，这会帮助你管理它们。为了应对这种情况，所有单声道的音效应该放在同一轨道上，并放在立体音效轨道的上方。

一条特别的关于对话轨道的备注——最好将录制时所有的不同麦克风录制的轨道垂直打组在一起。这样一来，你的对话剪辑师可以轻松的为每个场景选择最好声音质量的那个麦克风通道。一个好的最简的通道设计最好包含一个挑杆麦克风和一个领夹麦克风。一个进阶的轨道设计需要包括Mix Left, Mix Right, Boom, Lav 1, Lav 2, etc.（……请你们自己去查资料吧）

编辑对话

Dialog Edit

对话片段通常会被忽略，但却是在后期处理流程中极为重要的一步。当这一步正确完成了之后，对话轨道听起来应该是完全自然的而且感觉未经修饰剪辑的。

当轨道管理之后，编辑对话通常是第一项任务，因为它在大多数情况下，是许多项目的中至关重要的锚点。这些是处理流程的快速预览：

* 尽可能从每个场景中的每个麦克风中找到最干净的房间声（Room Tone）（其实就是一条“干净”的底噪）。

* 用这条底噪去衔接对话片段与片段之间的剪辑，用底噪填“空”并使用十分缓慢的淡入淡出（特别是当房间声非常吵闹和大声这就十分重要了）。

* 消除任何片段碎语以及呼吸声。

* 消除任何“frankenbites”（无法重新录制的情况下，有时创造一个“不完整”的句子就显得必要了，虽然它总是不那么理想）

（更多有关「Frankenbiting」的内容请阅读《Frankenbites/Franken-Edits｜拼凑的怪异语句/奇怪的剪辑》）

（更多有关「Room Tone」的内容请翻阅 Frame IO Workflow Blog）

认真听对话剪辑中语句与语句之间留空的部分和听语句中每个字的衔接是一样重要的。理想情况下，听众是不会注意到任何底噪（环境音）的变化或者是剪辑带来的顿挫感。不当的对话编辑，会在后期制作中让观众察觉到语气或者节奏感的顿挫，这会影响观众并容易对影片产生负面的评价。

（更多有关「How to Choose Dialog Recordings」的内容请翻阅 Frame IO Workflow Blog）

编辑对话的最终目标就是让结果看起来是一段无缝衔接且听起来自然的对话。通常，录制的对话会被一段段剪开再拼合到一起，最后再当剪辑画面的时候再将对话分开。这么做的理由既是为了剪辑的同时也兼顾了创造性的需求。对话剪辑的目标是为了让被剪开的片段顺滑的过渡以至于让听众难以分辨，同时让听者听到你想让他们听到的内容。

音乐剪辑

Music Edit

音乐剪辑的处理是能让每首歌曲或者音乐能够顺滑的淡入、淡出和过渡。如果音乐是为了项目特别创造的，那么这一步简单的检查一下就行了。

需要记住的是，通常画面会比声音更具延展性。声音会被大量的因素影响，甚至会注意到一个没有正确处理好的小剪辑细节。速度、节奏、乐器的减弱（instrument decay）和延音，这些只是能够影响到音乐还有整个项目的节奏的几个因素。

为了让编辑的音乐顺滑，你应该沉浸并深度体会对话的部分。

通常来说，根据音乐对画面进行编辑并在适当的时候对画面进行轻微的修改，会比根据画面强行配乐会更好。画面剪辑师通常会使用一条Demo的音乐来开始剪辑。所以，在后期声音制作之前，很多这些潜在的问题都会被解决。任何情况下，对于画面部分保持一种开放的心态，这样你的声音剪辑师在需要时可以更好的和你进行合作。

粗混

Rough Mix

一旦对话和声音剪辑完成了，通常画面剪辑师会在这些元素上再加上一些声音效果和其他任何一些被加工好了的声音，做一些粗混音的工作。这一步会帮助声音设计师看到和听到这个项目中剪辑师做的效果，尽管这还是一个非常简陋的版本。这也会帮助声音设计做出更能帮助故事叙述的声音设计决策。

声音设计

Sound Design

声音设计是指除音乐和处理过的声音之外，任何用于加强声音而制作产生的声音元素。声音设计可以被划分为一下几种类型。

* Hard Effects — 那些通常不会被录制到画面里的声音（爆炸、汽车发动引擎、关门）。

* Foley — 角色和物体接触的声音（脚步声、衣物摩擦声、道具声）。

* Backgrounds — 环境声（大自然的声音、城市的声音、办公室的窃窃私语）

* Emotional Effects* — 通常不是现实场景中有的声音，用来加强情绪的抽象声效。

*Emotional Effects是最难解释的，并且通常很容易和音乐搞混淆。许多音乐中都会将这部分的声音（Emotional Effects）纳入到创作之中（钹的敲击、蜂鸣声、其他）/ (cymbal swells, eerie drones, etc)。理解这类声音效果的另一种方式就是不去深究字面上的意思【确实很难翻译】。Trailer style booms和Whooshes都是属于这种类型的经典例子。任何不符合真实场景的，但却更能加强情绪的声音效果，都是属于这一种类的声音设计。

最终混音

Final Mix

Final Mix就是把所有的元素（对话、解说、音乐、声音效果）都放入已经处理好的声音轨道中。这是一个复杂且精密的过程，但是还是有几个基本原则需要遵守：

平衡好不同元素的声音轨道（通过平衡元素的音量和高低音的比例）

在混音中建立动态可变的高峰低谷（这可以让项目更具感染力和节奏感）

对于平移的物体，可以在立体声/环绕声中体现，从这一端到另一端。（在这类后期声音制作中，这可以是指让声音跟着画面的内容而营造真实感）

混音格式

Mixing Formats

取决于最终交付的格式，这有几种混音格式可以被采用。立体声和5.1是当下最常见的格式，但是VR和AR的格式正在慢慢崛起。

以下是对几种比较重要和流行的格式的分析：

Mono （单声道） —— 这种格式通常用于旁白和对话一类。一些公共广播节目仍然要求需要Mono，最好确保你的混音格式能够适配手机、智能音响和一些其他的移动设备。

Stereo（立体声） —— 左声道和右声道。除了剧场之外，是最常用的混音格式。绝大多数的网路与广播内容都是Stereo的格式。所有的混音场所都会基于Stereo而设计的。

5.1 Mix（6声道）—— 左前、中、右前、左环、右环、低音。“5”指的是左声道、中声道、右声道、左环、右环，“.1”指的是分离的低音效果声道。“5.1”通常被用于电影节、广播节目和其他众多的流媒体平台。所有的后期混音制作场所都会基于“5.1”的方式去设计工作的。这种格式已经出现有一段时间了，但依然很具沉浸感和十分流行的环绕声格式。

7.1 Mix（8声道）—— 左前(Left)、中(Center)、右前(Right)、左声道(Left Side/Ls)、右声道(Right Side/Rs)、左后(Left Rear/Lr)、右后(Right Rear/Rr)、低音声道(Low Frequency Effects/LFE)。这个格式最常用于现代电影院。许多，但不是所有的声音制作工厂会基于7.1展开工作。这种格式和5.1格式之间有许多的共同之处，但是7.1为观众在周围和后方提供了更多的分离的环绕声。

VR（使用耳机来回放） —— 这是一个正在不断发展的新领域。本质上，虚拟现实的混音提供的是一个场景的声音。VR视频播放器使用的是独特的编解码器，这种编解码器是为了能让观看者看到哪就听到哪的声音（译者注：像是Apple的空间音频），而量身定做的。举个例子，如果一只狗在观看者的右边吠叫，那么声音就会从右边传来。当观众面对这只狗，这个声音就会从正面传来。这种声音的工作方式，有点像是你在玩Video Games。

制作VR内容的方式并不只有一种。有一些方法，通过使用球形视频和4条音轨来实现的，有一些方法是使用游戏引擎中开发的内置特殊程序。主要的VR平台有Facebook、YouTube、Oculus还有Vive。

Dolby Atom/DTS:X —— 这是下一代的空间混音格式，整个声音被认为是在3D空间中的不同的移动物体各自发声的，而不是仅在预先设置好的几个扬声器里平移。这能让不同的数量的音响阵列（2到64声道）回放效果更加一致。目前，这种制作格式通常会在大制作、宽荧幕电影、和特殊需求的影院（或者家庭剧场）中设计从而能正常回放。混音工厂需要特殊的系统才能正常制作Dolby Atoms，所以如果你的项目需要这种特殊格式，一定要确认制作公司有能力制作这种格式的混音。

我应该选择哪种格式？ —— 不是所有的项目都需要尽可能多的音响数量。立体声通常是默认的格式。许多电影用的是立体声但听着也很不错，特别是他们主要在互联网上进行分发和传播。如果你计划在剧院中展出（像是电影节或是大型的流媒体平台），升级到5.1会有助于你的展出。和声音制作公司去谈你的需求。

Review and Revisions

检查与修改

许多工作室提出在工作室里观看，但是线上检查的这种方式变得越来越流行。Frame.io是一款非常棒的线上检查和远程混音工作协助工具。这允许filmmaker可以在Timeline上打上标记写上notes，并且在家就能够交流(streamlining communication)(译者注：具体是怎么一种工作方式建议你们去油管看看演示视频这一部分光靠翻译是比较难翻译出来的)。

交付

Deliverables

根据项目的性质，后期声音制作团队可能需要交付多种格式。当然，最重要的交付工作还是完成混音工作（项目需要时，可以交付多种格式）。Stems/splits（应该指的是交付分开多条声音轨道成多个文件）也是很普遍的需求。将混音的各种元素分开（对话、旁白、音乐、声效）可以让你的项目更具可逆性。

当有特别的需求时让Filmmakers之间充分交流是非常重要的。当工作开始之前，如果后期声音制作团队确切的知道最后需要交付什么格式或者物料，他们就可以为每个项目就规划好工作流程。

声音规格/规范

Audio Specifications (aka Specs)

规范能够确保跨月使用不同程序时，让响度保持一致，防止出现不希望出现的声音问题。这种方式不仅能适应于广播电视节目，也能适用于流媒体平台，尽管两者的技术规范是不一样的。

了解你项目最终会投放的环境，和在这个环境中会有什么样的规范要求是非常重要的。如果忽视了它，那么这个项目就会在准备广播时无法通过QC（质量控制）阶段，从而无法进行投放。这个方案主要适用于广播电视，其中政府会指定投放时候能接受的响度级别（这些规范在每个国家/地区都不一样）。声音制作团队需要知道，各个网络之间也会有一些独特的规范需求。

即使在播放环境外部可控的情况下，像是广播电视，会有几种规格建议可以帮助听众，听的时候觉得更加舒服并且保持一致的音量级别。

测量响度

Measuring Loudness

测量已经完成的混音工作的各个方面，我们有多种的响度工具和插件可以使用。任何混音工作中最常需要仔细检查的两项测量工作，分别是在整个程序中响度的平均值，和最响的部分的响度级别。

能让你快速测量的通用的测量量/工具：

LUFS/LKFS —— 这是感知响度的标准度量单位。这被用于测量整体混音响度的平均值。这被称为Integrated（译者注：一体化的意思） LUFS/LKFS。在以前，LUFS和LKFS还有些许不同，但是今天他们已经是一个意思的了。

True Peak —— 这个测量量是指在混音中最响的部分。

True Peak Limiter —— 一种工具/插件，能让用户限制音频的响度的最大值，音频的响度不能超过这个值。True Peak Limiter有时会让人和「Brick Wall」搞混。简单的来说，True Peak Limiter更加的精细精准一些。

推荐的响度

Loudness Recommendations

以下是一些是基于几种常见的视听环境而推荐的具有普遍性的建议。在说之前，如果你的项目的播放环境，比较特别并且对响度有比较严苛的要求，你最好确认你对此有所了解，并且及时和你的后期声音团队沟通清楚。

Web —— 对于Web来说，最常见的混音要求是-16db(+1db/-1db)的Integrated LUFS/LKFS以及-1db的True Peak。对于Web内容的混音来说，并没有那么严格的要求，但是这一类型的内容应该和别的Web内容符合一致的规范，同时为动态调节和具有吸引力的内容留足调整空间。

Broadcast —— 电视可以说是最严格的控制响度的环境了。在美国，最典型的测量量是，-24db(+1db/-1db)的integrated LUFS/LKFS和-10bd的True Peak（在一些networks中会有更多一些的保留余地，但是这些建议应该能够覆盖所有的基本规范）。不同的国家有不同的规定，所以一定要确认什么样的测量量是符合你的项目的。

有时候networks还会问你要最终混音的一些特殊的物料和版本。你通常可以在网上找到Networks的声音技术规范，或者你可以直接和他们要你需要的信息。

Film —— 对于Film来说，是没有什么响度的标准或者规范的。Film通常是在一个理想的被精确的校准过的房间里进行混音的，这样Filmmakers就可以通过听来调节响度。换句话说，你可以非常自由的使用数字音频提供给你的所有响度范围，只要电影是由工程师以准确的参照系进行混合的（原文：as long as the film is mixed by an engineer with an accurate frame of reference）。记住你最后是要在那里投放电影的，这也是一个技巧。举个实例，很多电影节都有环绕声系统。在这种情况下，知道电影节所要求的/能接受的格式也是很重要的（立体声、5.1环绕声、7.1环绕声、其他）。

最后一条提示。通常来说，film需要多次混音。如果film需要在5.1环绕声的电影节上和线上投放展出，你可能会需要为不同渠道请求不同混音的版本。此外，虽然电影节可以提供5.1环绕声，但他们很少要求这点。你的film可能在立体声的格式下会更好的被展出。这一切就取决于你项目的声音需求（但对于大型的影院分发，环绕声的这种格式还是最普遍的需求）

简单的来说，不同的环境有不同的格式还有响度标准可以选用。和你的声音制作团队提前沟通好需求，会对他们和混音工作的展开起非常大的帮助。

VR —— 目前来看，还没有任何关于VR的标准，但是Web的响度级别对VR来说是一个不错的起点。VR的格式有很多，每个都有自己独特的规范要求。好好阅读有关你使用格式的相关信息是非常重要的。YouTube和Facebook 360是最流行的VR格式（这两个的格式要求都可以在网络上找到）

Stem/Splits以及如何去使用它们

Stem/Splits and how to use them

Stem和Splits是可以相互交换的专业术语（译者注：同义）。他们都是指，在最终混音阶段中，那些从他们各自的原始文件（旁白、对话、音乐、声效、其他）劈开的那些独立片段/元素。Stem/splits对于像是更换语言版本或是未来内容的一些其他工作是非常有帮助的。举个例子，通过使用MDE splits（下文会解释）（译者注：MDE——Music&Dialogue&Effects），剪辑师可以在不重新创建整个混音的前提下，轻松的将英语版本的旁白转换成西班牙语的旁白。明确说明需要什么stem/splits是非常重要的，这样后期声音团队可以交付最好的质量。

以下是一张可以向声音后期请求的列表：

1、Dipped Music —— 指在混音过程中对响度做过自动化调整。Dipped Music是指融入整个混音部分的音乐。

2、Undipped Music —— 指在混音过程中不对响度做自动化调整。在你需要对整个项目重新混音或者做重大调整，或是需要让项目在别的地方进行投放，或是需要加入更多的语言，或是在表达同一件事时需要说的话变少，这些情况下Undipped Music会帮助你很多。

Undipped Music Stem可以让剪辑做国际化的版本时，可以调整给定的不同语言种类的对话长度。

（译者注：关于Dipped/Undipped这个概念，光看翻译或是只看原文内容有些难懂。这里我引用原文以及Frame IO的另一篇关于音频的文章辅助理解这个概念，当然这篇关于音频的文章里面的其他内容也很值得看。总的来说，Dipped/Undipped Music其实是一个非常好懂也不复杂的概念。）

Original：

Dipped Music – Contains any volume automation added to it during the mix. Dipped music represents the music exactly as it is in the full mix.

Undipped Music – Does not contain any volume automation added during the mix. This can be helpful if you need to remix the project later due to major changes, or if the project needs to be repurposed elsewhere or into a language that requires more or less time to say the same thing.

An undipped music stem like this allows for international versions of the edit to be adjusted based on the difference in dialog length for any given language.

Quote：

Page Keywords : Loudness , True Peak Level , Stereo and Surround Sound , Dolby Pro Logic II, LT/RT, and Lo/Ro , Stems(The M&E and the Mix Minus , Dipped and Undipped Stems)

点此访问《5 Broadcast Audio Spec Sheet Term Every Editor Must Understand｜Frame IO》

（译者注：以下是部分内容的截取，更多更详细的内容还请访问原文）

tshaveanidea

ts, tssblog's owner, a.k.a. Lucas

Articles: 86

Frame IO Workflow 07 Sound | 翻译

Like this:

tshaveanidea

Leave a ReplyCancel Reply

Share this:

Like this:

tshaveanidea

Related Posts

色彩管理小指南——FCP接力Davinci Resolve

用EDL解决Conform遇到的几个头疼问题

TB3 Workflow 02 | 飞起来的工作效率 雷电3与Pro Apps

Leave a ReplyCancel Reply

TB3 Workflow 02 | 飞起来的工作效率雷电3与Pro Apps