Curso de ingeniería de sonido Técnicas, arte y secretos del mastering profesional Nivel 3
cetear Centro de Estudios de Tecnologías Artísticas Rioja 1731 -Tel 54-341-426-2666 / 2000 Rosario - Rep. Argentina / E-mail:
[email protected] / Web site: www.cetear.com Ministerio de Educación y Cultura de la Provincia de Santa Fe - Disposiciones Nros. 282/98 - 65/01
Curso de ingeniería de sonido Técnicas, arte y secretos del mastering profesional Nivel 3
cetear Centro de Estudios de Tecnologías Artísticas
Indice Introducción......................7 ¿Cuándo se realiza y cual es el objetivo del Mastering?.................10 ¿Dónde se realiza?.................12 El equipamiento de un estudio de Mastering.................12 ¿Existe un standard de mastering?.................13 ¿Hay una sola manera de masterizar?.................14
Capitulo 1....................15 Comenzando a masterizar: preparando el material..................15 1.1. Análisis de las pistas del master de producción..................16 1.2. Detección y corrección de errores..................17 1.2.1 DC OFFSET.................17 1.2.2. HISS Y HUM.................18 1.2.3. GLITCHES: CLICK´s, CRACKLES y POP´s ................20 1.2.4. CLIP´s ................24
Capítulo 2....................27 Herramientas y procedimientos que se utilizan en el mastering ................27 2.1. Introducción ................28 2.2. Ecualización. ................29 2.3. Procesos dinámicos. ................35 2.4. Control de la imagen estéreo. ................42 2.5. Cortando picos. ................50 2.6. Normalizado..................51 2.7. Maximizado. ................52 2.8. Dither y Noise shaping. ................54
Capítulo 3.....................57 Generando el Master para su replicación. ................57 3.1. Standard de un CD de audio. Red Book. ................58 3.2. Distintos formatos de Masters para enviar a la compañía replicadora. ................60 3.3. Preparación de las pistas..................61 3.4. Play List. Y PQ List ................62 3.5. Información adicional. ................64
Trabajos Prácticos....................65 Análisis de una señal en WaveLab ................75 Generando el master en Wave Lab ................83 Restauración de un archivo de audio digital.................91 Guardar y cargar configuraciones en los plug-ins de Waves ................97 Ayuda básica de WavesLab ...............101 Ejercicios de Teoría...............108 Soporte Teórico ...............115
ISBN Nº 950-673-196-9 CURSO DE INGENIERIA DE SONIDO. NIVEL 3 - CETEAR EDITORA Prohibida la reproducción total o parcial del contenido de esta obra. Copyright 2003. All rights reserved. w w w . c e t e a r . c o m
página
6
Introducción
Después de algunas idas y venidas aquí estamos en el Nivel 3. El desafío en este caso se ha presentado el la asignatura principal de esta etapa, me refiero al Mastering de Audio. A diferencia de los dos primeros niveles donde utilizamos un solo programa en este caso deberemos utilizar además del software principal, el uso de varios plug-ins Contamos en este caso con la experiencia profesional y docente del Lic Gabriel Data, investigador y catedrático universitario, y verdadero experto en temas de audio, quien ha desarrollado el contenido del presente apunte y que acompañará a los estudiantes durante el transcurso del aprendizaje. En esta parte agregaremos también la parte correspondiente a entrenamiento auditivo con el reconocimiento de frecuencias por tercio de octava y una nueva parte teórica donde veremos temas concernientes al audio y registro digital, consolas de mezcla y registro magnético. No dudamos que este nuevo curso, al igual que los anteriores, contribuirá a la formación técnica y artística de todos aquellos que lo realicen. Les envío un saludo cordial.
Mario José de Oyarbide Director de Proyecto
[email protected]
w w w . c e t e a r . c o m
página
7
Dinamica de trabajo La forma de trabajo propuesta abarca tres aspectos: mezcla, entrenamiento auditivo y teoría. El curso está dividido en cinco entregas las cuales serán enviadas por e-mail, mas una ulima entrega correspondiente al examen. Semanalmente los trabajos recibidos serán evaluados, corregidos y devueltos. El alumno enviará dentro de un plazo que no deberá exceder las dos semanas, cada una de las entregas encomendadas, las cuales siempre abarcarán los tres aspectos antes mencionados. Las entregas se efectuarán de la siguiente forma: Entrega
Mastering
Entren Audit.
Teoría
1º Entrega
TP 1
Grupo 1, 2 y 3
Cuestionario 1
2º Entrega
TP 2
Grupo 4
Cuestionario 2
3º Entrega
TP 3
Grupo 5
Cuestionario 3
4º Entrega
TP 4
Grupo 6
Cuestionario 4
Examen
Examen
5º Entrega
TP 5
Examen
Eval. TP 3, 4 y 5
Cada uno de los aspectos que comprende cada entrega será evaluado por el profesor especialista en la materia. El alumno deberá comenzar las entregas dentro del plazo de 120 días de la recepción del material. Vencido dicho plazo, CETeAr que liberado de la obligación de asistencia y/o corrección de los trabajos. La duración total del curso no excederá los 90 días. Si el alumno interrumpiera las entregas, podrá solicitar una reinscripción, la cual le otorgará 90 días adicionales. Después de ese plazo por una segunda reinscripción deberá abonar la suma de $ 50.Al finalizar las cinco entregas el alumno podrá rendir el examen final. El mismo le será evaluado como una entrega más para la parte de mezlca y entrenamiento auditivo. El cuestionario de teoría, será enviado luego de corregidos estos dos últimos. Todos aquellos alumnos que rindan y aprueben dicho examen final recibirán dentro de los 45 días posteriores, su certificado correspondiente al presente nivel.
w w w . c e t e a r . c o m
página
8
Introducción al Mastering.
Introducción Seguramente has escuchado hablar del mastering pero posiblemente no sepas exactamente de que se trata, quizás tengas una idea de ciertos procedimientos que se realizan en esta etapa de la producción musical y de ciertas herramientas que se utilizan en ella. Pues bien, el objetivo de este curso es brindarte el entrenamiento necesario para la realización eficiente de una masterización. ¿Cuándo se realiza y cual es el objetivo del Mastering? El mastering constituye el último paso en el proceso de producción musical, luego de que todo el material musical ha sido mezclado. La producción típica de un CD de música comienza por la etapa de pre-producción, en la cual el/los músicos y el productor deciden cuales canciones se grabarán, se realizan los arreglos musicales, se programan sintetizadores y máquinas de ritmo, etc. Tal etapa se desarrolla habitualmente en salas de ensayo o estudios de bajo costo. Le sigue la producción propiamente dicha, la cual consta de dos momentos claramente definidos: a) Grabación: etapa en la que se registra el material musical, instrumentos de base, voces, coros, solos, etc. b) Mezcla: etapa en la que se ensambla cada canción o registro, se definen los "planos sonoros", la ubicación de los sonidos en la imagen estéreo, la cantidad y tipo de reverberación, efectos, etc., aplicando ecualización a algunos sonidos para balancear su espectro sonoro y compresión para controlar el rango dinámico y así obtener un ensamble adecuado según el género musical de la producción. Todo esto se realiza ya en estudios profesionales y a veces en estudios diferentes o con diferentes ingenieros. Cada vez es más marcada la tendencia a grabar en estudios caseros (o "de proyecto") y mezclar en estudios o con ingenieros profesionales si los proyectos son de bajo presupuesto. Casi todos los artistas y productores tiene en claro éstas etapas y en ellas concentran toda su atención con la salvedad de que (dependiendo del lugar donde tú vivas) muchas veces no se le presta la debida atención a la primera de ellas: la pre-producción, sin tener en cuenta que una mala decisión al principio se proyectará y afectará a la producción completa. Veamos un ejemplo: Estás mezclando una canción, has ecualizado y comprimido los canales necesarios, etc., pero cuando tienes que establecer la relación de la voz solista con el fondo musical notas que ésta queda "tapada" por momentos, o que la letra no es inteligible, seguramente pasarás varias horas tratando de encontrar una solución, si aumentas el nivel de la voz en los pasajes problemáticos, se despegará en otros momentos, entonces comprimirás más drásticamente, o automatizarás el volumen… y a lo mejor lo que sucede es que el arreglo musical está mal hecho. Ahora bien, supongamos que todo está realizado correctamente. Cuando se mezcla una canción se lo hace con toda la atención puesta en ella, sin tener demasiado en cuenta si está equilibrada o no con las demás de la producción, muchas veces ni siquiera se sabe que ubicación tendrá en el CD, puede estar desbalanceada tonalmente con unas (puede tener más presencia de graves o sonar más brillante) y sonar a un volumen diferente con otras. También pueden aparecer ruidos indeseados producto de "Punchs" mal realizados y otros de variada procedencia. Así llegamos a la necesidad de una etapa posterior donde realizar los ajustes necesarios para integrar toda la producción y luego enviarla a replicar: el Mastering. En el masterizado se equilibrará el balance tonal de todas las canciones para que no sea necesario ajustar el ecualizador del sistema de reproducción entre una canción y la otra, se equilibrarán los niveles relativos para que el sonido general sea coherente con las fuentes sonoras presentes y no sea necesario subir o bajar el control de volumen entre canción y canción, se w w w . c e t e a r . c o m
página
11
Introducción eliminarán ruidos y errores digitales de la mezcla y se generará el master para su posterior replicación.
En suma, el objetivo del mastering es que el disco suene profesional. Eso sí, ten en cuenta que en el mastering se pueden arreglar varias cosas pero no se hacen milagros (una mala perfomance musical no tiene arreglo). Por otra parte, como en el mastering se trabaja sobre la mezcla estéreo, será imposible ajustar el nivel individual de los instrumentos y voces (salvo casos que veremos más adelante), si esto fuera necesario, lo correcto es remezclar la canción. ¿Dónde se realiza? El estudio de mastering está especialmente diseñado y dedicado para tal fin, como así también su equipamiento. Basta consultar páginas Web´s de estudios de todo el mundo para darse cuenta que algunos se dedican exclusivamente a masterizar mientras que otros lo ofrecen como servicio separado. En cualquier caso, siempre está en un área distinta de aquella utilizada para grabar y mezclar (o debería estarlo) ya que no es conveniente utilizar el mismo sistema que se utilizó para la mezcla. Ten en cuenta que siempre hay interferencias acústicas producidas por distintas causas, como ser: problemas de diseño del estudio, combs filters producto de reflexiones en la mesa de mezcla y en otros objetos de la sala, tipo de monitoreo (los Yamaha NS-10 son un estándar de monitoreo de mezcla pero no son adecuados en el mastering), etc. Por tales razones, masterizar en el mismo espacio en que se realizó la mezcla haría imposible detectar tales problemas. Además, es conveniente que el ingeniero de mastering sea distinto del ingeniero de mezcla ya que su oído no está condicionado por el trabajo previo de producción. También es cierto que más allá del costo del equipamiento y de diseño, lo principal es que el ingeniero de mastering conozca perfectamente las condiciones de su lugar de trabajo. En el caso de este curso dado que el material ha sido grabado en los estudios de CETeAr, la condición de distinto lugar de trabajo, equipamiento y operador se cumple. Igualmente, sugerimos para los estudios de "Home Recording", que los estudiantes tengan como proyecto próximo implementar un espacio y equipamiento adecuado para realizar el mastering.
El equipo principal de un ingeniero de mastering son sus oídos, su conocimiento técnico y su experiencia musical. El equipamiento de un estudio de Mastering Los estudios profesionales utilizan tanto tecnología digital como analógica para masterizar. · Conversores A/D - D/A profesionales. El hardware de Pro Tools (Digidesign) tiene muy buenos conversores, pero no es raro encontrar otros de mayor calidad (Apogee, por ejemplo). · Computadora: habitualmente se utiliza Apple Macintosh. · Software´s para edición de audio y creación de Play List. Es común que se utilice "Pro Tools" para la edición y "MasterList CD" para la generación del master. · Outboards: Ecualizadores paramétricos, Compresores, etc., preferentemente valvulares. · Monitores de respuesta lo más plana posible. Preferentemente de campo medio · Metering y análisis de señal: Vúmetros analógicos, analizadores de espectro, etc. · Plug ins: solo para ciertos procesos que no podrían ser realizados de otra forma. w w w . c e t e a r . c o m
página
12
Introducción
En estudios de menor costo es habitual que el mastering se realice enteramente en la computadora, utilizando plug ins de procesadores. En éstos casos es fundamental contar con buenos conversores, un buen sistema de monitoreo y un software de edición con gran definición en el tratamiento del audio digital. En nuestro caso utilizaremos WaveLab 4.0 para la realización de los trabajos del curso. La razón principal de la elección de éste software radica en la gran variedad de herramientas disponibles, la resolución interna (32 bits) que asegura una calidad de audio superior y la posibilidad de integrar plug ins DirectX y VST en un mismo entorno. En el archivo "Ayuda básica de WaveLab 4" ([CD]\Documentos) encontrarás una descripción de las funciones y características operativas elementales de WaveLab 4.0. ¿Existe un standard de mastering? Técnicamente se puede hablar de un standard pero musicalmente no. En realidad lo estandarizado es el soporte final, que en el caso de un CD audio se describe como Red Book. En él, el material registrado debe tener el formato PCM (Pulse Code Modulation) estéreo con una velocidad de muestreo de 44.1 Khz., una resolución de 16 bits y un máximo de 99 tracks. El nivel límite (0 dBFS) no puede ser superado y por lo tanto solo unas pocas muestras consecutivas pueden tener éste nivel sin producir saturación digital audible. Pero en cuanto a balance tonal y sonoridad no hay dos discos exactamente iguales: Dependiendo del estilo y género musical, de la combinación vocal - instrumental, etc., un CD puede sonar más brillante que otro, o con volumen más alto. Si bien el balance tonal de los sistemas de audio se calibran utilizando ruido rosa, esto sirve para asegurarse que no se introducirán errores producto de respuestas en frecuencia erróneas pero no significa que el material musical debe sonar "plano" ya que (sobre todo en los instrumentos acústicos) existen siempre zonas reforzadas del espectro sonoro (formantes).
El sistema de reproducción debe tener una respuesta plana, pero la música (y los sonidos de la naturaleza) no. En la carpeta "Ejemplos \ Piano" del CD del curso encontrarás cuatro fragmentos de solos de piano tomados de CD´s comerciales. ¿El piano es igualmente sonoro en todos ellos? ¿En cual se perciben con mayor presencia los golpes de los martillos? ¿En cual el sonido es más opaco? ¿Está relacionado esto con el estilo musical? Realiza un análisis espectral (FFT) para visualizar las diferencias de ecualización. ¿Se corresponde lo que ves con lo que determinaste auditivamente? Escucha CD´s de diferentes estilos y géneros musicales, encontrarás que distintos pueden sonar dos producciones diferentes. Evidentemente, un CD de Tango tiene una forma de producción muy distinta a uno Pop. Por ejemplo, en el Tango es muy importante el rango dinámico (como en la música clásica) pero no en el Pop, también pueden encontrarse diferencias muy marcadas en el tratamiento de los graves en ambos estilos, por ejemplo, en el plano y definición del bajo. Pero aún dentro del mismo estilo dos CD´s pueden sonar muy distintos. Es muy importante, entonces, desarrollar un criterio de trabajo apoyado por la experiencia auditiva sistemática de distintos estilos y géneros musicales. w w w . c e t e a r . c o m
página
13
Introducción
¿Hay una sola manera de masterizar? Como en muchos aspectos de la vida cotidiana, no hay recetas ni fórmulas mágicas para resolver todos los aspectos que se nos presentan en una masterización. El resultado final depende de un cúmulos de factores interrelacionados que van desde el material que recibas (sonido y eficacia de la mezcla, perfomance de los instrumentista, etc.), tu entrenamiento y experiencia, el equipamiento que utilices, hasta los recursos que puedas experimentar para solucionar problemas concretos que se te presenten. El primer paso es tomar contacto con toda la producción, sin preconceptos. Escucha que dicen los músicos y productores de su material. Trata de captar la esencia de la música, sus características rítmicas, melódicas y texturales, su expresividad. La meta principal de tu trabajo es potenciar aquellos rasgos de la música que hagan de cada producción un hecho artístico único. No temas comenzar de nuevo si el camino elegido no da los resultados esperados. Entrena tus oídos, escucha música de todos los estilos con oído crítico, estudia, experimenta…
Amplía tus conocimientos y recursos técnicos, desarrolla tu sensibilidad artística.
w w w . c e t e a r . c o m
página
14
Capitulo 1. Comenzando a masterizar: preparando el material.
Comenzando a masterizar 1.1. Análisis de las pistas del master de producción. El master de producción puede sernos entregado en diferente tipo de soportes: DAT, CD, Mini Disk, Cinta Digital, Cinta Analógica o incluso en Cassette. Cada vez es más habitual el uso del CD como soporte. Si se tiene la posibilidad de ponerse de acuerdo con el ingeniero de mezcla es deseable que las pistas no estén normalizadas más allá de -3 dBFS y que no estén cortadas al principio y al final, sin fade in ni fade out. La primera condición nos asegurará que no se presentarán saturaciones digitales no detectadas en el momento de la mezcla. La segunda, nos permitirá contar con segmentos para muestreo de ruidos y corrección de DC Offset que podríamos necesitar eliminar en la masterización. Un par de segundos son suficientes para tal fin. Además, si bien se pueden importar directamente los tracks de audio para ser editados en la computadora, es preferible que nos entreguen un CD-Rom con las mezclas en formato WAV (si masterizamos en PC) o Sound Designer II (si lo hacemos en Mac). La otra razón para solicitar el master de producción de ésta manera se basa en que un CD Audio solo puede tener 44.1 Khz. de velocidad de muestreo y 16 bits de resolución, y es deseable que nos entreguen el material en 24 bits y, de ser posible, 48 Khz. Hasta hace algunos años esto solo era posible en estudios profesionales pero actualmente contamos con una amplia gama de placas de audio que trabajan con éstas especificaciones. Todo lo dicho es aplicable si el masterizado se realiza enteramente en computadora, utilizando plug-ins como herramientas, pero en estudios de masterización profesionales se prefiere volcar las mezclas a la computadora pasando la señal por preamplificadores valvulares y digitalizando con conversores de alta perfomance (como los Apogee), que permiten convertir formatos digitales en tiempo real y agregar Dither (procedimiento utilizado para corregir los errores de cuantización introducidos al digitalizar señales con un bajo nivel) en el momento de la conversión. Algunos incluso utilizan ecualizadores y compresores analógicos también de alta perfomance y solo utilizan la computadora para armar el master para su replicación. En nuestro trabajo realizaremos toda la masterización en la computadora, pero es importante que tengas en cuenta que hay otras posibilidades y estrategias. En mi caso, gran parte de las masterizaciones que realicé las hice con ProTools III en una Power Mac 8500. Este sistema me permitió experimentar distintas estrategias de masterizado. Ya que es un sistema con DSP propio de forma tal que la latencia del sistema es mínima, lo cual me permite enviar la señal a un compresor valvular (como el Drawmer 1960) utilizado como insert en un track auxiliar y así hacer el render de la señal aplicando tanto procesadores internos como externos. Otras veces digitalicé las mezclas utilizando el mismo Drawmer como preamplificador valvular, sin comprimir o haciéndolo lo menos posible. Este procedimiento lo utilizo si las mezclas me son entregadas en DAT o Cinta. Lamentablemente éste sistema es de 16 bits, por lo que hay que tener mucho cuidado con los errores de cuantización, y no es deseable que la señal sea convertida de analógica a digital y viceversa muchas veces con tan baja resolución. Como dijimos antes, la mayoría de los sistemas de audio actuales trabajan en 24 bits en la actualidad, y los mejores programas de edición (como WaveLab) lo hacen internamente hasta en 32 bits punto flotante, minimizando así los errores de cuantización introducidos principalmente por los plug-ins y otros procesos digitales. Entonces, antes de tocar cualquier parámetro de los procesadores escucha el material que vas a masterizar, hazlo tratando de captar la esencia de la música, determina su género y estilo, habla w w w . c e t e a r . c o m
página
16
Comenzando a masterizar con los músicos y/o productores. Toma contacto artístico con el material y lograrás que cada masterización sea única. Recuerda que el oyente debe captar la música y la estética de la producción, no los procedimientos técnicos aplicados. Posteriormente, determina auditivamente las posibles deficiencias que puedan aparecer en cada obra o canción, frecuencias que sobresalen o que faltan, el tipo y cantidad de compresión aplicada a toda la mezcla, la coherencia de la imagen estéreo, el grado de transparencia de la textura musical focalizando la atención en el relieve de las melodías y en los instrumentos solistas, luego en la textura acompañante y finalmente en la integración de todos éstos aspectos. Complementa el análisis auditivo con herramientas de diagnóstico como analizadores de espectro, Vúmetros, medidores de correlación de fase y medidores de bits. Escucha atentamente cada uno de los archivos almacenados en la carpeta "Mezclas" del CD. Realizaremos la mayoría de nuestras prácticas sobre éstas producciones que, intentaremos integrar en un master de CD Audio. En la carpeta "Documentos" del CD del curso encontrarás una planilla de masterización, la cual puedes imprimir o llenar directamente en la computadora En la carpeta "Trabajos Prácticos" encontrarás planillas de las mezclas del curso para completarlas. En el archivo "Análisis de una señal de audio digital" que se encuentra en la carpeta "Documentos" del CD del curso se describen todos los procedimientos necesarios para el uso de las herramientas de análisis de WaveLab, las cuales necesitarás para completar las planillas de masterización para la realización de los trabajos prácticos. 1.2. Detección y corrección de errores. Varios son los errores o ruidos no deseados que pueden presentarse en el master de producción y cada uno de ellos importa una herramienta y procedimiento específico para su corrección. 1.2.1 DC OFFSET Este error de origen eléctrico puede presentarse tanto en entornos analógicos como digitales por lo que es difícil de encontrar la fuente del problema. Es producido por errores de calibración de amplificadores operacionales y, si bien suele estar presente en cualquier dispositivo que contenga tal tipo de amplificadores, su acción es notable cuando se produce por errores en canales o master de consolas de mezcla. Una traducción aproximada sería "corrimiento de componente de continua". Puedes visualizarlo en tu editor de audio en las regiones de silencio (típicamente antes de que empiece y después que termine la canción). En esos lugares deberías ver una línea coincidente con el eje central del canal de audio o una señal de bajo nivel centrada en el eje. Observa la Figura 1. Se ve que la forma de onda está desplazado hacia arriba del eje.
w w w . c e t e a r . c o m
página
17
Comenzando a masterizar
Figura 1. Comparación de una señal sin y con DC Offset.
(CD: Ejemplos \ Errores)
Si el corrimiento es muy notable será necesario eliminarlo. No porque sea audible de por sí, ya que este corrimiento es asimilable a sumar una frecuencia de 0 Hz, sino porque puede causar click digital al comienzo y final de la canción en el CD de audio, restar claridad al sonido general, o impedir alcanzar un volumen adecuado en el mastering al estar los valores de pico más cercanos del 0 dBFS. Para eliminarlo se pueden seguir dos procedimientos: a) Manualmente, seleccionando una porción previa al comienzo de la canción, medir el DC Offset en el editor de audio, seleccionar todo y corregir con la función "eliminar DC Offset" introduciendo el valor medido con el signo contrario. Este procedimiento debe ser realizado por canal. b) Automáticamente, seleccionando todo el contenido de la canción y corregir con la función "eliminar DC Offset". Para corregir el error el software suma todos los valores de tensión y mide como DC Offset el resultado de ésta suma. Esto, que puede ser útil en la mayoría de las situaciones, tiene sus limitaciones, ya que deberíamos asumir que en una mezcla de una canción debe haber un equilibrio entre los semiciclos positivos y negativos, lo cual es cierto en la gran mayoría de los casos. 1.2.2. HISS Y HUM Diversas son las fuentes de ruido que pueden afectar una grabación o mezcla. En general, pueden clasificarse en acústicos, eléctricos o electrónicos y digitales. Dentro de los primeros encontramos el ruido ambiente, el cual posee fuentes múltiples, como ser, pasos, ruido de objetos (como llaves que el músico olvidó sacarse ante de grabar, aunque parezca increíble), etc. Dependen exclusivamente del entorno de trabajo y deben ser cuidadosamente tratados en el estudio o ámbito de grabación ya que son difíciles o imposibles de eliminar posteriormente. De los segundos, dos de los más comunes, introducidos por interferencia entre equipos y defectos en conexiones internas o cables son: "Hiss": denominación utilizada para el ruido vulgarmente conocido como "soplido", característico en los cassettes y grabadores de cinta analógicos aunque también puede producirse tanto en w w w . c e t e a r . c o m
página
18
Comenzando a masterizar consolas como efectos, procesadores y otros dispositivos del estudio. Presenta un espectro continuo, con componentes en todo el rango de frecuencias o en una parte amplia de él. La Figura 2 muestra la forma de onda de tal tipo de ruido. Nótese la naturaleza aleatoria de la misma en la zona ampliada. Ambas figuras corresponden al archivo "Serenata - Violín - Oregon" de la carpeta "Errores" del CD, el cual fue tomado desde un cassette.
Figura 2. Comparación de una señal sin y con Hiss.
(CD: Ejemplos \ Errores)
"Hum": denominación del ruido introducido por defecto en las conexiones de masa de cables y equipamientos. También conocido como "ruido de línea". A diferencia del anterior, su espectro es discreto, presentando una frecuencia fundamental y una serie de armónicos cuyas frecuencias son múltiplos enteros de aquella. Su forma de onda es periódica, como se ve en la figura siguiente.
Figura 3. Hum y detalle de la forma de onda.
(CD: Ejemplos \ Errores) w w w . c e t e a r . c o m
página
19
Comenzando a masterizar La frecuencia fundamental de éste tipo de ruido depende de la de distribución domiciliaria de energía, según el país donde residas puede ser de 50 Hz. o 60 Hz. Otros ruidos, como los inducidos por otros equipos (como el aire acondicionado) pueden ser asimilados a uno u otro según su naturaleza y componente espectral. En suma, se trata de ruidos de régimen permanente, los cuales serán notables en pasajes de silencio o de baja intensidad de la música. Obviamente lo ideal es tratarlos y eliminarlos en origen, pero a veces nos vemos en la necesidad de corregirlos o al menos minimizarlos en la masterización. Al aumentar el volumen luego de aplicar compresión a al normalizar la dinámica de una canción, se pondrán de manifiesto todos los ruidos que son poco notables si la mezcla tiene un volumen final bajo. De allí que conviene volcar las mezclas a la computadora con un volumen relativamente alto (con mucho cuidado de no introducir saturaciones digitales) si se lo hace desde una fuente analógica, o normalizarlas posteriormente si se lo hace digitalmente. De ésta manera nos encontraremos casi en las peores condiciones y por lo tanto sabremos exactamente que tipo y cuanto de ruido deberemos reducir. El procedimiento utilizado para reducirlos es: a) Seleccionar una porción donde solo se presente el ruido que se quiere eliminar. b) Realizar un análisis espectral de la selección para determinar la banda de frecuencia donde el ruido es más notable1. c) Con un software especialmente dedicado a la reducción de éste tipo de ruido (como los plug ins SF Noise reduction de Sonic Foundry o el Waves X-Noise de Waves), analizar el ruido presente en la selección y configurar los parámetros para reducirlo. d) Reducir el ruido al mismo tiempo que se escucha toda la canción (en tiempo real) cuidando de no alterar el sonido que se desea conservar, o de hacerlo lo menos posible2. Los programas reductores de ruido (como el SFNoise Reduction de Sonic Foundry) tienen controles especiales que permiten especificar el monto de reducción (desde 0 hasta -100 dB) como así también la forma en que el algoritmo de reducción responderá a los cambios del ruido en el tiempo (Attack y Release), permitiéndonos escuchar tanto el sonido resultante como aquel que se elimina. Pero éste procedimiento no es "aséptico", introduce como residuo unos sonidos muy desagradables llamados "artifacts" que serán notables en grandes montos de reducción, sobre todo en los transientes de ataque de instrumentos como piano, guitarra y percusión. Por esto es mejor realizar pequeñas reducciones sucesivas (de alrededor de 6 dB) que una sola muy agresiva. Las herramientas aplicables difieren para ambos tipo de ruido: para eliminar el "hiss" se utilizan reductores basados en Transformada Rápida de Fourier (FFT) que permiten evaluar sonidos que evolucionan en el tiempo, mientras que para el "Hum" pueden usarse ecualizadores paramétricos de banda muy estrecha o herramientas especialmente diseñadas. 1.2.3. GLITCHES: CLICK´s, CRACKLES y POP´s Denominación que reciben los ruidos impulsivos que puedan haber sido introducidos por problemas de conversión analógica a digital o por procedimientos erróneos en la grabación. Los Click´s son ruidos digitales que se manifiestan como una discontinuidad o un cambio muy abrupto en la pendiente de la forma de onda. Tres son las causas operativas principales en la generación de éste tipo de ruido: a) Al cortar una porción de audio sin observar la coherencia entre la pendiente de 1 En el archivo "Análisis de una señal de audio" de la carpeta "Docimentos" se describe como realizar éste tipo de análisis. 2 Consulta el archivo "Restauración de un archivo de audio digital" de la carpeta "Documentos" del CD del curso para obtener una guía sobre como utilizar el reductor de ruido "Waves X-Noise". w w w . c e t e a r . c o m
página
20
Comenzando a masterizar entrada y la de salida en los momentos inmediatamente anterior y posterior a la región que se quiere cortar. Si previo al punto de inicio del corte la forma de onda presenta una pendiente ascendente, debe elegirse como extremo opuesto un punto donde el valor de muestra (sample) sea similar y con pendiente también ascendente, caso contrario se introducirá un click. Por éste motivo conviene elegir puntos donde la forma de onda cruce el eje central (zero crossing), Pero si se cortan varios canales a la vez, será difícil encontrar un lugar donde todas las ondas pasen simultáneamente por el eje y con la misma pendiente. En éste caso, será necesario realizar un crossfade de muy corta duración (alrededor de 10 ms) entre las porciones de audio resultantes. Debe tenerse mucho cuidado en no cortar los canales por separado en una pista estéreo pues se producirá un corrimiento de fase. En la figura se observa un click típico introducido por corte.
Figura 4. Comparación de una señal sin y con click por corte.
(CD: Ejemplos \ Errores)
Figura 5. Comparación de una señal sin y con click por mute.
(CD: Ejemplos \ Errores) w w w . c e t e a r . c o m
página
21
Comenzando a masterizar b) Si se eliminan porciones de audio en un track del multipista, se corre el riesgo de producir click´s ya que la onda se truncará abruptamente siendo precedida o antecedida por silencio digital. Siempre se deben realizar fades (in o out según corresponda) en las regiones que han sido editadas de ésta manera. Lo mismo ocurre si para eliminar un ruido en una pista (un golpe de la púa contra los micrófonos de una guitarra eléctrica p. ej.) se borra la zona problemática, es muy probable que se produzca un click aunque ésta sea de muy corta duración (5 ms). Esto puede ser observado en la Figura 5 (en la página anterior). c) Al realizar Punch´s en sistemas de grabación digitales. Por las mismas razones que explicamos previamente suelen producirse click´s ya que es imposible de prever si habrá similitud en valores de muestras consecutivos e igualdad de dirección de pendiente en las formas de onda. Algunos sistemas previenen éste problema realizando automáticamente crossfades muy cortos en la entrada y en la salida (como en los ADAT´s) pero muchas workstations no, y son la causa principal de errores de éste tipo. d) Otro caso típico de Click´s lo encontramos en las grabaciones de vinilo, conocidos como "ruido de púa", el que puede visualizarse en la figura siguiente.
Figura 6.Comparación de una señal sin y con Ruido de púa en una grabación de vinilo.
(CD: Ejemplos \ Errores)
e) Además, pueden producirse click´s por problemas de sincronismo entre dos dispositivos conectados digitalmente, los cuales son similares a los mostrados en la figura 8. Para corregirlos (cualquiera sea la causa de su generación) se pueden tomar varios caminos: 1. Algunos programas de edición (como WaveLab) incorporan procesos de restauración que eliminan estos problemas de varias maneras. En este caso debe seleccionarse la zona lo más cercana posible al click y elegir el método adecuado, que va desde la interpolación de datos hasta la predicción de forma de onda. 2. Cortar el período donde se produce el click. Para ello deben tomarse los recaudos que se detallaron anteriormente más el cuidado de no alterar el "tempo" de la canción. 3. Utilizar un programa especialmente dedicado a tal tipo de restauración, como DeClicker de Steinberg. 4. Si nada de esto funciona, no queda más remedio que dibujar la forma de onda con la herramienta que todos los programas de edición incorporan: el lápiz. w w w . c e t e a r . c o m
página
22
Comenzando a masterizar Es muy probable que sean necesarios varios de éstos procedimientos para eliminarlos totalmente. Cuando varios Click´s se encuentran muy cercanos entre sí generan un Crackle. Para detectarlos y reducirlos, a veces es necesario utilizar programas especialmente desarrollados (como X-Crackle de Waves). Los Pop´s también se manifiestan como alteraciones en la forma de onda, pero no como discontinuidad de la misma; difieren de los anteriores en que su tiempo de evolución es de varios milisegundos y por lo tanto son más difíciles de eliminar Puedes observarlo en la Figura siguiente.
Figura 7. Comparación de una señal sin y con Pop.
(CD: Ejemplos \ Errores)
Suelen aparecer por efecto de proximidad de los cantantes al micrófono, situación que enfatiza las "P" de las palabras, aunque también pueden provenir de otras fuentes. Para eliminarlos se pueden seguir los mismos procedimientos que detallamos para los click´s. Los programas de restauración, incluso, suelen tener controles para especificar la forma (shape) del ruido, especificándose la duración de la perturbación a la que debe responder el algoritmo de reducción. Si bien los programas de edición permiten detectar automáticamente tanto click´s como pop´s, a veces reportan ruidos que no son tales y otras no lo hacen con los que sí lo son. Por ello, la única manera segura de detectarlos es escuchándolos. Un "click" se puede asimilar al ruido de púa en los discos de vinilo y LP´s, mientras que un "pop" se percibe como un golpe explosivo en el grave. Puedes encontrar los archivos de audio correspondientes a los ejemplos de la figura anterior en la carpeta "Ejemplos\Errores\Pops" del CD del curso. En el archivo "Pop.wav" se perciben claramente 2 pops Para corregirlos se seleccionaron cada uno de ellos y se aplicó una atenuación de la ganancia de 6 dB en el primero y de 12 dB en el segundo (archivo "Pop corregido por atenuación.wav". El ejemplo "Sin Pop.wav" fue grabado con un filtro anti Pop,quedando en claro, entonces, que lo w w w . c e t e a r . c o m
página
23
Comenzando a masterizar ideal es evitar que se introduzcan ruidos antes que intentar corregirlos después. Muchas veces se intenta reducir éstos ruidos aplicando ecualizadores (en general, pasa altos) o cortes de grave en el preamplificador que en realidad son muy poco efectivos pues,si bien eliminan la componente principal (grave) del ruido, deja intactas las componentes superiores (archivo "Pop corregido por filtrado.wav". El resultado final es un remanente muy molesto del ruido. Encontrarás ejemplos de todos los ruidos y errores descritos hasta el momento en el CD del curso en [CD]:\Ejemplos \ Errores. Restaura grabaciones de vinilo y cassettes como entrenamiento para la detección y eliminación de todos éstos ruidos, reduciendo el ruido de superficie (fritura) y eliminando los de púa en los primeros, y reduciendo el soplido característico en los segundos. La empresa Waves ha desarrollado un pack de plug-ins de restauración que contiene todas las herramientas necesarias y son de las mejores que se encuentran disponibles actualmente. El pack (denominado "Waves Restorer") incluye: "Waves X-Click" y "Waves X-Crackle" para eliminar click´s, pop´s y crackles, "Waves X- Noise" para reducir el "hiss", y "Waves X-Hum" para el ruido de línea, DC Offset y ruidos de baja frecuencia. Estos plug ins están incluidos en la versión 4.0 (vienen en versión DirectX y RTAS). Consulta el archivo “Restauración de un archivo de audio digital (CD: Documentos)" para obtener una referencia sobre como utilizar los programas de restauración de "Waves". 1.2.4. CLIP´s Como sabes, los sistemas digitales tienen un rango dinámico que dependen de la resolución en la que trabajes (96 dB para 16 bits y 144 dB para 24 bits) pero en ningún caso se puede superar un determinado nivel conocido como 0 dBFS (dB full scale) ya que los valores de muestra son limitados, más allá de la resolución que se utilice (65536 valores en 16 bits y 16777216 en 24 bits). A diferencia de la que ocurre en sistemas analógicos, en los cuales hay un margen por sobre el 0 dB antes de que se produzca saturación (margen conocido como "Headroom" del sistema), en los sistemas digitales se produce saturación inmediatamente que se "supera" el valor máximo y ésta tiene un sonido muy desagradable. Un solo valor de 0 dbFS no producirá saturación digital, pero varios consecutivos en ese nivel sí lo hará. El resultado de la saturación digital se puede observarse en la figura siguiente.
Figura 8. Saturación digital w w w . c e t e a r . c o m
página
24
Comenzando a masterizar Para detectarlos, además de tu oído, puedes utilizar la utilidad que los editores de audio incluyen en las herramientas de análisis, la cual busca muestras consecutivas de igual valor para un nivel especificado por el usuario. Pero eliminarlos no es tan sencillo, se necesitará "redibujar" la onda en la porción que ha sido truncada por la saturación digital. La mayoría de las veces esto no es posible y por lo tanto, si no se puede copiar la región saturada de otro lado, la mezcla es inservible. Como ejercitación se realizará el trabajo práctico nro 1 que será descripto más adelante Ejercitación: Realizar el Trabajo Práctico 1 Existe otro tipo de error producto de excesivos procesos de transformación de una señal digital (uso de plug-ins, normalizado, etc.), o por truncamiento de los datos cuando se realizan conversiones de la resolución (de 24 bits a 16 bits p. ej.). Tal error se denomina "error de cuantización" y de su corrección nos ocuparemos en el apartado 2.7.
w w w . c e t e a r . c o m
página
25
w w w . c e t e a r . c o m
página
26
Capítulo 2. Herramientas y procedimientos que se utilizan en el mastering.
Herramientas y procedimientos que se utilizan en el mastering 2.1. Introducción Como ya dijimos, uno de los objetivos del mastering es obtener un sonido coherente entre las pistas del CD. Esto involucra tanto al nivel general como al balance tonal, de forma que la producción sea escuchada íntegramente sin necesidad de ajustar el volumen del amplificador ni del control de tono (o ecualizador si lo hubiera) entre una pista y la otra. Además, será importante conseguir una imagen estéreo equilibrada y con la amplitud suficiente como para optimizar el posicionamiento de los sonidos instrumentales y vocales, realzando los planos sonoros y la sensación de espacialidad. Todo esto, de acuerdo a la estética de la producción. Además, se deberá cuidar de mantener la resolución del archivo de audio en 16 bits (resolución estándar de un CD de audio) ya que ésta puede verse severamente afectada por los procesos digitales a que se verá sometida la señal. En el presente capítulo estudiaremos cada uno de éstos aspectos en forma separada, pero teniendo presente que existe una interrelación entre ellos, afectándose mutuamente. Previamente analizaremos las condiciones de monitoreo de la señal de audio ya que influirán drásticamente en nuestro trabajo. Espacio físico, tipo y posicionamiento de monitores, posición de monitoreo y las condiciones de audición, sumado a las herramientas de análisis y medición, serán cruciales para obtener un resultado óptimo en todo el proceso. Espacio físico. La primera y fundamental condición que debe tener el ámbito donde se realizará la masterización es que sea otro distinto de aquel donde se realizó la mezcla. Como ya dijimos esta situacion está dada en este caso para el objeto de este curso, ya que los materiales proporcionados han sido dessarrollados en un ambiente diferente al que va a utilizar el alumno. Cada ámbito, por mejor tratado que esté acústicamente, presenta condiciones de audición que altera en mayor o en menor medida la consistencia de la señal. Las consolas de mezcla (por citar solo un ejemplo) generan reflexiones que interfieren con la señal proveniente de los monitores; así, algunas frecuencias del espectro se verán afectadas, incrementándose o atenuándose. En tal situación, el ingeniero de mezcla ecualizará buscando un equilibrio de frecuencias acorde al ámbito y a las condiciones de trabajo. Si el mastering se realizara en ese mismo lugar, las condiciones se mantendrían y será imposible detectar y corregir tales problemas. Son ideales las salas de alrededor de 6 metros de largo, pero espacios más reducidos pueden funcionar bien siempre y cuando la forma de la sala no sea un cubo pues serán casi incorregibles los problemas generados por los modos normales de vibración. Salas rectangulares con dimensiones no proporcionales serán entonces las más adecuadas porque en ellas los modos naturales se distribuyen de una forma más homogénea. Pero para obtener los mejores resultados se deberá consultar a un ingeniero acústico (la inversión en equipamiento será inútil si no se trabaja en un espacio adecuado). La disposición de equipos y monitores también son factores importantes a tener en cuenta para conseguir una buena masterización, por lo que se deberá tener especial cuidado en éste aspecto. Para comenzar, se deben posicionar los monitores orientados en el sentido longitudinal de la sala, separados de las esquinas y de la pared frontal para evitar resonancias. Ya que todos los modos naturales tienen picos de presión sonora en las esquinas (si las paredes forman ángulos rectos), nunca deben ser ubicados en ésta posición. En cambio, a lo largo de la pared se producirán nodos y vientres alternativamente, de tal forma que el sonido emitido por los monitores excitará solo algunos de ellos y otros no, alterando el balance tonal de la señal. La posición de monitoreo (posición de escucha) deberá ubicarse formando un triángulo equilátero con los monitores sin interponer en el camino de la señal acústica ningún objeto para evitar sombras acústicas. w w w . c e t e a r . c o m
página
28
Herramientas y procedimientos que se utilizan en el mastering Finalmente, se deberá aplicar material absorbente en los puntos críticos de reflexión sonora (área de reflexiones cercanas) y, preferentemente, trampas de bajo en las esquinas y difusores en la pared trasera. En el mercado hay una amplia gama de materiales para tales funciones, pero mobiliarios estratégicamente distribuidos pueden funcionar bastante bien. Monitoreo Los audífonos no sirven para masterizar, solo funcionan en la etapa de corrección de errores. Los monitores de campo cercano tampoco son adecuados pues, en general, carecen de una respuesta plana y comprimen la señal a un cierto nivel de potencia. De todos los disponibles en mercado, los Yamaha NS-10 (monitores estándar en la etapa de mezcla) son los menos indicados para masterizar. Entonces, se tratará de utilizar monitores de rango medio con respuesta plana. Los estudios profesionales cuentan además con un subwoofer para obtener una buena respuesta en los graves, y como medio esencial para detectar ruidos de baja frecuencia (como vibraciones en los micrófonos, pops, etc.). El CD está dirigido a oyentes que lo escucharán en los más variados sistemas de reproducción (automóviles, equipos domésticos, equipos de alta perfomance, diskman´s, radio, etc.) y el ingeniero de mastering deberá asegurar que la traslación del material sonoro sea efectiva. Por ello, es conveniente contar con varios sistemas de monitoreo. 2.2. Ecualización. A diferencia de lo que ocurre en la mezcla (donde el ingeniero trabaja sobre cada sonido individualmente para luego ensamblarlos) en el mastering siempre se manipulará la señal estéreo, ya mezclada, y por lo tanto será imposible (o casi imposible) corregir la ecualización de un sonido sin afectar a otros. El principal uso de ecualización en el mastering está orientado a corregir deficiencias en el balance espectral de las mezclas. Si tales deficiencias son producidas por defectos en el monitoreo de la señal todas las mezclas se verán afectadas de la misma manera, pero además, como se sabe, el ingeniero mezcla las canciones u obras de la producción en días distintos, bajo diferentes condiciones, concentrándose prioritariamente en el sonido de cada una sin tener demasiado en cuenta el equilibrio final de ecualización de toda la producción.
Equilibrio entre lo general y lo particular, tal es la tarea principal del ingeniero de mastering. Otra diferencia substancial en el terreno de la ecualización entre la mezcla y la masterización reside en el tipo de ecualizadores que habitualmente se usan en uno y otro campo. Ecualizadores y filtros Como sabes, el ecualizador es un procesador que actúa sobre el espectro sonoro de una señal, modificándolo para corregir o compensar su respuesta en frecuencia. Hay dos tipos generales de ecualizadores: gráficos y paramétricos. Los ecualizadores gráficos dividen todo el espectro en bandas logaritmicamente iguales (de octava, tercio de octava, etc.). Rara vez es utilizado para compensar frecuencias debilitadas u otras de nivel excesivo en los tracks del multipista de audio, sino más bien para compensar la respuesta en frecuencia del sistema de amplificación y monitoreo, buscando que suene los más w w w . c e t e a r . c o m
página
29
Herramientas y procedimientos que se utilizan en el mastering "plano" posible. Los paramétricos, en cambio, presentan menos bandas que los anteriores, pero a diferencia de ellos, se puede ajustar la frecuencia de corte y el ancho de banda (Q) de forma continua permitiendo una acción más precisa sobre la señal. Además, ocasionan menos problemas de corrimiento de fase. Existen también otros tipos de ecualizadores, llamados paragráficos y semiparamétricos respectivamente. Los primeros presentan un gran número de bandas, cada una de ellas ajustables en frecuencia de corte, tipo de filtro y ancho de banda. Los segundos permiten ajustar la frecuencia de corte del filtro pero no su ancho de banda. Pero más allá de la categoría a la que pertenezca un ecualizador, éste estará formado por uno o varios tipos de filtros, los cuales detallaremos a continuación. Filtro Pasa Alto (High Pass) Utilizado para eliminar ruidos de baja frecuencia, deja pasar la porción del espectro superior a una determinada frecuencia denominada frecuencia inferior de corte o genéricamente, frecuencia de corte (fc), cortando o eliminando las inferiores. En la práctica, las frecuencias inferiores a la frecuencia de corte no son eliminadas totalmente sino que se reducen a razón de una cierta cantidad de dB por octava (generalmente -6 dB/octava, -12 dB/octava o -18 dB/octava) Filtro Pasa Bajo (Low Pass) A la inversa del anterior, deja pasar las frecuencias inferiores a la frecuencia de corte, bloqueando las superiores, las cuales serán reducidas progresivamente una cierta cantidad de dB por octava. Es utilizado generalmente para eliminar ruido de alta frecuencia sumado a señales cuyas componentes de armónicos no superan un cierto límite (bajo, bombo, voces, etc.). Otro uso de éste filtro es eliminar el ruido introducido en la conversión analógico/digital al muestrear frecuencias superiores a la mitad de la velocidad de muestreo (sample rate), fenómeno conocido como aliasis. Filtro Pasa Banda (Band Pass) Puede ser descrito como la suma de un filtro Pasa Alto y un Pasa Bajo conectados en serie, con la frecuencia de corte del primero inferior a la del segundo. En la práctica es un tipo de filtro que deja pasar una porción más o menos reducida de frecuencias alrededor de la frecuencia de corte (frecuencia central). La amplitud de la porción de frecuencias no eliminadas determina el ancho de banda (factor Q) del filtro. Filtro Eliminador de Banda o Rejección de Banda A la inversa del anterior, elimina una banda de frecuencia alrededor de la frecuencia central de corte. Puede describirse como la suma de un filtro Pasa Alto y un Pasa Bajo conectados en paralelo, con la frecuencia de corte del primero superior a la del primero. Filtro Notch (Peak Notch) Filtro que permite ajustar la ganancia o atenuación de un rango de frecuencias alrededor de la frecuencia de corte. Puede contar tanto con un control deslizante vertical como un potenciómetro circular para realizar el ajuste, correspondiendo en ambos casos la posición central a 0 dB. Un ecualizador gráfico estará formado entonces por varios filtros Notch con frecuencia de corte y ancho de banda fijos. Los ajustes de ganancia de ganancia y atenuación se realizan con controles deslizantes verticales. w w w . c e t e a r . c o m
página
30
Herramientas y procedimientos que se utilizan en el mastering Un ecualizador paramétrico estará formado por uno o más filtros Notch pero con frecuencia de corte y ancho de banda variables, contando generalmente con potenciómetros circulares para controlar cada uno de éstos parámetros y otro para ajustar la ganancia o atenuación. Filtro Low Shelf Filtro que permite ajustar la ganancia o atenuación de las frecuencias inferiores a la frecuencia de corte. Filtro High Shelf Filtro que permite ajustar la ganancia o atenuación de las frecuencias superiores a la frecuencia de corte. La etapa de ecualización de un canal de una consola de mezcla cuenta generalmente con: 1. Un Pasa Alto con un interruptor para su encendido y apagado. 2. Un Low Shelf para controlar la respuesta de los graves con un potenciómetro circular para ajustar la ganancia o atenuación, un interruptor para ajustar la frecuencia de corte (generalmente 40 Hz) y otro como multiplicador (x 2 y x 3) para obtener así frecuencias de corte en 80 y 120 Hz. 3. Dos paramétricos, uno para medios-graves y otro para medios-agudos con potenciómetros circulares para el ajuste de la frecuencia de corte y de la ganancia o atenuación. Un interruptor permite seleccionar dos tipos de ancho de banda, ancho y angosto. 4. Un High Shelf para controlar la respuesta de los agudos con un potenciómetro circular para ajustar la ganancia o atenuación, un interruptor para establecer la frecuencia de corte en 5 o 7.5 kHz y otro multiplicador (x2) para obtener frecuencias de corte en 10 y 15 kHz. 5. Un Pasa Bajo con un interruptor para su encendido o apagado. En el caso del mastering, solo se utilizan ecualizadores paramétricos o paragráficos de alta calidad (generalmente analógicos) si se ecualiza por Hardware (Focusrite d2, Avalon, etc,) pero también es posible utilizar plug-ins de ecualizadores cuya respuesta sea similar a los anteriores. Algunos plug-ins de los más utilizados son: Waves Q10-Paragraphic EQ Ecualizador paragráfico de 10 bandas. Viene en versión DirectX (para insertarse en cualquier programa que admita este tipo de plug-ins, por ejemplo WaveLab) y RTAS (para ser usado en ProTools).
w w w . c e t e a r . c o m
página
31
Herramientas y procedimientos que se utilizan en el mastering
Guardar presets a disco
Cargar presets desde disco
Respuesta en frecuencia Vúmetros Controles de nivel de entrada y medidores de picos
Controles de nivel de salida
Encendido y apagado de cada banda
Edición simultánea o independiente de los canales estéreo
Selector de filtro
Ganancia / atenuación
Frecuencia de corte
Ancho de banda
Figura 11. Interfaz gráfica del ecualizador Q10-Paragraphic EQ de Waves y funciones operativas principales
Waves REQ 6 Bands Ecualizador paragráfico de 6 Bandas con respuesta similar a un ecualizador analógico. Al igual que el anterior viene en versión DirectX (para insertarse en cualquier programa que admita este tipo de plug-ins, por ejemplo WaveLab) y RTAS (para ser usado en ProTools).
Figura 12. Interfaz gráfica del REQ 6 Bands de Waves. w w w . c e t e a r . c o m
página
32
Herramientas y procedimientos que se utilizan en el mastering Focusrite d2 Versión de software que emula todas las funciones y prestaciones al ecualizador analógico multibanda Red 2 de Focusrite. Viene en versión TDM y RTAS para ser utilizado como plug-in de Pro Tools. Low Shelf
Peack Notch
High Shelf
Filtro Pasa Alto
Filtro Pasa Bajo
Nivel de entrada de cada canal Respuesta en frecuencia Nivel de salida de cada canal
Figura 13. Interfaz gráfica del Focusrite d2
Actualmente hay disponibles un número incalculable de ecualizadores en versión de hardware y software y su elección depende de varios factores: calidad, costo, gusto del usuario, facilidades operativas, compromiso de la potencia del sistema informático, etc. Comenzando a ecualizar. Así como no hay dos producciones iguales, no hay dos ecualizaciones iguales en el mastering. Lo ideal antes de comenzar a mover los controles del ecualizador es escuchar fragmentos de todas las pistas para tener una visión global de toda la producción y establecer la necesidad o no de ecualizarlas y, de serlo, que tipo de ecualización será necesaria. Casi nunca son aplicables los presets en ésta etapa, por lo cual, en general, se deben resetear todos los parámetros del ecualizador y comenzar desde cero, escuchando toda la pista para determinar situaciones generales (como por ejemplo, es necesario atenuar @ de los 150 Hz pues todo suena encajonado en los medios-graves, los medios tienen demasiada presencia, se deberá atenuar @ de los 2000 Hz, falta definición en los medios-agudos, posiblemente de deba incrementar la ganancia entre los 2500 y los 4000 Hz, etc.). También se pueden encontrar situaciones particulares (por ejemplo, se producen resonancias en el sonido del bajo cuando éste toca la nota sol2), ya que no tiene sentido corregir una frecuencia que sobresale en un momento claramente definido aplicando ecualización a todo el archivo de audio. Como ecualizar Como regla general, conviene establecer primero cuales frecuencias de deben atenuar antes de empezar a incrementar la ganancia de las que faltan pues por "enmascaramiento" éstas últimas pueden aparecer tapadas por las primeras; al atenuarlas puede que se recuperen las faltantes (o alguna de ellas). Esto ocurre muy a menudo en las mezclas con exceso de graves, ya que éstos enmascaran muy fácilmente a los medios-agudos y a los agudos. Otro aspecto importante es determinar que tipo de filtro será necesario utilizar para cada caso. w w w . c e t e a r . c o m
página
33
Herramientas y procedimientos que se utilizan en el mastering Una técnica habitual de ecualización es la siguiente: 1. Determinar el rango de frecuencias que se desea corregir. 2. Ubicar la frecuencia de corte de una de las bandas del ecualizador cerca del centro del rango. 3. Con un Q ancho, incrementar la ganancia del filtro y ajustar la frecuencia de corte buscando remarcar aquella que se desea corregir. 4. Reducir el ancho de banda y corregir la frecuencia de corte hasta que solo se remarquen las frecuencias problemáticas. 5. Ajustar la ganancia hasta conseguir el balance deseado con el resto del espectro sonoro. No debe olvidarse de comparar en todo el proceso el sonido original con el procesado, no de forma instantánea sino escuchando tramos de cierta extensión para dejar que el oído se acomode a las distintas ecualizaciones. Si se incrementa o se atenúa un rango de frecuencias, luego de un cierto tiempo el oído se acostumbra a éste cambio, de allí la importancia de la comparación constante con el original. A veces es conveniente atenuar de forma exagerada el rango de frecuencias luego de conseguir el encuadre adecuado, para posteriormente recuperar paulatinamente la ganancia hasta conseguir el equilibrio deseado.
No te dejes llevar por la gráfica, solo por tus oídos Algunos ingenieros de mastering comienzan por los medios-graves y los medios-agudos pues allí está la porción más significativa del sonido y un cambio en éstas regiones puede hacer innecesario el ajuste de los extremos del espectro (me he encontrado con situaciones donde un pequeño incremento de la ganancia alrededor de los 220 Hz me ha dado una mayor presencia de graves que aplicando un filtro Low Shelf en los 80 Hz, por ejemplo), con la ventaja adicional de que sistemas de rango reducido reproducirán mejor los graves y los agudos (televisor, radio, etc). A veces se toma un camino que luego de un tiempo parece no llevar a ningún lado, en ese caso, no debes tener miedo en resetear todos los parámetros y empezar de nuevo. La experimentación y la prueba y error son las mejores herramientas para conseguir una buena ecualización. Algunas frecuencias útiles. Ya dijimos que en el mastering no es posible corregir el sonido de un instrumento sin afectar a otro u otros, pero sí es posible encontrar regiones del espectro sonoro donde uno de ellos predomina. Todos los sonidos instrumentales (especialmente los acústicos) y vocales presentan zonas del espectro sonoro cuyo nivel supera al de las frecuencias vecinas; resonancias que condicionan de forma significativa el timbre. A éstas zonas se las conoce como "formantes" y a veces es posible aumentar o disminuir la sonoridad de un instrumento (o de la voz) operando directamente sobre ellas.
w w w . c e t e a r . c o m
página
34
Herramientas y procedimientos que se utilizan en el mastering En la lista siguiente se detallan algunas frecuencias significativas para distintos tipos de sonidos instrumentales. Bombo
Profundidad 60 - 80 Hz, Ataque 2.5 Khz
Tambor
Gordura 240 Hz, Claridad 5 Khz
Hi Hat / Platos Toms de rack Tom de piso Bajo
Choque (Gong) 200 Hz, Brillo 7,5 Khz Gordura 240 Hz, Ataque 5 Khz Gordura 80 - 120 Hz, Ataque 5 Khz Cuerpo 60 - 80 Hz, Ataque (presencia) 700 - 1000 Hz Ruido de cuerda (pop) 2.5 Khz
Guitarra eléctrica
Cuerpo 240 Hz, Ataque 2.5 Khz
Guitarra acústica
Graves 80 - 120 Hz, Cuerpo 240 Hz, Claridad 2.5 - 5 Khz
Órgano eléctrico
Graves 80 - 120 Hz, Cuerpo 240 Hz, Presencia 2.5 Khz
Piano acústico
Graves 80 - 120 Hz, Presencia 2.5 - 5 Khz. Sonido "Honky Tonk" 2.5 Khz (con un Q fino)
Horns Cuerdas Conga / Bongó Voces
Cuerpo 120 - 240 Hz, Brillo 5 - 7.5 Khz Cuerpo 240 Hz, Filo 7.5 - 10 Khz Resonancia 200 - 240 Hz, Presencia (slap) 5 Khz Cuerpo 120 Hz, Resonancia 200 - 240 Hz. Presencia 5 Khz, Sibilancia 7.5 - 10 Khz
De todas formas, es imprescindible escuchar las consecuencias de la ecualización en todos los sonidos presentes en la mezcla y no solamente en aquellos que se quieren modificar. 2.3. Procesos dinámicos. Junto a la ecualización, el procesamiento de la dinámica es uno de los procedimientos más utilizados en el mastering. Ya se dijo que no hay estándares en ninguno de ambos campos, pero es cierto que un CD con muy bajo volumen resultaría inadecuado por varias razones, de las cuales la comercial no es la menor. Pero siempre es mejor que una producción suene bien antes que fuerte. La evaluación de la sonoridad (loudness) de una grabación depende de una serie de factores, algunos técnicos y otros musicales: el sistema de monitoreo, el sistema de medición, el balance espectral de la señal, la combinación de instrumentos y/o voces, el género musical, etc. Sonoridad y sistema de monitoreo La mejor aproximación para obtener un resultado dinámico satisfactorio en el mastering es evaluar auditivamente la sonoridad a través de un sistema de monitoreo bien calibrado antes que medirla en vúmetros o, menos todavía, según la "altura" de la forma de onda. Cuando escuchamos música en nuestro sistema de reproducción (doméstico o profesional) lo hacemos generalmente en una misma posición del control de volumen, el cual modificamos según la actividad que estemos realizando, momento del día o por otras razones más bien de índole afectiva que técnicas. Y en cada uno de esos volúmenes sabemos bien (aunque sea intuitivamente) como suena cada una de nuestras grabaciones. De la misma forma, un ingeniero de mastering conoce perfectamente como responde su sistema y muchas veces no necesita mirar los vúmetros para saber si el volumen de una grabación es bajo o si está saturando la señal, solo necesita de su experiencia y de sus oídos. Es importante tomarse un tiempo y escuchar algunas grabaciones conocidas para evaluar como responde el sistema si se debe trabajar en un ambiente poco conocido (generalmente el ingew w w . c e t e a r . c o m
página
35
Herramientas y procedimientos que se utilizan en el mastering niero de masterización trabaja en su propio estudio y con sus propios equipos, pero no es extraño que en ocasiones sea contratado para realizar trabajos en otro lugar) o para "sintonizar" los oídos. Además, debe tenerse presente que el cliente también necesita una referencia para evaluar los procesos que se le realizan a la señal y dar su consentimiento final. Como sea, nunca conviene comenzar escuchando a volúmenes altos pues los oídos se agotarán rápidamente y, además, en alto volumen grabaciones y mezclas defectuosas también parecen sonar bien. Sonoridad y sistema de medición El oído no responde en forma instantánea a los cambios de nivel de la señal, es más significativo el nivel promedio que los valores de pico a la hora de juzgar la sonoridad de una grabación. Esta es la razón por la cual podemos percibir como bajo el volumen aún cuando los vúmetros del editor parecerían indicar lo contrario. Sucede que hay varios tipos de vúmetros, con distinto tiempo de reacción y de relevo, y su utilización no es universal, depende del tipo de análisis que se quiere realizar. Los vúmetros provistos en los editores de audio y en muchos plug-ins (como en muchos procesadores digitales) son en realidad medidores de "muestras" y son útiles para asegurar que no se produzcan saturaciones por exceder el límite de los 0 dBFS, máximo valor posible en el dominio digital. Pero dos señales con picos en los 0 dBFS pueden tener hasta 10 dB de diferencia en sonoridad. Pero para obtener una medición más cercana a lo percibido por el oído es necesario otro tipo de forma de medición. Vúmetros analógicos serán más adecuados pero también es posible contar con otros que, aún digitalmente, responden a los niveles promedio (RMS) antes que a los valores de pico. Algunos editores de audio (como WaveLab) incorporan la posibilidad de medir el valor de RMS de la señal en tiempo real y también lo hacen algunos plug-ins, principalmente aquellos que simulan procesos analógicos de algún tipo (Magneto, Waves RCL, Antares Tube, etc.). Sonoridad y balance espectral La sonoridad no es independiente de la distribución de frecuencias en el espectro sonoro de una señal. Vasta observar las curvas de Fletcher y Munson (curvas de igual sonoridad) para darse cuenta que el oído es más sensible en el rango medio del registro, entre 500 y 5 kHz. Según ellas, el nivel de sonoridad (nivel de intensidad perceptivo) de un sonido depende de la frecuencia además de hacerlo de su amplitud. Así, el nivel de presión sonora necesario para "igualar" la sonoridad de dos frecuencias diferentes variará según la ubicación de ambas en el registro, siendo menor la diferencia de presión sonora cuanto más sonoras sean ambas frecuencias. Esta es la razón por la cual algunos equipos domésticos incorporan la función "loudness" para equilibrar la respuesta en frecuencia cuando se escucha a bajo volumen, incrementando el nivel de los graves y los agudos. Todo lo dicho explica, entonces, por que una mezcla con los medios reforzados es más sonora que la misma pero con los medios atenuados. Por supuesto que ésta afirmación debe tomarse en sentido general, ya que la forma de onda de los sonidos individuales de la mezcla dista mucho de las ondas sinusoidales que se utilizan para elaborar las curvas. Lo que sí es válido siempre y debe tenerse muy en cuenta es que no se pueden independizar la dinámica y la ecualización de la señal. Ambos fenómenos están tan íntimamente relacionados que a veces es conveniente aplicar ecualización (aunque sea globalmente) y luego incrementar el nivel de sonoridad, mientras que otras requerirá primero procesar la dinámica para posteriormente ecualizar. w w w . c e t e a r . c o m
página
36
Herramientas y procedimientos que se utilizan en el mastering Sonoridad e instrumentación En el mundo acústico - musical, una guitarra siempre será menos sonora que una orquesta sinfónica a no ser que la primera esté cerca y la segunda más lejos del oyente. Es muy difícil componer un concierto para guitarra y orquesta en el cual solista y orquesta mantengan un equilibrio adecuado de sonoridad sin utilizar amplificación, se necesitan muchos conocimientos de orquestación y mucho oficio en la composición además de creatividad. Si, en el concierto, después de la obra con orquesta el guitarrista tocara una obra solista, grande sería el cambio de sonoridad. Pero, ¿qué pasaría en una grabación de ese concierto (o qué suele suceder)? La diferencia de sonoridad será menor e incluso cabe la posibilidad de que se invierta la situación, la obra solista más sonora que la de orquesta. Sería muy extenso enumerar todas las razones por las cuales un CD nunca suena igual que un concierto en vivo y, a lo sumo, solo es una simulación de él, aún cuando el concierto fuera de Rock, Jazz, o cualquier estilo musical. Cuando en una producción se deben masterizar obras de diferente instrumentación, debe tenerse especial cuidado de no exagerar la sonoridad de los temas donde se utilicen solo unos pocos instrumentos frente a otros con mayor densidad orquestal (temas donde toque toda la banda, por ejemplo). Sonoridad y estilo musical Cada estilo musical tiene sus propias exigencias de sonoridad y rango dinámico. En general hay músicas que requieren de impacto (rítmico) mientras que otras necesitan que se escuchen los sutiles detalles de instrumentación o se diferencien claramente los planos texturales y las voces internas. El Rap y el Tecno, por ejemplo, son claros ejemplos del primer grupo. En ellos el rango dinámico suele estar reducido a unos pocos decibeles y todo debe sonar FUERTE, como una pared sonora. El Jazz y el Tango, en cambio, son músicas de expresiones sutiles, donde las acentuaciones rítmicas cumplen un rol fundamental en la estructura sonora. Por momentos intimistas, por momentos violentas y agresivas, son músicas de grandes contrastes expresivos y requieren de un amplio rango dinámico. La Música Clásica también es una música de detalles y de contrastes, y, por lo tanto, requiere de poco procesamiento dinámico con el fin de preservar la expresión musical en toda su dimensión. Más allá de a cual período histórico pertenezca (Barroco, Clásico, Romántico, Contemporáneo, etc.) siempre debe sonar "en vivo", respetando las características tímbricas (instrumentos, ambientes, etc.), de textura (contrapuntística, homofónica, etc.), estilísticas y de género (orquestal, de cámara, vocal, etc.) de cada una. El Rock, en cambio, tiene tantas corrientes y estilos que es imposible establecer un criterio único sobre como debe sonar una grabación, sus variantes pueden ser asimiladas a uno u otro de los casos anteriores. Todo lo antedicho no aporta sino solo datos referenciales y muestra cuán distintas pueden ser las distintas formas de expresión musical. Para conocer un estilo hay que escuchar mucha música y atender lo que los músicos hacen y dicen de él. Compresión1 y limitación Antes de comenzar a detallar las características y prestaciones del compresor y el limitador es necesario establecer un principio fundamental: comprimir es un arte antes que una ciencia. Solo 1 No confundir con formatos de compresión de archivos de audio (mp3, ADPCM, etc.) w w w . c e t e a r . c o m
página
37
Herramientas y procedimientos que se utilizan en el mastering la experiencia y el contacto con el material sonoro aseguran un resultado satisfactorio. No hay recetas ni reglas. El compresor y el limitador son procesadores con principios de funcionamiento similares: ambos reducen el rango dinámico de una señal de audio, atenuando el nivel de salida cuando la señal de entrada supera un cierto valor definido por el usuario, conocido como umbral (Threshold). La cantidad de atenuación es expresada en forma relacional, indicando la cantidad de dB que la señal de entrada debe superar el umbral para obtener un incremento de 1 dB en la señal de salida. Tal la definición de la relación de compresión (Ratio). Así, una relación de compresión de 3:1 indica que por cada 3 dB que la señal de entrada supera al umbral, en la salida se obtendrá solo 1 dB de incremento. Por debajo del umbral la señal no será procesada (al menos teóricamente), situación que puede expresarse como una relación de compresión 1:1. El limitador es un tipo particular de compresor en el cual no importa cuántos decibeles la señal de entrada supera al umbral, a la salida no se obtendrá ningún incremento. Corresponde a una relación de compresión de inf:1, aunque en la práctica puede obtenerse resultados similares con relación de compresión superiores a 20:1 En la figura siguiente se representan los parámetros definidos hasta aquí. Tal figura es utilizada por algunos plug-ins y procesadores digitales para controlar gráficamente la compresión o limitación.
Compresión. Relación de compresión 3:1
Umbral ∆Ο
Salida
Limitación
Parte de la señal que no será procesada. Relación de compresión 1:1
0 dB
Entrada
∆I
Figura 14. Representación de las curvas de respuesta de compresión y limitación aplicadas a una señal de audio
Los parámetros genéricos de ambos procesadores se completan con el Tiempo de Ataque (Attack), el Tiempo de Relevo (Release), y controles para ajustar el nivel entrada (Input) y el de salida (Output). El Tiempo de Ataque indica cuanto tiempo (en milisegundos) tarda el procesador en responder una vez que la señal de entrada supera al umbral. Este parámetro puede alterar sustancialmente el material musical, suavizando los transientes de ataque de sonidos como: tambor, toms, guitarras, etc., si es demasiado rápido. Por el contrario, si es demasiado lento, solo la porción de sonido posterior al ataque será afectada aumentando la diferencia entre el valor de pico y el de RMS. El Tiempo de Relevo, a la inversa que el anterior, indica cuanto tiempo tarda el procesador en recuperar el estado inicial, previo a la compresión o limitación. Si es lento (mayores a 500 ms) ataques sucesivos separados a una distancia de tiempo menor que el TR serán siempre comprimw w w . c e t e a r . c o m
página
38
Herramientas y procedimientos que se utilizan en el mastering idos pues el procesador no termina de recuperarse cuando la señal vuelve a superar el umbral. En cambio, si es demasiado rápido, se pueden producir distorsiones cada vez que la señal pasa por debajo del umbral. Algunos procesadores dinámicos incorporan un control automático del TR (denominado ARC) que se autoajusta según el perfil dinámico del sonido. Al igual que el ecualizador, tanto el compresor como el limitador son utilizados en todas las etapas de la producción, pero su uso en el mastering es diferente a las aplicaciones en las etapas de grabación y mezcla. Incluso algunos muy utilizados para controlar la dinámica (como el DBX 160) son inaplicables en el proceso de masterización. Al comprimir o limitar se reducen las diferencias de volumen entre los sonidos de alto nivel y los de nivel bajo y medio. Insertados en un canal de la consola (por ejemplo en el del tambor), permiten controlar la sonoridad para conseguir un ensamble adecuado, evitando que el sonido sea "tapado" por momentos y se "desprenda" de la mezcla en otros. Pero en el mastering, al actuar sobre toda la mezcla, estas reducciones pueden comprometer drásticamente la limpieza del sonido, la profundidad y la disposición de planos musicales. Evidentemente, el Tiempo de Ataque de un compresor aplicado a un tambor no puede ser el mismo que el del aplicado a una voz; ¿cómo diferenciarlos en el mastering donde ambos sonidos suenan simultáneamente?. Por lo dicho anteriormente se entiende por qué un estudio de masterización cuenta con compresores y limitadores de alta calidad (High End), tanto analógico como digitales. También son muy utilizados los valvulares, pero, como requieren un mantenimiento constante para preservar sus prestaciones, se los suele encontrar solo en los estudios profesionales. Otra diferencia importante la encontramos en la respuesta del procesador cuando la señal supera al umbral. En la figura 14 se ve que una vez que la señal supera al umbral es comprimida inmediatamente y de forma constante (manteniendo constante la relación de compresión), situación que se evidencia en el quiebre de la línea que representa la respuesta de compresión y en la pendiente constante del segmento correspondiente a la parte comprimida. Esto puede ser un problema en el mastering, sobre todo si la señal pasara permanentemente por encima y por debajo del umbral. Para masterizar se prefiere un compresor con una respuesta distinta, donde la relación de compresión aumente paulatinamente hasta alcanzar el valor establecido por el usuario, en el extremo correspondiente a los 0 dB. Gráficamente, ésta situación sería representada de la siguiente manera (figura 15).
Figura 15. Curva de respuesta de un compresor "Soft Knee"
w w w . c e t e a r . c o m
página
39
Herramientas y procedimientos que se utilizan en el mastering Tal tipo de respuesta recibe la denominación de "Soft Knee" en contraposición de la representada en la figura 14, que recibe el nombre de "Hard Knee". Así como encontramos ecualizadores de alta perfomance emulados por software, también hay a disposición en el mercado desarrollos de plug-ins que ofrecen las mismas o similares prestaciones que las diferentes versiones de hardware de compresores y limitadores. De ellos, algunos de los que mejor se adaptan a las necesidades del mastering son: Waves RComp (nueva versión del Waves RCL) Compresor con simulación de respuesta analógica valvular (vintage) o de estado sólido (seleccionable), soft clip, Hard y Soft Knee, ARC. Viene en versión DirectX, RTAS y TDM. La figura 15 muestra la interfaz gráfica del compresor y sus parámetros principales.
Conmutador para seleccionar entre Soft Knee (Smooth) y Hard Knee (Warm)
Conmutador para seleccionar entre respuesta valvular (Opto) y de estado sólido (Electro).
Indicador de clip. El color amarillo indica saturación analógica (soft clip), el rojo indica clip digital.
ARC on / off
Umbral Control para compensar la ganancia de salida
Ataque
Relevo
Relación de compresión
Cantidad de decibeles comprimidos
Margen de ganancia hasta 0 dB
Figura 16. Interfaz gráfica del compresor RComp de Waves
Compresor y limitador LA-2A de Bomb Factory Puede funcionar como compresor y como limitador según se especifique en el conmutador de la esquina inferior derecha. Solo se ajusta el nivel de ganancia de entrada y la cantidad de reducción de pico. El umbral, ataque y relevo están predefinidos siendo el nivel de salida ajustado automáticamente a medida que se aumentan o disminuyen ambos controles. Cuenta con un vúmetro de aguja y un selector para medir el nivel de salida o la cantidad de reducción de ganancia. Viene en versión RTAS y TDM para Pro Tools. w w w . c e t e a r . c o m
página
40
Herramientas y procedimientos que se utilizan en el mastering
Figura 17. Interfaz gráfica del LA-2A de Bomb Factory
Al igual que con los ecualizadores, el desarrollo de compresores y limitadores en versión de hardware y software es muy amplio, aún para un campo específico como el mastering. Optar por uno u otro depende de las necesidades prácticas y las preferencias operativas del ingeniero de mastering . ¿Siempre es necesario comprimir o limitar la señal de audio en el mastering?. Definitivamente la respuesta es no. Depende de la naturaleza y las características del material sonoro. La compresión es un proceso que no solo afecta a la dinámica sino también al balance tonal de una mezcla. Para un Tiempo de Ataque y de Relevo determinados, graves. Medios y agudos serán comprimidos de una forma no equitativa, afectándose a veces a unos más que a otros. Si bien puede utilizarse para reducir el nivel de pico de una señal y de esa forma obtener un margen extra para aumentar la ganancia, las consecuencias de su uso pueden ser muy nocivas para la naturaleza expresiva del material musical. Por ejemplo, pueden llegar a anularse totalmente las acentuaciones rítmicas en aquellas músicas en donde éstas son significativas, alterando totalmente la expresión musical. La música puede así llegar a sonar "aplastada" , como si a un mensaje hablado se le anulase la diferencia entre sílabas acentuadas y no acentuadas. Pero si además de la necesidad de reducir los valores de pico es necesario agregar más impacto (punch) a la mezcla en sonidos graves y medios - graves, el compresor será la herramienta más útil. En cambio, limitar la señal de una forma controlada generalmente da lugar a un proceso más limpio, más transparente al oído, afectando menos drásticamente las cualidades internas de la música.
Recuerda, el exceso de compresión no tiene arreglo. Escucha y tómate un tiempo antes de tomar decisiones. Como comprimir una señal de audio. 1. Ubica el umbral entre los valores de pico y de RMS con un tiempo de ataque y relevo altos. 2. Establece la relación de compresión a un valor para el cual la reducción de ganancia no sea mayor a 6 dB. 3. Reduce el tiempo de ataque y el de relevo hasta observar que solo las partes que se desean comprimir son afectadas. 4. Reajusta la relación de compresión hasta obtener reducciones del orden de los 3 dB. w w w . c e t e a r . c o m
página
41
Herramientas y procedimientos que se utilizan en el mastering En algunos casos puede ser mayor, pero debes escuchar atentamente que no se produzcan resultados indeseados, en particular, que no se perciba un aumento de volumen en el momento de recuperación del compresor (durante el tiempo de relevo). 5. Si es necesario, reajusta el nivel de umbral. Nota: ajusta el nivel de salida del compresor hasta no percibir cambios de volumen entre la señal sin procesar y la procesada. Solo así se podrá comparar ambas señales para evaluar el resultado de la compresión. De otra forma, podría parecer que todo suena mejor simplemente porque suena más fuerte. Una vez terminado el proceso de configuración de los parámetros, y asegurado un resultado satisfactorio, se puede dar ganancia a la salida. Algunos compresores tienen un control especial para compensar el nivel de salida de forma automática a medida que se reducen los valores de pico. Este control debe desactivarse en el proceso de configuración de los parámetros. Algunos ingenieros de mastering prefieren limitar la señal antes que comprimirla pues, aseguran, el limitador da como resultado un sonido más claro y transparente afectando menos drásticamente la textura y la expresión musical. Sugieren, incluso, utilizar un tiempo de ataque y relevo muy rápidos. Una razón para esto la encontramos en el hecho que al comprimir la mezcla estéreo se afecta no sólo a la dinámica sino también al balance espectral; limitar la señal, en cambio, produce menos efectos secundarios. Será necesario entonces reajustar los parámetros del ecualizador para compensar las pérdidas, a veces se puede, otras no. En definitiva, la elección de comprimir o limitar la señal debe ser tomada en función del material sonoro concreto, cuidando siempre de no alterar la naturaleza expresiva del registro musical. Si solamente es necesario aumentar el nivel de ganancia, entonces se deberá optar por otros procedimientos como cortar picos y normalizar, opciones que estudiaremos más adelante. Compresores multibanda Como se dijo anteriormente, la compresión afecta a la dinámica y también al balance espectral de la señal de audio. Sucede que para una determinada configuración de los parámetros del compresor las distintas bandas de frecuencia serán afectadas de distinta manera. Un tiempo de ataque rápido, por ejemplo, tiende a comprimir más a los agudos que a los graves, dando como resultado un sonido más opaco y cerrado; si, por el contrario, es demasiado lento, los graves se comprimirán más que los agudos con el agregado de que la relación entre valores de pico y RMS aumentará. Estos efectos están también relacionados con el tiempo de relevo, lo cual hace imposible predecir con exactitud cuales serán las consecuencias de la compresión en el campo espectral. Si escuchas con atención una mezcla notarás que a menudo es necesario controlar solamente la dinámica de una porción del espectro sonoro para conseguir un sonido consistente, perfectamente ensamblado. Para éstas situaciones son muy útiles los compresores multibandas, los cuales constan de varios compresores y crossover's interconectados. Estos últimos permiten dividir la señal en varias bandas de frecuencias las cuales podrán entonces ser comprimidas de distinta manera, con distintas configuraciones en los parámetros de compresión. En las figuras siguientes se detallan las interfaces gráficas de tres compresores multibanda: el C4 de Waves (viene en versión DirectX, RTAS y TDM), el Mastering Compresor de Steinberg (versión VST) y el Multiband R3 de Ultrafunk (versión DirectX).
w w w . c e t e a r . c o m
página
42
Herramientas y procedimientos que se utilizan en el mastering
Figura 18. Interfaz gráfica del compresor multibanda C4 de Waves.
Pueden apreciarse las cuatro bandas de frecuencias en las que se divide el espectro sonoro, cada una de las cuales con controles de ganancia, rango (relación de compresión), umbral, ataque y relevo independientes.
Figura 19. Interfaz gráfica del compresor multibanda Mastering Compresor de Steinberg.
Se pueden estipular tanto la cantidad de bandas como el rangos de frecuencia de cada una. La curva de respuesta a la derecha permite editar la banda seleccionada (remarcada) incorporando uno o varios umbrales con sus respectivas relaciones de compresión en forma gráfica.
Figura 20. Interfaz del compresor Multiband R3 de Ultrafunk
El espectro es dividido en cinco bandas de frecuencias con rangos editables en forma individual. Cada banda cuenta con controles independientes de umbral, relación de compresión, ataque y relevo más tipo de respuesta del compresor (Normal o Vintage, Hard o Soft Knee Ejercitación: Realizar el Trabajo Práctico 2 w w w . c e t e a r . c o m
página
43
Herramientas y procedimientos que se utilizan en el mastering 2.4. Control de la imagen estéreo. Con la invención del estéreo se incorporó la posibilidad de distribuir "espacialmente" los sonidos que forman parte de una grabación musical, lo cual era imposible de realizar en las grabaciones monofónicas. En éstas últimas, no importa cuántos altavoces se utilicen para la reproducción, si son de un mismo tipo todos emitirán la misma señal dando la impresión de que el sonido proviene del más cercano al oyente. Una comprobación simple puede ser realizada reproduciendo en un sistema estéreo una grabación monofónica (o activando el botón "mono" en la sección maestra de WaveLab). Si la posición de escucha está centrada con respecto a los parlantes (formando un triángulo isósceles con ellos) el sonido parecerá provenir del eje de simetría que pasa por el oyente (fig. 21 ). Si ahora desplazamos la posición de escucha hacia uno de los lados, el sonido parecerá provenir del parlante más cercano, dando la impresión de que el otro parlante no emite ninguna señal (fig. 22). Esto ocurre porque (siendo la señal idéntica en ambos parlantes) el sonido emitido por el más cercano arriva antes a nuestros oídos, fenómeno conocido como "efecto Hass".
Figura 21. Oyente en centro
Figura 22. Oyente desplazado del centro
Observando la figura 21, puede decirse que la señal de audio parece provenir de un parlante "virtual" ubicado en el centro de los parlantes reales. En una mezcla monofónica, entonces, la sensación de espacialidad dependerá exclusivamente del ámbito de audición ya que el sonido directo provendrá desde una dirección única. En tal circunstancia los sonidos instrumentales y/o vocales de la grabación se ubicarán "uno detrás de otro", diferenciándose por su sonoridad relativa y por la cantidad de reverberación que en la mezcla se le aplique a cada uno. En una mezcla estéreo, en cambio, las señales provenientes de ambos parlantes son diferentes, lo cual permite ubicar los sonidos en una zona del espacio como la representada en la figura 23.
Figura 23. Espacio virtual en una imagen estéreo. w w w . c e t e a r . c o m
página
44
Herramientas y procedimientos que se utilizan en el mastering En los primeros discos mezclados en estéreo es común escuchar algunos sonidos volcados totalmente hacia uno u otro canal (mezclas donde la batería se encuentra volcada hacia el canal izquierdo, las guitarras hacia el canal derecho y las voces y el bajo en el centro son posibles de escuchar en algunos discos de Los Beatles). También es usual encontrar grabaciones donde algunos sonidos "viajan" constantemente entre ambos canales. Fue una época de experimentación, donde cada artista usaba como se le ocurría las posibilidades de espacialización que brindaba el estéreo. Por otro lado, en las grabaciones de música clásica se buscaba aprovechar la espacialidad para simular la situación de escucha del teatro, pretendiendo ubicar las fuentes sonoras en un escenario virtual y al oyente "rodeado" de sonido directo y reverberante, como sentado en una butaca en el medio de la sala. De a poco estos conceptos fueron cambiando y unificando a partir del descubrimiento de ciertos mecanismos de audición adquiridos por el desarrollo de la psicoacústica. Fenómenos como la manera en que el oído utiliza la información sonora del espacio que rodea al oyente para determinar la dirección de arrivo de un sonido, la amplitud del espacio sonoro, etc., modificaron la manera de utilizar el estéreo. Un caso muy interesante de analizar en particular es el de la correlación de fase. Cuando un sonido llega a nuestros oídos desde un lado, primero es percibido por aquel más cercano a la fuente sonora y luego por el otro, en parte por las reflexiones en las paredes y objetos de la sala y en parte por la porción que (filtrada) atraviesa la cabeza. Aún en espacios abiertos(libres de reflexiones), dependiendo del ángulo de incidencia, el retardo entre los estímulos sonoros percibidos por ambos oídos dan lugar a un desfasaje cuyo monto sirve para determinar la ubicación de la fuente. En caso de que la fuente sonora esté ubicada directamente enfrente de nosotros, ambos oídos percibirán el sonido al mismo tiempo, en fase. Si está ubicada a un lado, el oído más alejado lo "escuchará" más tarde que el otro, produciéndose un corrimiento de fase. Pero éste fenómeno no es independiente de la frecuencia: las más graves no atraviesan la cabeza sino que se difunden por los huesos del cráneo y en éste caso serán percibidos por ambos oídos al mismo tiempo. De allí la afirmación de que los medios y los agudos son direccionales mientras que los graves no. Así, con retardos y filtros se puede superar el límite establecido por los parlantes, ganando espacio hacia fuera y hacia delante de los mismos, llegando incluso a poder ubicar un sonido casi a 180º. Estos conocimientos permiten conseguir mezclas más amplias y equilibradas, donde las voces e instrumentos solistas se destacan claramente del fondo sin tener que competir por un lugar y sin tener que "deformar" un sonido para que se ensamble con otro que ocupa la misma o similar posición del estéreo. En la concepción moderna del uso del estéreo ambos canales deben estar equilibrados, recibiendo ambos oídos energías sonoras equivalentes en las distintas bandas de frecuencia, generalmente con los graves ubicados alrededor del centro y las otras frecuencias distribuidas equitativamente en todo el estéreo. Las voces e instrumentos solistas se ubican casi siempre al centro pero desprendidos de la línea de los parlantes (escucha un CD de Sting y trata de determinar en que lugar se posiciona la voz). La reverberación y los ambientes ocupan generalmente la máxima amplitud del estéreo. Es así que en el mastering muchas veces debe corregirse la imagen estéreo de una mezcla que, por diversos factores, se encuentre desbalanceada. A veces es necesario ampliar el estéreo para dar más espacialidad, en busca de una mayor difusión del sonido en mezclas que quedaron muy cerradas. A veces es necesario equilibrar la sonoridad de ambos canales en mezclas que quedaron "volcadas" hacia un lado. Otras es necesario incrementar la ganancia de los sonidos centrales que quedaron demasiado bajos en la mezcla o que fueron atenuados por las aplicación w w w . c e t e a r . c o m
página
45
Herramientas y procedimientos que se utilizan en el mastering de ecualización y compresión en el mastering, o viceversa. Esta última situación es muy común y por eso es conveniente, cuando existan dudas, hacer tres versiones de mezcla de una misma obra: una con la voz o instrumentos solistas más desprendidos de los requerido, otra con éstos más atenuados y otra con la relación esperada; de ésta manera siempre se tendrá la posibilidad de tomar la mezcla más adecuada para el proceso de masterización. Resumiendo, un sistema estéreo está formado por dos canales diferenciados (izquierdo y derecho) más un canal central virtual del cual se emiten los sonidos idénticos reproducidos simultáneamente por ambos parlantes. De la relación de éstos tres canales dependerá la imagen estéreo final. Herramientas y procedimientos para el control de la imagen estéreo Antes de comenzar es importante tener una correcta posición de monitoreo de la señal para no incurrir en evaluaciones erróneas: teniendo en cuenta que nuestros oídos son especialmente sensibles a sonidos provenientes de fuentes sonoras ubicadas delante, en un rango de hasta 75º de apertura y con una elevación de aproximadamente 15º, la mejor ubicación de los monitores se encuentra formando un triángulo equilátero con el oyente y elevados hasta la inclinación especificada. Analicemos ahora cada una de las situaciones planteadas anteriormente. a) Cambios en la amplitud de la imagen estéreo. Para modificar la amplitud del estéreo existen herramientas especialmente diseñadas denominadas expansores de estéreo, con controles que permiten aumentar o reducir de forma virtual la separación entre los parlantes. Para éste procedimiento se utilizan algoritmos internos especialmente diseñados para un cambio controlado de la correlación de fase de ambos canales por lo que debe tenerse especial cuidado en no introducir errores de fuera de fase, sobre todo si se amplía exageradamente el estéreo. Por esto es conveniente realizar el procedimiento ayudándose con un medidor de fase además de los oídos. En las figuras siguientes (24, 25 y 26) se muestran los análisis de los tres grados habituales de correlación de fase entre los canales izquierdo y derecho de un sistema estéreo: sonido en fase (mezcla mono o imagen estéreo cerrada), sonido con un corrimiento de fase de alrededor de 90º (mezcla estéreo correcta) y sonido fuera de fase (problemas de cancelación de frecuencias)2.
Figura 24. Mezcla "mono"
Figura 25. Mezcla estéreo correcta
Figura 26. Mezcla estéreo "fuera de fase"
Ten presente que dos sonidos idénticos pero fuera de fase (con forma de onda invertida) se cancelan cuando se los suma. Si se los reproduce en un sistema monofónico (una radio AM, por ejemplo) se anularán totalmente, pero si se los reproduce en un sistema estéreo ubicando cada uno en un canal, se anulará el sonido proveniente del centro (canal central virtual) dando como resultado un sonido envolvente muy extraño que crea una sensación similar al mareo. Cuando la forma de onda es compleja es posible que algunas frecuencias se cancelen y otras no, en éste caso la ecualización de la señal cambiará dramáticamente si se la reproduce "en mono". A continuación, las interfaces gráficas de dos tipos de expansores de estéreo. 2 En la carpeta "Ejemplos\Correlación de fase\" del CD del curso encontrarás archivos de audio de los tres tipos de mezcla. w w w . c e t e a r . c o m
página
46
Herramientas y procedimientos que se utilizan en el mastering La figura 27 muestra el "StereoExpander" de WaveLab 4. Plug-in VST de Steinberg que viene incluido en el programa. Solo presenta un control deslizante para aumentar (hasta +100) o reducir (hasta -100) la amplitud de estéreo, la posición central (0) indica la amplitud original. La figura 28 corresponde al plug-in DirectX y RTAS "S1-Stereo Imager" de Waves. Este presenta controles especiales para ajustar la amplitud (Width) del estéreo y la ganancia de entrada. El control de ganancia es importante pues el corrimiento de fase puede generar saturaciones digitales, sobre todo si la señal original tiene valores de pico cercanos a 0 dB. Los controles restantes se explicarán más adelante. La gráfica muestra un triángulo dentro de un sistema de coordenadas polares, la posición de escucha se ubica en el vértice inferior del triángulo y la los parlantes en los vértices opuestos. Los semicírculos marcan puntos de igual nivel, desde 0 dB (semicírculo mayor) hasta - 24dB de tal forma que siempre es posible medir cuanta ganancia o atenuación se está aplicando a cada componente del estéreo (obviamente, el triángulo nunca debe sobresalir del semicírculo de 0 dB si no se quieren introducir saturaciones digitales. Cuando el control "width" se desplaza debajo de 1 (amplitud original) el triángulo se cierra comprimiendo el estéreo progresivamente hasta transformarse en una línea vertical en el valor 0 (sonido monofónico), si se lo desplaza por sobre el valor 1 éste se abrirá indicando expansión del estéreo (como si se separaran los parlantes) hasta alcanzar la máxima amplitud en el valor 3. La línea vertical sirve para indicar la dirección de los sonidos provenientes del centro del estéreo. Cuenta además con otro control denominado "Input Mode" que permite seleccionar dos tipos de señales de entrada: "L - input - R" corresponde a una señal estéreo convencional mientras que "M - input - S" hace referencia a un tipo de señal que será explicada más adelante. Existe una versión especial de éste plug-in denominado "S1-Shuffler" el cual incorpora controles especiales para ajustar la respuesta de las frecuencias graves a la expansión del estéreo: "shuffler" permite establecer cuanto de la expansión afectará a las frecuencias graves (va desde 1 = sin expansión, hasta 3 = máxima expansión); "freq" determina la frecuencia debajo de la cual actuará el control "shuffler" y "Bass Trim" permite compensar los cambios de nivel en las frecuencias graves producto de la expansión o compresión del estéreo.
Figura 27. Interfaz gráfica del plug in VST "Stereo Expander" de Steinberg
Figura 28. Interfaz gráfica del plug in DirectX "Stereo Imager" de Waves w w w . c e t e a r . c o m
página
47
Herramientas y procedimientos que se utilizan en el mastering Además de los problemas de fase, debe escucharse atentamente como se modifican la reverberación y los ambientes cuando se expande el estéreo ya que pueden ver incrementado su nivel de una forma desmesurada. b) Control del balance entre los canales izquierdo y derecho En promedio la imagen estéreo debe escucharse centrada de la misma forma que el ambiento sonoro que nos rodea se distribuye equitativamente en nuestra cabeza más allá del posicionamiento de una fuente sonora particular. Por esto los medidores de picos nunca deben utilizarse para lograr un equilibrio en la energía sonora emitida por ambos canales del estéreo. Es imprescindible guiarse auditivamente, sobre todo si no se cuenta con vúmetros o medidores de RMS por canal. Ahora, habiendo detectado un corrimiento hacia un lado de la imagen estéreo es necesario "enderezarla". Para esto se puede corregir la relación de niveles de cada canal cambiando separadamente la ganancia o desplazando el paneo hacia el canal más débil. Cualquiera de éstos procedimientos podrían funcionar si el corrimiento es muy leve (en cuyo caso debería evaluarse si es necesario aplicarlos) pero si el problema de desplazamiento es mayor se debe encontrar otra solución pues debe tenerse presente que una alteración de los niveles individuales de los canales izquierdo y derecho modifica el posicionamiento de las fuentes sonoras ubicadas en el centro, desplazándolas hacia un lado. En éste caso es peor el remedio que la enfermedad. Si las fuentes sonoras tienen un posicionamiento demasiado preciso (habitualmente ocurre esto en mezclas con muy poca reverberación) puede llegar a solucionar el problema aplicar algo de compresión a cada canal separadamente, lo cual permitiría reducir también la diferencia entre los valores de pico que pueden presentarse. Pero muchas veces esto tampoco corrige el problema, siendo necesario buscar otra solución. Si observas la figura 28 notarás la presencia de dos controles adicionales que no hemos explicado todavía: asimetría y rotación. El primero de ellos permite cambiar la relación de niveles entre los extremos del estéreo sin alterar los sonidos centrales. El segundo, produce el mismo efecto que aumentar o disminuir la ganancia de cada canal individualmente. Corrimientos muy particulares pueden obtenerse combinando ambos controles. Esto nos permite establecer las siguientes definiciones: Asimetría: desequilibrio entre los niveles de los canales izquierdo y derecho del estéreo pero con el canal central correctamente orientado. Rotación: Desplazamiento de toda la imagen estéreo (incluido el canal central) hacia un lado. c) Control de nivel del canal central (virtual). Como ya se dijo, es habitual que al ecualizar se produzca un cambio en el nivel de algunas fuentes sonoras. A veces se puede compensar esto incrementando otras frecuencias relevantes de las fuentes afectadas pero esto no siempre es posible, sea porque se afectan otros sonidos o porque si bien se consigue recuperar el nivel original se distorsiona el balance espectral, etc. Esta situación es particularmente importante si los sonidos afectados son los de las voces o instrumentos solistas (generalmente ubicados en el centro del estéreo). Una solución se dio en un párrafo anterior: contar con tres mezclas con diferentes niveles de ganancia en voces o instrumentos solistas (una con el nivel esperado, otra con nivel más alto y otra más bajo). Así si al ecualizar o ampliar el estéreo se tiende a disminuir el nivel de ganancia de éstos sonidos es posible reemplazar la mezcla por aquella con los niveles más altos. w w w . c e t e a r . c o m
página
48
Herramientas y procedimientos que se utilizan en el mastering Pero no siempre es posible disponer de tal repertorio de mezclas y en ese caso será necesario encontrar otra solución. Cuando se quiere registrar una o varias fuentes sonoras tratando de captar sus cualidades de espacialidad en una imagen estéreo se suele recurrir a dos técnicas de posicionamiento de micrófonos: la distribución XY y la técnica MS (mono-estéreo). Muy utilizadas para grabaciones en salas de teatro o en ambientes sonoros complejos, permiten captar el sonido de orquestas, coros, solistas, actores, etc., desde cualquier punto de la sala con solo dos micrófonos. A veces se usan para registrar en dos canales la reverberación natural de un ámbito sonoro para luego mezclarlos con los micrófonos de escenario. En la técnica MS un micrófono cardioide se dirige hacia la fuente sonora (M) y otro con patrón polar figura de 8 se ubica perpendicularmente al primero en el mismo punto de espacio para captar los sonidos laterales producto de reflexiones en las paredes (S) . Mediante una consola de mezcla es posible recrear la imagen sonora original combinando las señales de ambos micrófonos de la siguiente forma: Canal izquierdo = M + S, Canal derecho = M - S. Es decir: 1. La señal M se envía a un canal de la consola. 2. La señal S se envía a dos canales y a uno de ellos se le invierte la fase (-S). 3. La mezcla de los canales M y S se asigna al canal izquierdo del bus estéreo. 4. La mezcla de los canales M y -S se asigna al canal derecho del bus estéreo. A diferencia de la técnica XY, donde las señales proveniente de dos micrófonos omnidireccionales (con sus diafragmas ubicados perpendicularmente entre sí, casi en el mismo punto del espacio y orientados en conjunto hacia la fuente sonora) se mezclan asignando cada una a un canal distinto del estéreo, la técnica MS permite, por un lado, modificar el balance entre la señal central M y la estéreo S y, por el otro, dirigir "en vivo" el par de micrófonos hacia distintas fuentes sonoras que quieran ser captadas con mayor precisión. Muy útil para grabar voces de actores, es posible alejar o acercar la fuente sonora con solo controlar un par de faders de la consola. En el mastering se puede utilizar la técnica MS en sentido inverso, separando un registro estéreo común en dos componentes: el sonido central y los sonidos laterales para luego procesarlos individualmente. Este procedimiento se realiza mediante un codificador MS (como el provisto por el Finalizer de TC Electronics) que separa una señal estéreo en una señal M y otra S. Luego de modificar la relación de volumen entre ambas se vuelve a decodificar y así se consigue aumentar o atenuar la ganancia del canal central de una mezcla estéreo. Claro que no solo la voz solista será alterada, también lo serán todos aquellos sonidos que (como el del bajo) se ubiquen en el centro del estéreo. Pero, al tener separado el canal central, es posible aplicar en él compresión multibanda para controlar las bandas de frecuencias individualmente y así obtener un balance más adecuado para la mezcla final. Otras posibilidades se abren con ésta técnica que serían muy largas de enumerar aquí. Pero, ¿cómo utilizar ésta técnica si no se cuenta con un codificador? Dada una señal estéreo es posible separarlas en dos componentes M y S aplicando las siguientes fórmulas: M = ½ (L + R) S = ½ (L - R)
w w w . c e t e a r . c o m
página
49
Herramientas y procedimientos que se utilizan en el mastering A éste proceso se lo denomina "MS Matrix" y puede ser realizado en una workstation de la siguiente manera: 1. Poner cada canal del estéreo en dos tracks del multipista (dos para el izquierdo y dos para el derecho). Por ejemplo: canal izquierdo: tracks 1 y 2; canal derecho: tracks 3 y 4. 2. Con el paneo al centro, enviar tracks 1 y 3 a un subgrupo (canal M) y tracks 2 y 4 a otro (canal S). 3. Invertir la fase del track 4 (-R), 4. Reducir la ganancia de cada subgrupo en 6 dB. Listo, ahora se pueden controlar individualmente las ganancias de los canales M y S. También es posible utilizar el plug-in "S1-Matrix" que realiza éste procedimiento automáticamente en cualquier editor de audio. Se puede ahora reconstruir la imagen estéreo mediante el procedimiento explicado anteriormente o mediante el "S1-stereo imager", asignando como señal de entrada en el control "Input Mode": M - input - S 2.5. Cortando picos. Como ya se dijo, los valores de pico condicionarán el monto de nivel de ganancia que será posible aplicar a una mezcla para obtener un volumen final adecuado al tipo de producción que se esté masterizando. Dado que no se puede superar el valor de 0 dBFS en una grabación digital, éste será entonces el máximo nivel que puede alcanzar cada una de las muestras. Si la diferencia entre valores de pico y de RMS es excesiva, aumentar la ganancia para alcanzar el máximo (sin producir saturación digital) no producirá casi ningún cambio en el volumen general de la mezcla. Al aplicar compresión es posible que muchos picos sean atenuados, pero muchos otros no se verán afectados (o lo serán muy poco) por el procesamiento, será necesario entonces reducir "manualmente" los picos residuales hasta obtener un margen suficiente que permita elevar el valor de RMS de la señal. Cuando esto es necesario se debe reducir el nivel de la porción de la forma de onda que tiene el valor de pico. Primero es necesario determinar el lugar donde se produce un pico. Esto puede hacerse gráficamente buscando un salto abrupto en la forma de onda como muestra la figura 28, luego debe posicionarse el cursor en éste punto para posteriormente realizar zoom hasta conseguir destacar el período donde se produce el valor de pico. También se obtiene el mismo resultado si se utiliza una herramienta que busque automáticamente los valores de pico. En WaveLab (por ejemplo) se pueden encontrar varios picos simultáneamente con la función "Global Analysis" del menú "Analysis". Para ello debe seguirse el procedimiento ya descrito en el capítulo de análisis de una señal: a) Seleccionar toda la forma de onda. b) Seleccionar del menú "Analysis" la función "Global Analysis". c) Apretar el botón "Analyse". d) Poco después se mostrarán los valores de pico en la sección correspondiente de la solapa "Peaks". e) Hacer click en uno de los recuadros que muestran los valores de pico por canal. f) Se pueden crear marcadores en estos puntos o y cerrar la ventana para pasar a la etapa de edición o, g) Se puede desplazar la barra de desplazamiento al principio y apretar el botón "Focus" para posicionar el cursor automáticamente en el primero de éstos puntos. La ventana se minimizará. w w w . c e t e a r . c o m
página
50
Herramientas y procedimientos que se utilizan en el mastering h) Luego de realizado el procedimiento de reducción se debe maximizar la ventana "Global Analysis", desplazar la barra de desplazamiento un paso hacia la derecha y repetir el paso g). Nota: El procedimiento es aplicable al canal en el cual se hizo click en el paso e), luego, debe repetirse el procedimiento para el otro canal. Para reducir el nivel de un pico luego de seleccionado se puede seleccionar el período o semiperíodo donde se produce y atenuarlo utilizando una función para cambiar la ganancia (Change gain) en -2 dB ó -3 dB según que tan cerca del 0 dBFS esté e pico. En algunos casos se puede redibujar la forma de onda con el lápiz cuidando de no introducir distorsiones. Posteriormente conviene suavizar la forma de onda para eliminar posibles click que se hayan introducido en el procedimiento como ya se explicó en el capítulo 1. En algunos editores y workstations se puede automatizar el volumen del período correspondiente al pico, cuando éste puede ser editado gráficamente. Para que pueda conseguirse un incremento apreciable en el valor de RMS, generalmente los valores de pico deben quedar entre -2 dB y -3 dB, lo cual hace bastante tedioso el procedimiento pues debe ser repetido tantas veces como sea necesario. Tal la razón por la cual a veces se recurre al limitador, cuidando de no alterar sensiblemente los ataques de instrumentos que, como la percusión, introducen muchos picos en la mezcla. 2.6. Normalizado. El normalizado (Normalize) es una función que permite modificar el nivel de pico de una señal en forma automática a un valor establecido por el usuario. Viene incluida en todos los programas dedicados al tratamiento de audio digital. Una vez establecido a qué valor se debe ajustar el nivel de pico de la señal, se realiza una medición de los niveles "muestra a muestra" hasta encontrar aquella que tenga el valor de pico máximo. Paso seguido se procede a sumar o restar a cada una (según si el valor introducido es mayor o menor que el medido) una cantidad de decibeles proporcionales a la diferencia entre el valor de pico máximo medido y el nivel de pico máximo establecido por el usuario. La suma y resta es proporcional y depende de la diferencia entre ambos valores y del nivel actual de cada muestra. Es máxima la ganancia o atenuación aplicada (según corresponda) en el pico y nula en aquellas muestras que tengan un valor de -inf dB (lugar donde la forma de onda cambia de polaridad). La figura 29 muestra el resultado de aplicar ésta función a una forma de onda.
Figura 29. Señal de audio original (arriba) y resultante del proceso de normalizado (abajo)
w w w . c e t e a r . c o m
página
51
Herramientas y procedimientos que se utilizan en el mastering Nótese que el valor de pico y los niveles cercanos a él en el original son los que más se amplifican mientras que los niveles inferiores se ven afectados en menor medida por el proceso. Antes de la aparición de herramientas más adecuadas y sofisticadas, éste era el procedimiento digital más utilizado para aumentar el nivel de una mezcla ya que de ésta forma se asegura que no se introducirán saturaciones digitales como puede ocurrir al subir la ganancia en forma "manual". El proceso de normalizado de una señal (en el mastering) requiere que los picos sean reducidos en nivel para obtener un margen mayor hasta el 0 dBFS y así conseguir un aumento sensible en el nivel de sonoridad de la mezcla. Habitualmente el normalizado a escala completa es un proceso que se utiliza luego de todos los pasos descritos hasta aquí, pero como no introduce ningún tipo de distorsión puede ser usado en cualquier momento y repetidas veces a diferencia de la compresión que solo debe ser usada si el sonido lo requiere. Sucede muy a menudo que luego de terminada toda la masterización, al escuchar las pistas una tras otra, se escuchen desbalances en el volumen y esto requiera volver a cortar picos y normalizar. Es posible normalizar todas las mezclas a un mismo valor de pico (menor a 0 dBFS) para tener una idea global del volumen y de los procesos que serán necesarios realizar antes de comenzar a trabajar individualmente sobre ellas. Claro que esto tiene sentido si la masterización se planea realizar íntegramente en el ámbito digital. Finalmente, dentro de las especificaciones técnicas de la compañía replicadora para la recepción de master de producción para la fabricación de CD´s de audio se encuentra la obligación de ubicar los valores entre -3 dB y 0 dB, y el Normalizado de la señal de audio es el proceso más adecuado para esto. 2.7. Maximizado. El maximizado es un proceso que, al igual que el normalizado, permite aumentar el nivel de sonoridad de una mezcla a un valor de pico establecido por el usuario. Pero a diferencia de éste, maximizar una señal produce cambios que pueden afectar drásticamente la materia y la expresión musical. Como se dijo anteriormente, hay músicas que requieren de impacto, otras de detalles y sutilezas expresivas, otras de fuerza rítmica o de acentuaciones, etc. Si no se tienen en cuenta éstas diferencias podemos arruinar totalmente una producción con éste tipo de procesamiento. ¿Cómo funciona un maximizador?. Básicamente, un maximizador es un tipo particular de limitador, con controles que también son habituales en éste último: umbral, valor de pico, tiempo de relevo, etc. La diferencia principal se encuentra en que éste proceso es exclusivo del dominio digital, utilizando un algoritmo de funcionamiento interno particular que pre-muestrea la señal, prediciendo los valores de pico próximos. Para su configuración, primero se debe establecer el máximo valor de pico al que se permitirá llegar a la señal. En algunos aparece como "techo de salida" (out ceiling), tal el caso del L1Ultramaximizer y del L2 (figuras 30 y 31), ambos de Waves. Posteriormente se ajusta el nivel del umbral y finalmente el tiempo de relevo (Release) hasta obtener el resultado deseado. Este procedimiento (aplicable al L1-Ultramaximizer y al L2) es común a la mayoría de los programas de maximizado aunque algunos pueden presentar variantes y controles adicionales (por ejemplo, el Loudness Maximizer de Steinberg).
w w w . c e t e a r . c o m
página
52
Herramientas y procedimientos que se utilizan en el mastering
Figura 30. Interfaz gráfica del L1-Ultramaximizer de Waves.
Existe una versión especial denominada L1-Ultramaximizer+ que incorpora la opción de "dithering".
Figura 31. Interfaz gráfica del L2 Ultramaximizer de Waves.
Similar al anterior, presenta algunos controles adicionales aunque su mayor diferencia radica en que el L2 procesa la señal con una resolución interna de 32 bits, consiguiéndose así una mayor calidad de audio final. El hecho de que valor de pico y umbral sean parámetros diferenciados en el maximizador establece una de las principales diferencias: nunca se podrá sobrepasar el valor de pico, por más bajo que se ubique el umbral. De ésta manera, es posible aumentar el valor de RMS manteniendo los picos siempre en el mismo nivel. A primera vista parece una solución mágica para evitar cortar picos y obtener rápidamente un volumen alto. Y de hecho lo es si se lo utiliza con criterio y cuidado. Pero si se lo usa indiscrimidamente el sonido se irá apretando y apretando contra el techo hasta perderse por completo el rango dinámico. Es que resulta increíble que al bajar el nivel del umbral el sonido siga aumentando de volumen sin escucharse saturaciones, aún cuando los vúmetros de salida no se muevan del pico, llenando por completo todo el rango. Claro que bajo, bombo, tambor, guitarras, teclados, voces, y todos los sonidos presentes suenan como aplastados contra un vidrio… TODO FUERTE. Después que surgieron al mercado era común ver masterizaciones donde el perfil dinámico de la forma de onda era un rectángulo perfecto de principio a fin, sin la más mínima variación dinámiw w w . c e t e a r . c o m
página
53
Herramientas y procedimientos que se utilizan en el mastering ca. Por suerte ahora las cosas parecen estar un poco más equilibradas. Claro que hay músicas donde éste resultado forma parte de la estética, y esto está bien. En el Rap y en el Tecno (por nombrar sólo dos casos) el rango dinámico debe ser el mínimo posible pues la intención musical pasa por otro lado; además, todo el proceso de producción es coherente con el resultado sonoro. Pero, ¿te imaginas una improvisación de Bill Evans, una interpretación de Caetano Veloso, un fraseo de Goyeneche o una sonata de Beethoven pasados por un maximizador?. Cada cosa en su lugar. 2.8. Dithering. El "Dithering" es un proceso que se aplica a las grabaciones digitales para reducir los errores de cuantización. En los pasajes de muy bajo nivel en una señal digital (particularmente durante fades in y outs) o cuando se reduce el número de bits de una grabación (de 24 a 16 bits, por ejemplo) se producen errores en la representación de la señal que son percibidos como ruido digital producto de la distorsión de la forma de onda. En el primer caso las distorsiones se introducen en el momento mismo de la digitalización, mientras que en el segundo son producidos digitalmente por truncamiento de la cadena de bits, al recuantizar la señal luego de procesamientos que hayan aumentado la resolución para evitar pérdidas o cuando se reduce la resolución de mezclas en 24 bits a 16 bits para generar el master para la replicación de un compact disc. Para ocultar éstas distorsiones se agrega a la señal una cantidad controlada de ruido similar a un "hiss" pero de muy bajo nivel, que será preferible al ruido digital producto de las distorsiones. Solo es conveniente agregar dither en el momento de la digitalización y al final de todo el procesamiento. Algunos conversores A/D y D/A de nivel profesional (como el Apogee UV 22) incorporan dither entre sus prestaciones, pero otros no. En ese caso será necesario aplicarlo en el ámbito digital propiamente dicho, al final de toda la cadena de procesadores y faders. Se puede controlar la cantidad y tipo de ruido aplicado mediante parámetros especiales, pero como siempre, no hay reglas para configurarlos, tus oídos deben tomar la decisión final. Los parámetros generales son: Tipo de ruido (Noise Type): determina el método de dithering aplicado. Off o Ninguno (None): no se agrega dither. Tipo 1: ruido genérico. Funciona la mayor parte de las veces. También conocido como ruido de "1 bit". Tipo 2: ruido con frecuencias altas más enfatizadas y de menor nivel que el Tipo 1. Conocido como ruido de "½ bit" Forma del ruido (Noise Shape): altera el carácter del ruido aplicado en el dithering. Presente sólo en algunos procesadores, se puede seleccionar entre Ninguno, Moderado, Normal y Ultra, o entre Off, 1, 2 o 3. Resolución de salida (Output Resolution): Resolución final del archivo de audio después del dithering. En el caso de la masterización para un CD de audio, ésta debe ser obligatoriamente de 16 bits, aunque es posible mantener la resolución original hasta completar todas las pistas y luego ajustar la resolución y la velocidad de muestreo de todas ellas a los estándares de un CD de audio. En las figuras siguientes se muestran el dither interno de WaveLab y la versión de software del Apogee UV22HR (una versión del conversor Apogee UV22).
w w w . c e t e a r . c o m
página
54
Herramientas y procedimientos que se utilizan en el mastering
Figura 32. Etapa de dithering de la sección maestra de WaveLab y sus controles de configuración.
Figura 33. Interfaz gráfica del plug in Apogee UV22-HR y sus controles de configuración.
Hasta aquí los pasos, procedimientos y herramientas más importantes y habituales en el mastering. Ejercitación: Realizar el Trabajo Práctico 3
w w w . c e t e a r . c o m
página
55
w w w . c e t e a r . c o m
página
56
Capítulo 3. Generando el Master para su replicación.
Generando el Master para su replicación Una vez completadas todas las etapas estudiadas en el capítulo anterior para cada una de las mezclas que formarán parte de la producción, corregidos todos los errores digitales, controlado el balance tonal y dinámico de todas ellas, se pasa a la etapa de generación del master que será utilizado para la replicación de CD. En el presente capítulo estudiaremos el estándar mismo de un CD de audio, los soportes que pueden utilizarse para el master que se enviará a la compañía encargada de la replicación, y los procedimientos y cuidados a seguir para la generación del master teniendo en cuenta el proceso mismo de replicación. 3.1. Estandard de un CD de audio. Red Book. En un CD se pueden almacenar datos digitales para diversas aplicaciones, cada una de las cuales requiere de un estándar que permita su replicación y reproducción. En éstos estándares, tanto físicos como lógicos, se establecen como deben ser almacenados y ordenados los datos (estándar lógico) y como deben ser las dimensiones y características constructivas del soporte (estándar físico). El estándar físico, por ejemplo, establece que un CD debe tener un diámetro de 60 mm, un espesor de 1,2 mm y constar de áreas específicas para almacenar distintos tipos de información (por ejemplo, el área de datos está delimitada por dos círculos concéntricos de 58 mm y 25 mm). Para la definición de los estándares lógicos se utilizan subcódigos especiales generados automáticamente o factibles de ser editados con herramientas informáticas especiales. Ambos estándares (físicos y lógicos) son definidos en "libros" (Books) asignándole un color a cada tipo de aplicación: CD audio, Cd-Rom, CD-R, etc.3 En el cuadro siguiente se detallan las denominaciones de los diferentes estándares y sus aplicaciones correspondientes. Estándar Aplicación Red Book
Audio
Yellow Book
CD-Read Only Memory (CD-ROM)
Green Book
CD-Interactive (CD-I)
Orange Book
Recordable CD's (CD-R)
Para la grabación y reproducción de audio debemos entonces ocuparnos principalmente en los estándares Red y Orange Books y sus respectivas aplicaciones. Hasta 1988, la única manera de registrar música en un CD fue a través del moldeado por inyección. Esto tradicionalmente forzó a muchos músicos a realizar sus pruebas registrando su música en cinta y luego enviarlas al fabricante. Esto resultaba un proceso muy costoso y que llevaba mucho tiempo, que excluía a aquellos que no podían permitirse el gasto. En 1988, Phillips y Sony lanzaron las especificaciones para los discos CD-R. Fue bajo estos estándares que los músicos tuvieron las herramientas para grabar información en compact discs en su casa y en el estudio. Ambos tipos de CD´s, si bien compatibles con cualquier reproductor o unidad de CD-Rom, difieren en su construcción y en el procedimiento utilizado para el registro de la información de audio. En un CD de audio replicado comercialmente, la información es estampada en una placa de policarbonato metalizada con una capa delgada de aluminio, la cual servirá como superficie reflectante. Una serie de fosas de forma ovoidal de unos pocos micrones de profundidad harán que el haz de luz emitido por el laser sea reflejado con un cierto retardo. Cuando la reflexión se pro3 Se desconoce la procedencia de éste método de identificación. w w w . c e t e a r . c o m
página
58
Generando el Master para su replicación duce en el interior o en el exterior de una fosa el fotosensor recibe intensidad máxima de luz, lo cual se interpreta como un "0"; cuando el haz pasa por un borde de una fosa se producirá interferencia destructiva entre el haz reflejado dentro y fuera de la fosa, la intensidad lumínica será menor y se interpreta como un "1". En un CD-R, en cambio, la capa de policarbonato es pintada con un tinte orgánico más una delgada capa de oro que funcionará como superficie reflectante. La información es almacenada por quemado del tinte, lo cual crea marcas ópticas que funcionarán de forma semejante a las fosas descriptas anteriormente al alterarse la reflectividad de la capa protectora. Funcionalmente, las marcas ópticas del CD-R y las fosas estampadas del CD-Rom serán interpretadas de forma similar por un reproductor de CD o unidad de CD-Rom. El Red Book define, entonces, las especificaciones de todos los CD´s de audio grabados en todo el mundo y asegura la intercambiabilidad del medio. Las especificaciones para el Red Book son: Especificación Definición Información almacenada Audio con formato estéreo, 16 bits de resolución y 44.1 kHz de veloc. de muestreo System Use Area Contiene el Power Calibration Area (PCA) y el Program Memory Area (PMA) Power Calibration Area Reservada especialmente para la calibración de la intensidad del laser de la grabadora de CD. De esa forma se obtiene la intensidad óptima para el "quemado" del disco. Un área de conteo da información de cuánto espacio queda disponible para éste proceso. Program Memory Area Usada para grabar los número de tracks y sus correpondientos tiempos de comienzo y finalización. Hasta un máximo de 99 tracks pueden ser almacenados en un CD.Cada track puede contener, además, 99 index; puntos que sirven para ubicar lugares específicos pero la mayoría de los lectores los ignoran. Solo dos son generalmente utilizados: index 0 y 1. Information Area Contiene tres áreas primarias: Lead-in, Program y Lead-out. Lead-in Ocupa aproximadamente los dos primeros minutos del compact disc. El principal propósito es almacenar la Tabla de Contenidos (TOC), la cual indica la ubicación de cada track de audio del CD.Es grabada una vez que toda la información de audio ha sido registrada en el disco. Hasta que esto ocurra, el CD sólo puede ser leído por la grabadora (proceso conocido como Track at Once) Program Area Destinada a la grabación de los datos de audio, divididos en tracks.Es posible grabar hasta un máximo de 74 minutos (normalmente) de sonido y 99 tracks en un CD de udio. Cada pista no puede tener una duración menor a 4 segundos.Dentro de cada track, el tiempo es dividido en 75 frames por segundo, no permitiéndose el acceso a los tiempos intermedios entre frames consecutivos.Cada frame consiste en datos de audio, bits de paridad, byte de sin cronización y un byte de control.El byte de control es dividido en 8 subcanales (o sub códigos): P, Q, R, S, T, U, V y W.Solo los subcódigos P y Q son usados en el formato de audio. Los otros se destinan a información del usuario. Subcódigo P Indica qué parte del disco está siendo leída: Lead-in, Program o Lead-out.Además indica los tiempos de comienzo y final de cada track en el disco. Subcódigo Q Es utilizado para mostrar el tiempo de reproducción de cada track.Es dividido en tres modos. Modo 1: Muestra el tiempo transcurrido desde el comienzo del disco (tiempo absoluto) y desde el comienzo del track (tiempo relativo). Modo 2: identifica el nombre del track, artista, lugar y año de grabación.Modo 3: Identifica el número de catálogo del disco. Los Modos 2 y 3 se conocen también como código IRSC (International Estándar Recording Mode) y son usados con propósito de identificación en transmisiones radiales y para derechos de autor .Un Modo especial del subcódigo Q es grabado en el área Lead-in: prohibición contra copia digital y pre-énfasis. Subcódigos R a W La mayoría de los reproductores ignoran los datos de éstos subcódigos. Lead-out Area Consiste de 90 segundos de silencio grabado en el borde exterior del área de datos y sirve para ser usado como buffer. w w w . c e t e a r . c o m
página
59
Generando el Master para su replicación El Lead-in y el Lead-out están grabados en las zonas que más fácilmente se dañan por la manipulación del compact disc y muchos CD´s resultan ilegibles para el reproductor a causa de esto. Los subcódigos P y Q y las pausas entre tracks (tiempo entre los index 0 y 1) pueden ser editados antes de grabar el disco. Veremos mayores detalles de éste proceso más adelante. Pre-énfasis era una opción que se utilizaba para reducir ruidos de alta frecuencia, primero enfatizando las frecuencias agudas en el momento de la grabación del CD y luego cortándolas (deénfasis) en el momento de la reproducción. Constituye una forma rudimentaria de reducción de ruido que en los CD´s actuales ha dejado de usarse. 3.2. Distintos formatos de Masters de Producción para enviar a la compañía replicadora. Técnicamente hablando, el Master es el disco preparado por la compañía para su replicación, también conocido como Glass Master por sus características constructivas únicas. "Masterización", específicamente, se denomina al proceso de codificación del audio digital y señales de control en un "glass master". Así, al proceso de preparación de la información digital para ser enviado a la compañía para su replicación se lo denomina más exactamente "Pre-masterización". En éste apunte se ha utilizado "Masterización" en lugar de "Pre-masterización" porque es habitual utilizar esa denominación en el lenguaje común. Lo que enviamos entonces a la compañía replicadora es un Master de Producción, el cual constará de las pistas (tracks) procesadas y ordenadas con las pausas correspondientes entre ellas. Además, se debe adjuntar la información de producción como ser: nombre de la producción, artista, títulos y autores de las obras contenidas, tiempos relativos y absolutos de cada track, más el fotocromo que se imprimirá en la cara del CD. El Master de producción puede ser enviado en distintos formatos, de los cuales los más utilizados en la actualidad son4: DAT Deben iniciarse a los 2 minutos de la cinta Debe estar grabado en 16 bits y 44.1 kHz en forma análoga o digital. Puede tener una velocidad de muestreo de 48 kHz, pero esto implicará una conversión de formato. No se acepta una velocidad de muestreo de 32 kHz. Todas las pistas deben tener la misma velocidad de muestreo. La generación digital mantendrá los valores de pico de las pistas procesadas pero debe asegurarse la calidad de la transferencia: impedancia del cable de interconexión (75 ohms), estabilidad del clock para no introducir errores digitales (clicks, jitter, etc.). Se puede utilizar transferencia digital en formato S/PDIF pero es mejor, si está disponible, utilizar el formato AES/EBU. Para transferencias y conversiones de formato profesionales es mejor utilizar conversores de alta calidad como el Apogee UV-22. Si no se cuenta con la posibilidad de transferir digitalmente los datos al DAT, se puede hacerlo analógicamente. En ese caso se debe tener cuidado de ajustar el nivel de grabación para que no se produzcan saturaciones digitales y que los valores de pico de cada track se encuentre entre -3 dB y 0 dB. Es conveniente colocar también ID´s en los comienzos de cada track. La grabación debe realizarse en un solo paso. Todas las cintas DAT deben estar acompañadas de una planilla de tiempo que incluya la cantidad total de pistas, los tiempos individuales de cada pista y cualquier otro comentario pertinente : ruidos, efectos especiales (ruidos de vinilo intencionales, loops etc.), defectos de grabación (dropouts, glitches, estática, etc.), niveles bajos, inicios y finales de pistas abruptos, pista/s ocul4 Fuente: EPSA Electrical Products. Bs. As. Argentina. (www.epsa.com.ar/esp_tecn/home_esp.htm) w w w . c e t e a r . c o m
página
60
Generando el Master para su replicación ta/s o extra/s, etc. Las planillas de tiempo incompletas o las cintas DAT que se envíen sin las planillas de tiempo ocasionarán demoras en el procesamiento. No se requieren los códigos de identificación de inicios, pero pueden resultar de suma utilidad en caso de grabaciones en vivo o esfumados cruzados (crossfades)entre pistas. Si se desea que los códigos ISRC, figuren en los CD terminados, éstos deben estar presentes en la planilla de tiempos del DAT. CD-R Audio Es muy utilizado pues resulta una imagen exacta del resultado final. Debe grabarse en una sola sesión (disk at once) para evitar interrupciones en el proceso de quemado entre una pista y otra y a 2x como máximo (aunque es preferible hacerlo a 1x). Debe respetar las especificaciones del "Red Book". Si se desea que los códigos ISRC, figuren en los CD terminados, éstos deben estar presentes en los masters que se reciban en CD y CD-R, de lo contrario se aplicarán recargos. Cinta Exabyte de 8 mm en formato DDP Las cintas de 8 mm también pueden usarse como un formato de ingreso de audio. Se archiva el programa musical en la cinta como un archivo de datos de computadora similar a la información de un CD-ROM. Para que sean compatibles con los sistemas de replicación, las cintas de 8 mm deben estar etiquetadas en sistema ANSI en cartuchos Data Grade (no usar cintas de Vídeo 8), y grabadas en grabadores que no compriman (non-compressing) de 8 mm de alta densidad (Exabyte 8500 u 8505). La información de inicio y fin de la pista debe guardarse en la cinta o en un disquete en un archivo DDP (Disc Description Protocol - Protocolo de Descripción de Disco, según instrucciones de DCA Inc.). Varias estaciones de trabajo que operan sobre discos rígidos, tales como Sonic Solutions, Digidesign, Sadie, etc. ofrecen opciones de salida a 8 mm totalmente compatibles que se completan con generación de archivos DDP. Si se reciben cintas de 8 mm sin los archivos DDP será necesaria una transferencia digital manual (con la consiguiente aplicación de recargos en concepto de pre-masterización). Si se desea que los códigos ISRC figuren en los CD terminados, ya deben estar presentes en el archivo DDP, de lo contrario se aplicarán recargos.
Cualquiera sea el soporte que se envíe a la compañía, siempre deben realizarse backups de los mismos. 3.3. Preparación de las pistas. Una vez finalizado el procesamiento de las pistas y asegurado el balance tonal y dinámico entre ellas, es necesario realizar una edición final previa a la generación del master de producción. Deben cortarse los comienzos y finales de cada una para eliminar espacios de silencio innecesarios. Si bien no hay un tiempo establecido entre el ID de track y el comienzo del audio de una pista, es conveniente que éste sea lo suficientemente corto como para que, una vez que se presione el "Play" en el reproductor, el sonido comience inmediatamente, pero lo suficientemente largo para asegurar que no se perderá información musical. Generalmente, espacios de alrededor de 50 ms son los más adecuados. Tampoco hay espacios preestablecidos para el final de un track. Si las pistas tienen espacios de silencio digital entre ellas (pausas digitales) debe asegurarse de que toda la información musical haya concluido antes de cortarla; y esto incluye también a la reverberación. Es conveniente w w w . c e t e a r . c o m
página
61
Generando el Master para su replicación establecer el punto de corte primero en forma global, buscando que la relajación se escuche "naturalmente". Luego, haciendo zooms alrededor de la posición de corte establecida, confirmar que no se perderá ninguna información sonora y ajustar el fin de la pista entre los 50 y 100 ms posteriores a éste punto. Eliminar el resto. Se debe realizar ahora un fade in al comienzo y un fade out al final de la pista para asegurarse que no se producirán "clicks" en el momento de la reproducción. Debe cuidarse que éstos fades no toquen ninguna porción de audio que corresponda al sonido musical. En algunas ocasiones se deja a la etapa de masterizado la realización de fades outs al final de una canción que deba terminar con éste recurso, pues el proceso es más preciso que en la etapa de mezcla. En éste caso, es mejor realizar el fade gráficamente, mediante la edición de una curva de volumen, antes que automáticamente. Todo lo dicho es aplicable al caso más habitual de un CD que consta de tracks separados por pausas digitales, cada uno conformado usualmente a partir de un archivo de audio individual. Cuando se quiere registrar una grabación "en vivo", la forma más adecuada para reflejar la continuidad del concierto es distribuir los tracks en forma continua, sin pausas digitales, estableciendo el final de cada track exactamente en el tiempo de comienzo del siguiente. Será necesario entonces eliminar las esperas excesivas entre una interpretación y otra pero mantener el sonido del público como enlace entre ellas. Posteriormente se detallará como componer éste tipo de CD. 3.4. Play List. y PQ List Hemos llegado finalmente al momento de generar el master de producción. Es en ésta etapa donde se deben ordenar las pistas y establecer las pausas entre ellas. Para ello se utilizan programas (a áreas de programas) especialmente dedicados a ésta aplicación. Habitualmente, éstos permiten escuchar toda la producción completa, realizar ajustes finales (y así grabarla en un DAT, por ejemplo) y quemar un CD-R de audio En Macintosh el más utilizado es el "Master List CD", mientras que en PC los más completos son: CD-Architect (add-on de Sound Forge) de Sonic Foundry, Basic Audio CD de Steinberg (viene incluido en WaveLab) para ediciones rápidas y Audio Montage (también incluido en WaveLab) para ediciones más sofisticadas. Este proceso final puede describirse en dos etapas o áreas: Play List y PQ List. Aunque habitualmente están integradas en la misma ventana de edición, el Play List es la lista ordenada de las pistas de audio. A veces se incluye en él la posibilidad de realizar ajustes de volumen y seleccionar distintos tipos de fades (in, out, crossfade, etc.) tanto prefijados por el programa como editables gráficamente. También muestra información importante como la duración de cada pista y los códigos de tiempo de comienzo y final de cada una. En el PQ List, en cambio, se editan los subcódigos P y Q, es decir: · Se establecen las separaciones entre las pistas individualmente. · Se puede habilitar o deshabilitar la prohibición contra copia digital. · Se puede habilitar la opción de pre-énfasis. · Se puede incorporar información de código ISRC. En suma, se editan todas las informaciones requeridas para conformar un CD compatible con las especificaciones técnicas del "Red Book". Es posible también utilizar programas dedicados al quemado de CD´s de distinto tipo, entre los cuales se incluye el CD de audio (como el Easy CD Creator de Adaptec5 o el Nero Burning Rom de Ahead) aunque son menos recomendables que los anteriores pues no permiten una edición tan detallada de los subcódigos P y Q. 5 En versiones anteriores de éste programa solo se podían establecer separaciones iguales de dos segundos entre pista y pista o sino pistas continuas (sin pausas). w w w . c e t e a r . c o m
página
62
Generando el Master para su replicación En las figuras 34 y 35 se muestran las interfaces gráficas del Basic Audio CD y del Audio Montage de WaveLab.
Figura 34. Interfaz gráfica del Basic Audio CD de WaveLab.
En la figura 34 se puede observar la lista de pistas (Play List) donde se muestran los códigos de tiempo correspondientes al comienzo (track strart), largo (lenght) y finalización (track end) de cada pista. También pueden observarse los ítems para editar los subcódigos P y Q (PQ List) La columna "pausa" (pause) indica el tiempo de separación de la pista con el track anterior.6 La protección contra copia digital (simbolizada con el ícono de una llave) puede activarse o desactivarse al igual que la opción de pre-énfasis (columna siguiente). El código ISRC puede ser introducido en la columna correspondiente y puede ser independiente para cada track.
Figura 35. Interfaz gráfica del Audio Montage de WaveLab
En la figura 35 puede observarse la naturaleza más compleja y completa de la interfaz gráfica del Audio Montage frente a la del Basic Audio CD, en donde, además del Play List y del PQ List se muestran las formas de onda de los archivos de audio, marcadores indicando comienzo y fin de cada track y una envolvente de volumen posible de ser editado para crear fades in y fades outs así como también cambios en el contornos de volumen dentro de cada pista. Encontrarás un análisis detallado sobre la forma de crear un Audio Montage para generar el master de producción en el archivo "Generando el Master en WaveLab" que se encuentra en la carpeta "Documentos" del CD del curso. Una vez finalizado todo el montaje y asegurado el resultado final, se procederá a grabar el master de producción en algunos de los soportes compatibles para la replicación del CD . 6 La primera pista de un CD debe tener obligatoriamente una pausa de al menos 2 segundos desde el principio de la compilación. w w w . c e t e a r . c o m
página
63
Generando el Master para su replicación 3.5. Información adicional. Si se envía un DAT para la replicación del CD es obligatorio adjuntar una planilla de tiempos y datos importantes. Esta planilla debe incluir: · Nombre del Artista · Título de la producción · Código de identificación de la producción. · Cantidad de pistas · Títulos y autores de cada pista. · Códigos de tiempo de comienzo y fin de cada pista (en formato hh:mm:ss:frames10). Si no se cuenta con la posibilidad de medir los frames (como ocurre en la mayoría de las máquinas de Dats o "Dateras") se debe asegurar que los tiempos incluyan toda la información de audio de cada una. · Tiempo total · Habilitación o no de pre-énfasis y protección contra copia digital. · Información de Código ISRC (si se desea incluir en la producción). · Otros datos que se consideren relevantes (ruidos introducidos a propósito, efectos que podrían ser interpretados como ruidos, etc.) Además, se debe enviar el fotocromo que se imprimirá en la cara superior del CD9. Si se envía un CD-R de audio no es necesario adjuntar la planilla de tiempos pero sí los datos de la producción y otros que se consideren importantes. Las opciones de protección contra copia digital, pre-énfasis y el código ISRC (si se desea incluirlas) deberán estar registradas en el propio CD. Para el caso de enviar cintas de 8 mm se debe adjuntar también el archivo DDP (generalmente almacenado en disquete). De todas maneras es conveniente enviar la planilla de tiempo completa para evitar errores o malas interpretaciones al momento de la producción. Si la producción está orientada a la replicación en cassette (además de CD), se debe indicar hasta que pista se deben incluir en al lado A y desde que pista en el lado B. A veces sucede que el ordenamiento del CD no se adecua al cassette ya que puede quedar mucho tiempo de cinta en blanco en el lado A antes de pasar al B, en éste caso será necesario un reordenamiento de las pistas y el envío de un segundo master (con la consiguiente planilla de tiempos) claramente identificado para tal fin11. Perfectamente puede ser el ordenamiento del master de CD distinto del master de cassette, pero la decisión debe tomarla la producción artística del proyecto. Ejercitación: Realizar el Trabajo Práctico 4
9 Para grabar una cinta Exabyte de 8 mm en formato DDP es necesaria una aplicación especial dedicada a tal fin. Existe un producto llamado DDP-Solution que se agrega a WaveLab y que permite generar éste tipo de archivo desde una imagen del CD almacenada en el disco rígido de la computadora, la cual puede ser generada en el propio Audio Montage. 10 Recuerda que cada segundo del CD está dividido en 75 frames y no en milisegundos. 11 Es conveniente que el lado A sea de mayor duración que el lado B para evitar esperas innecesarias en el momento de la reproducción. w w w . c e t e a r . c o m
página
64
Trabajos Prácticos
Trabajos Prácticos Trabajo Práctico 1 Para la realización de éste trabajo práctico de debe completar previamente el estudio del capítulo 1 del apunte del curso "Preparando el material" (pag. 15). Análisis y restauración de una grabación Enunciado: Determinar y corregir errores y ruidos en una grabación de audio digital. Procedimiento: a) Abre en WaveLab el archivo "TP1a.wav" que se encuentra en la carpeta "Trabajos Prácticos/TP1" del CD. b) Abre la planilla "Planilla de Trabajo Práctico 1" de la carpeta "Planillas TP" del CD. c) Escucha atentamente la grabación y determina el/los errores presentes en las mismas. d) Señala en la planilla el error correspondiente. e) Restaura la grabación. y detalla en la planilla el/los procedimientos utilizados para corregirlos. f) Guarda el archivo procesado con el nombre "Maxxx TP1a corregido.mp3". Donde xxx es el número de ID del alumno. g) Repite el procedimiento para cada uno de los archivos de la carpeta TP1 (total 5 archivos) y guarda las correcciones con su nombre correspondiente. Al finalizar guardasla planilla completa como MAxxxTP1.doc Importante: Ver archivo "EJEMPLO TERMINADO DE PLANILLA DE TP1"
Archivos a enviar: 5 archivos mp3 y un archivo de word Total 6 archivos
w w w . c e t e a r . c o m
página
67
Trabajos Prácticos TP2. Análisis del master de mezcla Para la realización de éste trabajo práctico de debe completar previamente el estudio del capítulo 1 del apunte del curso y consultar los capitulos "Ayuda básica de WaveLab 4" (pág. 101) y "Análisis de una señal de audio" (pág. 75) que se encuentran en el presente apunte. Enunciado: Completar los aspectos analíticos de la planilla de masterización. Procedimiento: a) Abrir la planilla de masterización: "Planilla de trabajo Práctico 2.doc" ([CD]:\Trabajos Prácticos\Planillas TP) b) Completar "Fecha": (fecha de iniciación del trabajo) c) Completar "Ingeniero": (nombre y apellido del alumno e ID de alumno correspondiente) d) Abrir el software de masterización ("WaveLab 4"). e) Abrir el archivo "Mezcla1.wav" y escucharlo atentamente. f) Completar los items "Sample Rate", "Resolución" y "Canales" del rubro "Master de mezcla". Puedes leerlos en la barra de estado de WaveLab o en Menú "File"-Submenú "Information" del mismo software. g) Realizar un análisis global: En WaveLab, seleccionar todo el archivo (doble click en ventana de forma de onda), menú "Analysis", submenú "Global analysis". En la ventana emergente apretar el botón "Analyse". h) Trasladar los datos del ítem "Maximum" de la solapa "Peaks" al rubro "Estadística" ítem "Picos" de la planilla de trabajo práctico 2, canales Left y Right. i) Realizar lo propio desde el ítem "Maximum" de la solapa "Loudness" de la ventana de análisis al rubro "Estadística" ítem "RMS" de la misma planilla. j) Escribe en el rubro "COMENTARIOS" un párrafo sintético sobre tu impresión del sonido general de la grabación, del equilibrio de instrumentos y del sonido de los mismos. k) Repite los pasos a) a j) para los archivos "Mezcla 2.wav" y "Mezcla 3.wav". l) Guarda la planilla en tu disco rígido como "MAxxx Planilla de Mezcla TP2.doc".
Archivos a enviar: Planilla de Trabajo Práctico 2 completa. Total: 1 archivo.
w w w . c e t e a r . c o m
página
68
Trabajos Prácticos TP3. Ecualización y Compresión Para la realización del presente trabajo práctico se debe completar el estudio de las secciones 2.1 a 2.3 del capítulo 2 del apunte del curso y consultar los capitulos "Ayuda básica de WaveLab 4" (pág. 101) y "Guardar y cargar configuraciones en los plug ins de Waves" (pág. 97) que se encuentran en el presente apunte.
3.1.
Ecualización.
Enunciado: Usando ecualizadores paramétricos, equilibrar el balance tonal de cada una de las pistas de la producción, aplicando ganancia o atenuación, según corresponda, en los rangos de frecuencias con exceso o defecto de sonoridad, atendiendo al sonido de las voces e instrumentos individuales y a su interrelación, de acuerdo al género y estilo de la canción u obra. Procedimiento. 1. Abrir WaveLab. 2. Abrir el archivo "Mezcla1.wav". 3. Ajustar el nivel de monitoreo para una audición cómoda y a la vez detallada de la señal de audio. 4. Escuchar atentamente la sonoridad general, instrumentación y estilo, tratando de determinar frecuencias y rangos de frecuencias faltantes o sobresalientes tanto en el sonido de los instrumentos y voces individualmente como así también en toda la mezcla. Detectar posibles contradicciones (p. ej., el sonido general es opaco pero los platillos suenan demasiado brillantes para el contexto). 5. Insertar el plug-in "Waves Req 6 bands" en la sección "Efectos" del Master. 6. Compensar las deficiencias de ecualización detectadas en el punto 3, configurando frecuencia de corte, ancho de banda y tipo de filtro adecuado para cada caso. 7. Escuchar el resultado de la ecualización en tiempo real y ajustar los parámetros hasta obtener el resultado deseado, cuidando el balance instrumental. Utilizar análisis espectral por FFT como apoyatura del proceso de ecualización. 8. Guardar la configuración del plug-in a disco con el nombre "MAxxx EQ TP2 M1.xps" Preset "solo EQ" 9. Repetir los pasos 2) a 7) para el archivo Mezcla 2 y guardar la configuración del plugin a disco con el nombre "MAxxx EQ TP2 M2.xps" Preset "solo EQ". 10.Repetir los pasos 2) a 7) para el archivo Mezcla 3 y guardar la configuración del plugin a disco con el nombre "MAxxx EQ TP2 M3.xps" Preset "solo EQ". 3.2.
Compresión:
Enunciado: Usando compresión, equilibrar el rango dinámico de cada una de las pistas de la producción, atendiendo a los valores de pico, el ensamblado del sonido global, aumentando o disminuyendo el impacto rítmico según sea necesario de acuerdo al género o estilo de la canción u obra. Procedimiento 1. Abrir "WaveLab". 2. Abrir el archivo "Mezcla 1.wav". w w w . c e t e a r . c o m
página
69
Trabajos Prácticos 3. Ajustar el nivel de monitoreo para una audición cómoda y a la vez detallada de la señal de audio. 4. Escuchar el nivel de volumen general y estudiar la relación entre valores de pico y RMS. 5. Determinar, de acuerdo al estilo musical, la necesidad de acentuar o atenuar las diferencias de nivel entre los planos sonoros, el "punch" de la mezcla, las acentuaciones rítmicas, etc. 6. Evaluar la cantidad de compresión aplicada en la mezcla, tanto a los instrumentos y voces individualmente como así también al todo el conjunto. Determinar la coherencia de éstos resultados con lo observado en el punto anterior. 7. Insertar el plug-in "Waves RComp" en la sección "Efectos" del master. 8. Mientras se reproduce el archivo, ubicar el umbral (Threshold) aproximadamente entre los picos y el valor promedio. 9. Con ataque (Attack) relativamente rápido y tiempo de relevo (Release) relativamente lento ajustar la relación de compresión (Ratio) para obtener una reducción de aproximadamente 2 a 3 dB. 10.De acuerdo al resultado obtenido y a las conclusiones de los puntos 5 y 6, ajustar los parámetros del compresor. 11. Aumentar la ganancia de salida hasta obtener picos cercanos a 0 dB cuidando de no introducir saturaciones digitales. 12.Guardar la configuración del compresor a disco con el nombre "MAxxx Comp TP2 M1.xps "Preset "Solo Comp". 13.Repetir los pasos 2) a 11) para el archivo Mezcla 2 y guardar la configuración del plugin a disco con el nombre "MAxxx Comp TP2 M2.xps" Preset "solo Comp" 14.Repetir los pasos 2) a 11) para el archivo Mezcla 3 y guardar la configuración del plugin a disco con el nombre "MAxxx Comp TP2 M3.xps" Preset "solo Comp".. 3.3.
Uso combinado de ecualización y compresión.
Enunciado: Partiendo de las configuraciones establecidas en los pasos anteriores, encadenar y ajustar los parámetros de ecualizadores y compresor según sea necesario. Procedimiento 1. Abrir "WaveLab". 2. Abrir el archivo "Mezcla 1.wav". 3. Insertar los plug-ins "Waves Req 6 Bands" y "Waves RComp" en la sección "Efectos" del master en ese orden. 4. Cargar las configuraciones de ecualización y compresión guardadas en los pasos 3.1 y 3.2 para ésta mezcla. Con los procesadores activos, reproducir el archivo y determinar si interactúan constructiva o destructivamente y en cuales aspectos se ven afectados. 5. Realizar los ajustes necesarios en cada uno de los procesadores para compensar las deficiencias. 6. Guardar a disco las nuevas configuraciones como nuevo preset en los archivos "MAxxx EQ TP2 M1.xps" y "MAxxx Comp TP2 M1.xps" con los nombres "EQ final" y "Comp final" respectivamente. Para ello, aplicar el procedimiento de guardado de presets explicado en el capítulo "Guardar y cargar configuraciones en los plug ins de Waves" 7. Repetir los pasos 2) a 5) para el archivo "Mezcla 2.wav" w w w . c e t e a r . c o m
página
70
Trabajos Prácticos 8. Guardar a disco las nuevas configuraciones como nuevo preset en los archivos "MAxxx EQ TP2 M2.xps" y "MAxxx Comp TP2 M2.xps" con los nombres "EQ final" y "Comp final" respectivamente. 9. Repetir los pasos 2) a 5) para el archivo "Mezcla 3.wav" 10.Guardar a disco las nuevas configuraciones como nuevo preset en los archivos "MAxxx EQ TP2 M3.xps" y "MAxxx Comp TP2 M3.xps" con los nombres "EQ final" y "Comp final" respectivamente. Notas: 1) No olvidar realizar comparaciones periódicas entre la mezcla procesada y la original, desactivando todos o cada uno de los procesadores en forma individual. 2) No procesar los archivos de mezcla originales (Render).
Archivos a enviar: 3 archivos de configuración de EQ (conteniendo 2 presets cada uno: EQ solo y EQ final. 3 archivos de configuración de Compresión (conteniendo 2 presets cada uno: Comp solo y Comp final. Total: 6 archivos con extensión .xps
w w w . c e t e a r . c o m
página
71
Trabajos Prácticos TP4. IMAGEN ESTEREO Y MAXIMIZADO. Para la realización del presente trabajo práctico se debe completar el estudio del capítulo 2 del apunte del curso y consultar los capitulos "Ayuda básica de WaveLab 4" (pág. 101) y "Guardar y cargar configuraciones en los plug ins de Waves" (pág. 97) que se encuentran en este apunte. Enunciado: Partiendo de las configuraciones de ecualización y compresión establecidas en el trabajo práctico 2, controlar la imagen estéreo y el nivel general de cada una de las mezclas. Procedimiento: 1. Abrir "WaveLab" 2. Abrir el archivo de audio Mezcla 1.wav". 3. Insertar los plug ins "Waves Req 6 Bands" y "Waves RComp" en la sección "Efectos" del master en ese orden. 4. Cargar las configuraciones de ecualización (MAxxx EQ TP2 M1) y compresión (MAxxx Comp TP2 M1) del trabajo práctico 2. 5. Seleccionar Presets "EQ final" y "Comp final". 6. Escuchar atentamente toda la pista y determinar la necesidad o no de la corrección de la imagen estéreo. Realizar el análisis utilizando la herramienta "Phase Scope" de WaveLab para complementar la audición. 7. Evaluar el nivel general de la pista y observar la diferencia entre valores de pico y de RMS (ayudándose con la herramienta "Level/Pan Meter"). Determinar, de acuerdo a lo observado y al estilo musical, si es necesario cortar picos y normalizar o aplicar maximizado. 8. Insertar el plug in "Waves S1-shuffler" después del compresor y realizar los ajustes necesarios de acuerdo a lo observado en el punto 6. 9. Insertar el plug in "Waves L1-Ultramaximizer+" en la sección "Dithering" del master y realizar los ajustes necesarios de acuerdo a lo observado en el punto 7. Configurar también los parámetros de dithering. 10.Reajustar (de ser necesario) los parámetros de todos los plug ins hasta obtener el sonido deseado. 11. Guardar a disco rígido todas las configuraciones de los procesadores, con las siguientes denominaciones: "MAxxx EQ TP3 M1.xps" Preset "EQ final mastering", "MAxxx Comp TP3 M1.xps" Preset "Comp final mastering", "MAxxx Estéreo TP3 M1.xps" Preset "Estéreo final mastering" y "MAxxx Maximizer TP3 M1.xps" Preset "Maxim final mastering". 12.Repetir los pasos 2) a 10) para el archivo "Mezcla 2.wav". 13.Guardar a disco rígido todas las configuraciones de los procesadores, con las siguientes denominaciones: "MAxxx EQ TP3 M2.xps" Preset "EQ final mastering", "MAxxx Comp TP3 M2.xps" Preset "Comp final mastering", "MAxxx Estéreo TP3 M2.xps" Preset "Estéreo final mastering" y "MAxxx Maximizer TP3 M2.xps" Preset "Maxim final mastering". 14.Repetir los pasos 2) a 10) para el archivo "Mezcla 3.wav". 15.Guardar a disco rígido todas las configuraciones de los procesadores, con las siguientes denominaciones: "MAxxx EQ TP3 M2.xps" Preset "EQ final mastering", "MAxxx Comp TP3 M2.xps" Preset "Comp final mastering", "MAxxx Estéreo TP3 M2.xps" w w w . c e t e a r . c o m
página
72
Trabajos Prácticos Preset "Estéreo final mastering" y "MAxxx Maximizer TP3 M2.xps" Preset "Maxim final mastering".
Nota: No procesar los archivos originales hasta tanto no se reciba la aprobación del trabajo práctico. Archivos a enviar: 3 archivos de configuración de EQ (conteniendo 1 preset cada uno: EQ final mastering 3 archivos de configuración de Compresión (conteniendo 1 preset cada uno: Comp final mastering. 3 archivos de configuración de Imagen estéreo (conteniendo 1 preset cada uno: Estéreo final mastering 3 archivos de configuración de Maximixado (conteniendo 1 preset cada uno: Maxim final mastering. Total: 12 archivos con extensión .xps
w w w . c e t e a r . c o m
página
73
Trabajos Prácticos TP5 Generación del master Para la realización del presente trabajo práctico se debe completar el estudio del capítulo 3 del apunte del curso y consultar los capitulos "Ayuda básica de WaveLab 4" (pág. 101) y "Generando el Master en WaveLab" (pág. 83) que se encuentran en éste apunte. Enunciado: Luego de procesar los archivos de audio correspondientes a las tres mezclas con las configuraciones de los procesadores del TP4, generar el master compatible con el estándar de audio CD (Red Book) para la replicación de la producción. Procedimiento: 1. Abrir "WaveLab". 2. Abrir el archivo de audio de la mezcla 1 (.wav). 3. Insertar en el master los procesadores "Waves Req 6 Bands", "Waves RComp", "Waves S1-shuffler" y "Waves L1-Ultramaximizer+" en el orden y ubicación definidos en el trabajo práctico 4. 4. Cargar los archivos de configuración y presets finales de cada uno. 5. Procesar el archivo con éstas configuraciones y guardarlo con el nombre "Mezcla 1 masterizado" (Consultar el archivo "Ayuda básica de WaveLab 4" sección 3.d. para más precisiones sobre como realizar el procedimiento de aplicación de procesadores a un archivo de audio). 6. Repetir los pasos 2 a 5 para las mezclas 2 y 3. 7. Crear un nuevo "Audio Montage". 8. Cargar las pistas procesadas (orden a elección). 9. Cortar comienzo y final. 10.Editar fade in y fade out de cada una (de ser necesario). 11. Ajustar las separaciones entre las pistas a 4 segundos. 12.Realizar ajustes finales de volumen (de ser necesario). 13.Insertar marcadores de comienzo y final de tracks de CD en cada pista. 14.Guardar el "Audio Montage" con el nombre "Maxxx Master final.mon". Nota: Controlar que la lista de tracks de CD es válida. Archivo a enviar: 1 archivo de Audio Montage con el nombre "MAxxx Master final.mon"
w w w . c e t e a r . c o m
página
74
Análisis de una señal de audio en WaveLab 4
Análisis de una señal de audio en WaveLab 4 Análisis de una señal de audio en WaveLab 4 WaveLab 4 incorpora varias opciones de análisis que son de mucha utilidad para trabajar con audio digital. Todas las opciones analíticas están incorporadas en el menú "Análisis" (Analysis), el cual se incorpora a la barra de menú cuando se abre un archivo. En éste menú se encuentran varias opciones, las cuales se muestran en la figura.
Nos ocuparemos aquí de las que resultan útiles para la masterización. Algunas de ellas trabajan en tiempo real (analizan la señal mientras ésta es reproducida), mientras que otras necesitan que se haya seleccionado una parte o todo el contenido del archivo de audio. De éstas últimas, "Análisis global" (Global Analysis) es una de las de mayor utilidad para el mastering. Una vez seleccionado todo el contenido del archivo (Edit / Select / All o Ctrl + A) o una parte del mismo, al seleccionar "Global analysis" aparecerá la siguiente ventana.
Solapa donde se mostrarán los valores de Pico de la señal Se mostrarán la cantidad de Glitches y Clipp´s encontrados.
En ésta solapa se mostrarán los valores de RMS para cada canal de la señal. Valor de DC offset encontrado en cada canal de audio Frecuencia promedio del área seleccionada con altura musical aproximada
Primero se debe apretar el botón "Analyse". Luego de un momento se completarán los ítems con los datos resultantes. w w w . c e t e a r . c o m
página
76
Análisis de una señal de audio en WaveLab 4 Al hacer click sobre un valor remarcado, se activarán las funciones: "Number of Hot Pionts" (permite seleccionar cada uno de los puntos de la señal que se corresponden con las datos encontrados para cada tipo de análisis), "Create markers at hot points" (creará un marcador en cada uno de los puntos encontrados) y "Focus" (posicionará el cursor en el punto seleccionado por el control "Number of hot points" y se minimizará la ventana "Global analysis". En las figuras siguientes se puede observar los resultados de los distintos análisis para un archivo de audio.
Cada análisis tiene controles especiales para ajustar los parámetros de búsqueda correspondientes, como se observa en las distintas pantallas de la figura anterior. w w w . c e t e a r . c o m
página
77
Análisis de una señal de audio en WaveLab 4 Varias de ellas tienen casillas de verificación para incorporar (si está tildada) o no un ítem al análisis global. Según el tipo de análisis, se incorporan controles de reporte para limitar el número de puntos a una cantidad determinada o para no reportar puntos que se encuentren a menor distancia que la especificada y otros que permiten limitar la búsqueda. De éstos últimos requieren una explicación adicional los parámetros incorporados en la solapa "Errores" (Errors). Como se explica en el apunte, los "Glitches" constituyen alteraciones en la contigüidad de valores de muestra (cambios de nivel) y en la continuidad de la forma de onda, para ajustar que tan drásticos tienen que ser los cambios de nivel para que sea reportado un glitch se incorpora el control "Umbral" (Threshold), y para controlar cuanto tiempo se debe exceder el umbral para que sea reportado un glitch se incorpora el control "Sensibilidad" (sensitivity), en ambos casos, mientras más alto el valor menos sensible la detección. Puede suceder que se reporten como glitches en los ataques de sonidos como tambor, toms, etc., (en cuyo caso será necesario aumentar los valores) o que no se reporten otros que sí lo son (en cuyo caso habrá que disminuirlos). Pero a veces se presentan contradicciones entre ambas situaciones, y por ello, la mejor manera de detectar éstos errores es escuchándolos. Como ya dijimos, otros análisis de la señal se realizan en tiempo real, mientras se reproduce el archivo de audio. Level / Pan Meter. La parte superior muestra el nivel de pico por canal (barras exteriores) y la sonoridad promedio (barras interiores). El medidor de picos muestra los valores de pico para cada canal, gráfica y numéricamente. Por defecto, los valores son mostrados en verde cuando el pico es menor a -6 dB, de -6 dB hasta 2 dB, los valores se muestran en amarillo, y valores superiores a -2 dB son mostrados en rojo. El Vúmetro mide valores promedio de sonoridad para cada canal, gráfica y numéricamente. Por su respuesta más lenta (el vúmetro tiene inercia), se acerca más a la respuesta del oído humano que el medidor de picos, es decir, nos da una idea más adecuada del nivel de la señal. Si hay mucha diferencia entre los valores de pico y los de RMS, o los de pico son cercanos a 0 dB mientras que los de RMS son muy bajos, la señal será más débil a nuestra percepción, y se necesitará comprimirla o limitarla para aumentar su volumen sin introducir saturación digital. Los valores entre corchetes indican la diferencia entre los valores máximos y mínimos más recientes de RMS, lo cual da una idea del rango dinámico de la señal. Debajo se encuentra los medidores de paneo (Pan Meters) que miden la diferencia de nivel entre los canales izquierdo y derecho, situación aplicable solamente a señales estéreo. El medidor superior muestra las diferencias de niveles de pico entre ambos canales, gráfica y numéricamente, mientras que el inferior muestra la diferencia promedio en sonoridad, también gráfica y numéricamente. Esto nos da una indicación visual sobre el grado de "centrado" de la imagen estéreo. w w w . c e t e a r . c o m
página
78
Análisis de una señal de audio en WaveLab 4 Phase Scope Esta herramienta de análisis nos permite monitorear de una manera más precisa la imagen estéreo, al mismo tiempo que mide la correlación de fase de ambos canales. La parte superior muestra gráficamente la distribución "espacial" de la señal. La posición de escucha se encuentra en el cruce de ambos ejes, el canal izquierdo en el extremo del segmento a 45º en el cuadrante superior izquierdo, y el canal derecho en el extremo del segmento a 45º del cuadrante superior derecho. Si la señal es mono, la gráfica se transforma en una línea vertical que pasa por el cruce de ejes, en cambio, mientras mayores sean las diferencias entre ambos canales, la gráfica tenderá a formar una nube más o menos difusa. Si ésta nube tiende a ubicarse verticalmente, ambos canales estarán equilibrados, mientras que si tiende a volcarse hacia la izquierda o hacia la derecha, la imagen estéreo también estará corrida hacia un lado. Tal representación gráfica está en relación directa con la diferencia (o correlación) de fase entre ambos canales, la cual es monitoreada en la parte inferior sobre la regla horizontal. En una señal mono, ambos canales son iguales y se dicen que están "en fase". En la regla se visualizará la línea vertical en el extremo derecho (+1). Si corremos la señal de un canal con respecto a la del otro se producirá una diferencia de fase, y la línea vertical se correrá hacia la izquierda. También ocurrirá lo mismo si ecualizamos de forma diferente ambos canales de una señal mono o si ubicamos fuentes distintas en cada uno de ellos. Típicamente, una señal estéreo mostrará la línea oscilando alrededor de "0". Si invertimos la señal de un canal con respecto al otro en una señal mono, de tal forma que a una porción positiva de la forma de onda de un canal le corresponda la misma forma pero negativa en el otro, ambos canales estarán "fuera de fase" (o en contrafase) y la línea se ubicará en el extremo izquierdo (-1). Esta medida es muy importante ya que señales en contrafase se anularán al escucharlas en un sistema mono. Imagina lo que pasaría si una grabación estéreo es reproducida por una radio AM mono y ambos canales estuvieran fuera de fase "y ahora escucharemos la grabación"… [silencio absoluto]). Sin llegar a tal extremo, cuando sonidos complejos están fuera de fase (como el de un piano al que se los grabó con dos micrófonos sin tener en cuenta su posición relativa) pueden producirse cancelaciones parciales, algunos armónicos podrían estar en contrafase y cambiaría el balance tonal si se lo escucha en sistemas estéreo o mono. Por último, un sistema de reproducción estéreo puede pensarse formado por un canal izquierdo y uno derecho (los altavoces reales) más un canal central "virtual" del cual surgen los sonidos que son idénticos en los reales. En éste canal se ubicarán las señales en fase o prácticamente en fase (como la del cantante de la banda); si por alguna razón se ponen en contrafase los canales izquierdo derecho, el resultado sería similar a apagar el canal central, produciéndose un "pozo" en la imagen estéreo y una sensación muy extraña, casi de mareo. Puedes experimentarlo simplemente abriendo una grabación cualquiera (será más notable el efecto en una mono, pero ocurre también en las estéreo) e invirtiendo un canal con respecto al otro, para ello, selecciona todo el archivo, abre el menú "Process" y luego "Invert phase". Escucha y w w w . c e t e a r . c o m
página
79
Análisis de una señal de audio en WaveLab 4 monitorea la señal con el medidor de fase. Aprieta el botón "mono" de la sección maestra, si la señal era mono, no se oirá nada, si era estéreo, quedará un residuo o cambiará drásticamente el balance tonal. Dicho sea de paso, ésta es la forma en la que trabajan algunos karaokes, solo que contienen algunos controles extras para compensar las pérdidas. Análisis espectral WaveLab cuenta con dos formas de análisis espectral: medidor de espectro de 60 bandas y analizador de espectro por transformada rápida de Fourier (FFT). "Spectrum me ter" divide el rango audible en 60 bandas de frecuencia, mostrando un análisis detallado del balance espectral de la señal de audio en forma de diagrama de barras. Este tipo de análisis es útil cuando se quiere tener una idea global de la envolvente espectral de la señal ya que no da la posibilidad de obtener datos precisos de frecuencias y niveles, o cuando se piensa utilizar ecualizadores gráficos. En la figura se muestra un análisis del ruido rosa (que se percibe como sonido "plano" auditivamente). "FFT Meter" muestra un análisis espectral basado en la transformada rápida de Fourier (Fast Fourier Transform) el cual representa la envolvente espectral de la señal en forma continua como se ve en la figura. Además de ser más preciso que el anterior, permite medir valores de frecuencia y nivel en el punto donde se posiciona el cursor. Los valores correspondientes se muestran en el recuadro a la derecha de la barra de herramientas. Entre otras ventajas de éste tipo de análisis se encuentra la posibilidad de restringir el rango de frecuencias y niveles (en al anterior éstos son fijos), y de sacar una fotografía (sanpshot) para realizar mediciones aún más precisas. En la figura se observa el análisis de frecuencia del mismo ruido rosa mostrado anteriormente. Es más adecuado para el uso de ecualizadores paramétricos. Medición de bits WaveLab cuenta con ésta herramienta para analizar la integridad de la resolución (en bits) de la señal de audio digital. En los pasajes de bajo nivel, cuando se procesa o cuando se reduce la resolución (de 24 bits a w w w . c e t e a r . c o m
página
80
Análisis de una señal de audio en WaveLab 4 16 bits por ejemplo) de una señal de audio digital se introducen deformaciones conocidas como "errores de cuantización". En los pasajes de bajo nivel solo unos pocos bits son utilizados para representar la señal; al utilizar ciertos procesamiento (como la normalización o el cambio de ganancia), algunos números resultantes de la operación pueden caer entre dos valores consecutivos (un paso) de la resolución; cuando se utilizan plug-ins, se eleva la resolución para realizar el procesamiento, luego, se deben truncar los datos para recuperar la cantidad de bits originales. Como consecuencia, la cantidad de bits resultante puede ser sensiblemente menor a la deseada (una señal que originalmente es de 16 bits puede resultar finalmente de 12 bits), y esto implica la adición de un ruido muy desagradable (similar a un gruñido) a la señal original. En WaveLab se utilizan palabras de 32 bits punto flotante para realizar procesamientos, tanto en ajuste de nivel, agregado de efectos, mezcla de dos o más archivos, etc. Cuando a una señal de 16 bits se la reproduce sin aplicar fades ni efectos y sin ningún ajuste en el volumen maestro (Master Faders) es el único momento en que no se realizan cambios en la resolución. Esto se puede observar reproduciendo un archivo de audio de 16 bits mientras se visualiza el medidor de bits, si no hay problemas de resolución, la parte inferior del medidor debería quedar fija en "16" (como se observa en la figura de arriba), tan pronto como se suban o bajen los controles de volumen del Master la imagen cambiará llenándose todo el medidos y se encenderá el indicador "Inter", como muestra la figura sig. Como leer el medidor de bits. Bits en uso
Menú "Settings"
Puede funcionar de dos maneras: · En "Intuitive mode" se muestra la cantidad de bits en forma proporcional al nivel de señal. · En "True Mode" se muestra la cantidad de bits independientemente del nivel se la señal. Se puede elegir entre ambas opciones en el menú "Settings"
Contiene opciones para personalizar el medidor de bits.
Medidor "histórico" Muestra los bits recientemente en uso
Indicador "inter"
Indicador "below"
Se enciende el segmento "inter" cuando se detecta una señal que no puede ser expresada en una escala regular de 24 bits (hay valores de punto flotante "entre los bits"). Es el caso típico si se usan efectos, etc.
Se enciende cuando la señal supera los 24 bits. El medidor muestra los 24 bits superiores y el segmento "below" indicará la presencia de bits extras (bits inferiores).
Las aplicaciones usuales del medidor de bits son: · Para establecer si es necesario o no aplicar "Dither". Típicamente, si una señal de 16 bits es reproducida y el medidor muestra más bits en uso, será necesario aplicarlo. · Para visualizar la resolución real de un archivo de audio. w w w . c e t e a r . c o m
página
81
w w w . c e t e a r . c o m
página
82
Generando el Master en WaveLab.
Generando el Master en WaveLab. Generando el Master en WaveLab. Existen dos formas de realizar una lista de reproducción de archivos de audio (Play List) en WaveLab 4, especificando no solo el orden en que tienen que ser reproducidas sino también estableciendo tiempos de espera entre ellas, datos de producción, etc., es decir, respetando el estándar del CD de audio conocido como "Red Book". Además, en ambas se puede quemar un CD de audio que puede ser utilizado como Master de pre-masterización para la replicación de la producción. Basic Audio CD La primera, y más sencilla, es creando un archivo "Basic Audio CD". Para ello se debe elegir la opción "New" del menú File (o haciendo click en el ícono correspondiente) y luego seleccionar "Basic Audio CD". Se abrirá una ventana como la de la figura
Luego de hacer click se desplegará un menú como el siguiente: Hacer click para desplegar el menú de opciones
Seleccionar para agregar una nueva pista.
Se abrirá una ventana de exploración para seleccionar el primer archivo de audio. Una vez realizada la selección se nos preguntará si queremos agregar marcadores de CD track (CD-track markers) en caso de que no hayamos realizado ésta operación previamente. Al responder afirmativamente, WaveLab los agregará al principio y final del archivo, teniendo luego la posibilidad de editarlos en caso de haber espacios de silencio que no deben incluirse en el track. Se agregará el archivo a la lista de reproducción mostrándose, además del nombre del archivo, el tiempo de comienzo y duración de la pista y prohibición contra copia digital habilitada (por defecto).
Hacer click en el signo + para abrir la información de tiempo del track
Hacer doble click para abrir la ventana forma de onda del archivo de audio. En ella se pueden correr los marcadores de CD track (triángulos rojos) para ajustar el comienzo y fin de cada track de forma de eliminar espacios de silencio innecesarios.
w w w . c e t e a r . c o m
página
84
Generando el Master en WaveLab. Haciendo click en el signo "+" de la pista se desplegará la información de tiempo de la pista, como muestra la figura. Esta información incluye: a)
Pausa (pause): tiempo de espera entre el track actual y el anterior o espera desde el comienzo del CD en caso de tratarse del track 1. Para cambiarlo se debe hacer doble click en el código de tiempo de la columna "Start".
b)
Track Start: tiempo relativo de comienzo del track y duración de la pista.
c)
Track End: tiempo relativo de finalización del track. Depende de la ubicación de los marcadores de CD track.
El código de tiempo utilizado responde a la forma minuto: segundo: frame (de CD) (mm:ss:ff). Debe recordarse que en un CD de audio cada segundo es dividido en 75 frames. Posteriormente se deben repetir los pasos descritos hasta completar toda la lista con todos los archivos de audio que se quieren incluir. Si bien es conveniente ir incluyendo los archivos en el orden deseado, éste puede luego ser modificado simplemente tomando el título de la pista (haciendo click sostenido sobre ella) y arrastrándola a la nueva posición. Para escuchar el proyecto se debe hacer doble click sobre el título del track desde el que se desea comenzar la reproducción. El proyecto completo puede guardarse como archivo a disco rígido seleccionando la opción "Save as…" del menú File. Al hacer click en el triángulo negro de la esquina superior izquierda podremos observar que ahora las opciones se presentan como en la figura siguiente. Siendo las principales funciones las descritas a continuación.
Seleccionar para quemar un CD de audio
Guardar el proyecto como una imagen en lugar de quemarlo en el CD
Seleccionar para verificar la validez del CD de audio previo al proceso de quemado
Convertir el proyecto en un montaje de audio (Audio Montage)
Entre las limitaciones de éste procedimiento podemos encontrar que: · Es conveniente cortar los espacios de silencio al principio y final de los archivos y realizar los fades in y out correspondientes antes de agregarlos a la lista, y evitar así que se produzcan clicks digitales en la reproducción. · No se pueden realizar entrecruces (crossfades) entre archivos separados ni agregar marcadores de tracks en el medio de un archivo. · No se pueden hacer ajustes finales en el volumen de las pistas. · No se puede reproducir el proyecto desde cualquier lugar, solamente desde el comienzo de un track en adelante. w w w . c e t e a r . c o m
página
85
Generando el Master en WaveLab. Por tales razones es conveniente utilizar el montaje de audio (Audio Montage) cuando se necesite crear un CD con mayor precisión. Audio Montage Esta herramienta tiene muchas aplicaciones posibles, pero la que nos interesa en el curso de masterización es la potencia para crear tanto CD´s de audio sencillos como de estructura compleja pero totalmente compatibles con el estándar "Red Book". Como se sabe, no hay dos CD´s exactamente iguales en cuanto a la forma de distribuir los tracks que lo constituyen: algunos tienen tiempos de espera entre ellos (iguales o no) otros tienen algunos o todos los tracks continuos, sin tiempo de espera. Veamos un ejemplo: supongamos que tenemos que grabar un CD de audio con el registro de un concierto "en vivo". Seguramente habrá esperas excesivas entre las obras o canciones o se presentarán ruidos entre ellas (toses del público, ruidos de escenario, etc.). Para la edición necesitaremos: a) Aislar las partes musicales suprimiendo los ruidos previos pero manteniendo los aplausos al final. b) Reducir el tiempo de los aplausos cuando éste resulte excesivo. c) Entrecruzar aplausos y comienzos de las canciones para dar mayor continuidad al CD. d) Crear tracks de CD sin tiempo de espera entre ellos. Este tipo de edición es casi imposible de realizar utilizando el "Basic Audio CD" (al igual que con programas genéricos de grabación de CD´s de audio como el Easy CD Creator). El "Audio Montage" de WaveLab 4 permite realizar éste tipo de edición de una forma muy eficiente. 1. Crear un nuevo montaje de audio Seleccionar File / New / Audio Montage. Aparecerá una ventana donde debemos seleccionar la velocidad de muestreo del nuevo proyecto (para crear un CD de audio se debe elegir obligatoriamente 44.1 kHz.) Se abrirá una ventana como la de la figura. En ella podemos identificar 4 áreas: · 10 solapas: Edit, Zoom, Clips, Groups, Files, Markers, CD, History, Snapshots, Notes.. · Debajo de ellas se encuentra una barra de menú y herramientas. Esta barra cambia dependiendo de la solapa seleccionada. · Asociada a la anterior aparece un panel un panel que cumple distintas funciones según la solapa seleccionada. · Finalmente una pista estéreo donde se ubicarán los archivos de audio. Se pueden agregar más pistas, tanto mono como estéreo, lo cual le da al montaje una gran flexibilidad para realizar distintos tipos de ediciones.
w w w . c e t e a r . c o m
página
86
Generando el Master en WaveLab. 2. Agregar archivos de audio (que deben tener una velocidad de muestreo de 44.1 kHz.) Para ello se debe seleccionar la solapa "Files". La interfaz cambiará como muestra la sig. Figura.
Hacer click para agregar un nuevo archivo en la posición del cursor.
Solapa para agregar archivos de audio
O hacer click derecho en ésta región
En éste momento de la creación del proyecto, el cursor se encuentra al principio (raya vertical que titila). Para agregar un archivo de audio en ésta posición se deberá hacer click en el ícono de la carpeta, o hacer click sobre la palabra "File" a la izquierda del mismo y seleccionar del menú emergente la opción "Add file(s) at cursor…". Se abrirá una ventana de exploración para ubicar y seleccionar el archivo de audio deseado. Otro método más rápido para realizar esta operación es hacer click con el botón derecho del mouse sobre la pista y elegir del menú emergente la opción "Insert file(s)". La ventana quedará como muestra la figura siguiente
Como vemos, se agregó información del archivo en los paneles superiores y una representación de la forma de onda en la pista estéreo. La vista de la forma de onda nos permitirá varias posibilidades de edición gráfica: · Hacer un click con el botón izquierdo del mouse en cualquier lugar para posicionar el cursor en ese punto. Para acercamientos (zoom in) apretar la tecla "flecha arriba", para alejar (zoom out) apretar "flecha abajo". · Doble click sobre el canal izquierdo seleccionará toda la región de audio. Una vez hecho esto, el cursor puede ser movido al principio de la selección apretando la tecla w w w . c e t e a r . c o m
página
87
Generando el Master en WaveLab. "1" del teclado numérico y al final de la misma apretando la tecla "2". · Para desplazar globalmente la región en el tiempo, de debe hacer un click sostenido con el botón izquierdo del mouse sobre el canal derecho de la región y luego moverlo en la dirección deseada. · Sobreimpresa a la forma de onda encontramos una línea editable de volumen en el medio de ambos canales de audio, con un cuadrado al principio y uno al final. Cada vez que insertamos un archivo de audio, automáticamente se sobreimprime una línea de volumen con un fade in al principio de la región y fade out al final. Estos fades pueden editarse tomando el cuadrado (el cursor cambia a doble flecha horizontal cuando nos posicionamos sobre él) y desplazándolo. En cambio, si posicionamos el cursor sobre la línea (éste cambiará a doble flecha vertical con un círculo en el medio) y hacemos click sostenido podremos ajustar el volumen de la región incrementando o atenuando la ganancia según se desplace el mouse hacia arriba o hacia abajo. Para agrega más puntos de edición se debe hacer doble click sobre la línea en el lugar deseado. Al hacer click derecho en algún lugar de la línea se abrirá un menú contextual que nos permitirá otro tipo de ediciones (borrar un punto, resetear la línea o punto, convertir la envolvente de volumen de mono a estéreo (o viceversa) para editar ambos canales por separado), etc. · Al posicionar el puntero de mouse sobre el borde izquierdo de la región de audio cambiará su forma a un rectángulo con dos triángulos amarillos adentro. En éste punto podemos cortar la región (de forma no destructiva) haciendo un click sostenido y desplazando el mouse hacia la derecha. De esta forma podemos eliminar silencios innecesarios al principio del archivo sin tener que procesarlo de forma definitiva ya que, de ser necesario, podremos acortar o extender la región siempre que lo deseemos. Lo propio ocurre si posicionamos el cursor en el borde derecho. · Luego de posicionar el cursor en un lugar de la región, podemos dividirla en dos regiones apretando la tecla "s" (Split) y de esa forma podemos editarlas por separado. 3. Agregar otro archivo de audio. Mover la barra de desplazamiento horizontal hasta ver el final de la región insertada previamente. Posicionar el cursor en el lugar donde se desea insertar el nuevo archivo y repetir el procedimiento explicado en el paso (2). No es necesario que las regiones se inserten con la separación que tendrán en el CD ya que estos tiempos se ajustarán una vez que todos los archivos hayan sido insertados en el proyecto. También es posible entrecruzar regiones simplemente superponiendo una con otra. Las envolventes de volumen de ambas se ajustarán automáticamente a medida que las vamos superponiendo, pero también pueden editarse para crossfades personalizados. 4. Ajustar las separaciones entre las regiones de audio. Las regiones de audio (sean archivos completos o partes de uno de ellos) se denominan "clips" en el montaje de audio. La solapa "Clips" nos mostrará una lista ordenada de todas las regiones del proyecto incluyendo además del nombre los tiempos de comienzo y fin de cada una, el largo, y el tiempo de separación con la pista anterior (Pregap). Para editar un tiempo bastará hacer doble click sobre él y escribir el nuevo valor con el formato correcto (minuto:segundo:milisegundo). w w w . c e t e a r . c o m
página
88
Generando el Master en WaveLab. También es posible cambiar el nombre de la región haciendo doble click sobre él en la columna "Name". 5. Insertar marcadores de tracks de CD Hasta éste punto, tenemos solamente una lista de regiones pero no tracks de CD. Para identificar el comienzo y final de cada track del CD se utilizan marcadores especiales en el montaje de audio, los cuales pueden ser insertados seleccionando la solapa "Markers". La figura siguiente muestra la ventana correspondiente a la solapa "Markers" y una región de audio con marcadores de track de CD insertados.
Crear CD Track Start
Marcador CD track start
Crear CD Track End
Crear CD Track Splice
Crear CD Track Index
Marcador CD track end
Marcador CD track splice
Para insertar un marcador de track de CD simplemente se debe posicionar el cursor en el lugar deseado y hacer click en el ícono correspondiente al marcador (como muestra la figura superior). También es posible hacer click sobre la palabra "Insert" y seleccionar el tipo de marcador del menú. Antes de pasar a quemar el CD debemos entender bien las funciones de cada marcador para evitar mensajes de error. CD track start y CD track end Indican comienzo y final (respectivamente) de un track de CD. Deben colocarse fuera de la región de audio contenida entre ellos. Como las regiones de audio utilizan la milésima de segundo como unidad mínima de medida de tiempo mientras que en un CD de audio el segundo es dividido en 75 partes o frames, raramente coincidirán los tiempos y aparecerá un mensaje de error cuando se quiera quemar el CD si hay parte de la región fuera de sus límites. Además, no pueden ponerse en el mismo tiempo un marcador de final con el marcador de comienzo del track siguiente. CD track splice Marcador que debe ser utilizado obligatoriamente cuando se quiere establecer dos tracks de CD consecutivos sin tiempo de espera entre ellos (Pregap=0). w w w . c e t e a r . c o m
página
89
Generando el Master en WaveLab. Pueden ser insertados en cualquier lugar del proyecto (por ejemplo, en el entrecruzamiento de dos regiones) pero deben tener un marcador de comienzo antes y uno de final después. CD track Index Como parte del estándar del CD de audio, cada track puede contener hasta 99 índices internos (Index Points) los cuales pueden identificar partes internas de un track (como los movimientos de un concierto de música clásica) pero dado que no todos los reproductores de CD los reconocen no es conveniente utilizarlos si se quiere asegurar la compatibilidad de la producción. En la estructura de un CD de audio el comienzo de un track corresponde al Index 0. 6. Quemar el CD Para quemar el CD de audio terminado se deben seguir los siguientes pasos: a) Hacer click en la solapa "CD" b) Verificar la validez de la estructura del CD. Hacer click en la función "Check" del menú "Functions" (como muestra la figura.
c) Si se indica la validez de la estructura, elegir la opción "Write CD…" y seguir las indicaciones del programa. Siempre es posible guardar el proyecto como un archivo en el disco rígido siguiendo el mismo procedimiento de guardado de cualquier progama de Windows (File / Save As…). Es éste archivo el que deberá enviarse para la corrección del trabajo práctico 4 del curso de masterización del CeTeAR.
w w w . c e t e a r . c o m
página
90
Restauración de un archivo de audio digital
Restauración de un archivo de audio digital Restauración de un archivo de audio digital En este documento se detallarán las operaciones básicas para el uso de los plug ins de restauración "Waves Restorer", incluidos en el paquete "Waves 4". El paquete de restauración conocido como "Waves Restorer" incluye cuatro plug ins dedicados a cubrir las necesidades de corrección y eliminación de ruidos de una señal de audio digital. Estos son: 1. Waves X-Noise 2. Waves X-Click 3. Waves X- Crackle 4. Waves X-Hum Los cuatro vienen en versión DirectX y RTAS y, por lo tanto, pueden utilizarse en tiempo real, permitiendo, de ésta manera, ajustar los controles de cada uno mientras se reproduce el archivo de audio (o una selección del mismo). Waves X-Noise Dedicado a eliminar ruidos aleatorios continuos, permite reducir señales indeseables como: Hiss, ruido de aire acondicionado, ruido de superficie en grabaciones de vinilo, soplido de cinta, etc. Para ello, se debe tomar una muestra del ruido (o de una porción donde el nivel de ruido sea mucho mayor que el de la señal de audio que se quiere conservar). Posteriormente se deberán ajustar los controles hasta obtener el resultado deseado (o cercano a él). Interfaz gráfica del plug in Waves X-Noise
4 6 11
8
5
7
3
9
12
10
2
1
1. Botón LEARN 2. Selector de resolución 3. Reducción 4. Monto de reducción 5. Umbral 6. Nivel de umbral 7. Entrada. Contorno de ruido 8. Profile. Contorno generado por el programa. 9. Salida. Contorno de la señal de salida, resultado de la reducción 10.Selector de monitoreo 11. Control de la respuesta dinámica del reductor de ruido 12.Control de la respuesta en alta frecuencia del reductor de ruido. w w w . c e t e a r . c o m
página
92
Restauración de un archivo de audio digital Procedimiento: a) Seleccionar una porción del archivo donde se detecte solamente la presencia del ruido que se quiere reducir. Si no es posible, buscar una región donde el nivel de ruido sea mucho mayor que el de la señal que se quiere conservar. b) Mientras se reproduce la región seleccionada en el paso anterior, apretar el botón "Learn" (aprender) (1). Es imprescindible realizar ésta operación escuchando solamente la región seleccionada, y para ello, puede ser beneficioso activar la reproducción circular (Loop). El programa mostrará un contorno del ruido (Input) (7). Apretar otra vez el botón para finalizar el paso de muestreo del ruido. En forma automática, el programa añadirá un contorno similar (Profile) (8) cuya definición dependerá de la resolución seleccionada (2). c) Mientras se reproduce todo el archivo de audio, ajustar los controles deslizantes 3 y 5 para establecer el monto de reducción de ruido y el nivel a partir del cual se quiere realizar la reducción. El control 3 modifica la distancia entre el contorno de entrada (7) y el generado por el programa (8), asumiendo que toda porción de la señal ubicada por debajo del "Profile" corresponde al ruido (y por lo tanto será reducida), mientras que toda porción por encima corresponde a la señal deseada y no será afectada (teóricamente), por otra parte, a mayor distancia entre los contornos, mayor será la reducción aplicada o menor será el efecto del procesamiento según el "Profile" se encuentre por encima o por debajo del contorno de entrada. El control 5 ajusta el monto de reducción en dB y opera en conjunto con el explicado anteriormente. Su rango va desde 0 DB (no hay reducción) hasta 100 dB (máxima reducción aplicada). Se puede permutar el monitoreo del proceso mediante el selector correspondiente (10) entre la señal de salida (Audio) y la porción que se está eliminando (Difference) para realizar reajustes a los controles. d) El control de respuesta dinámica (11) permite establecer que tan rápido el programa aplicará reducción cuando se encuentre señal con una envolvente espectral igual o similar al contorno de ruido (Ataque) y que tan rápido dejará de procesar en caso contrario (Release). Es conveniente comenzar con las opciones por defecto y modificar los valores de ser necesario. e) El control de respuesta en alta frecuencia (12) permite controlar de forma precisa el monto de reducción de ruido en las altas frecuencias. Valores positivos de ganancia aumentarán la cantidad de reducción de ruido por sobre la frecuencia de corte, mientras que valores negativos la disminuirán. Montos altos de reducción introducirán distorsiones audibles en la señal (artifacts) las que se manifestarán principalmente en los sonidos con ataque abrupto, y por tal razón, será preferible realizar varias reducciones de bajo monto que una sola drástica. Waves X-Click. Permite eliminar ruidos impulsivos (Glitches) como discontinuidades en los valores de muestras en una forma de onda (clicks) y ruidos de baja frecuencia (pops). Como ambos tienen un transiente de ataque abrupto, extinción rápida y duran unos pocos milisegundos, el algoritmo de detección puede tomar sonidos cuyo ataque tenga características similares (tambor, bombo, etc.) como clicks o pops si no se ajustan bien los controles correspondientes. Por tal razón es importante controlar auditivamente todo el proceso, comparando permanentemente la señal original con la procesada y la diferencia entre ambas (lo que está siendo eliminado por el procesamiento). w w w . c e t e a r . c o m
página
93
Restauración de un archivo de audio digital Interfaz gráfica del plug in Waves X-Click
3 2 1
4
Procedimiento: a) Mientras se escucha la señal de audio ajustar el control "Threshold" (1) hasta conseguir reducir o eliminar los clicks detectados. b) Ajustar el control "Shape" (2) para hacer más selectiva la detección de acuerdo a la forma temporal del ruido. Un valor de "50" corresponde a una detección genérica o promedio entre clicks y pops. Valores superiores harán que la detección sea más sensible a ruidos de menor duración mientras que valores inferiores permitirán detectar principalmente aquellos con evolución temporal más lenta. Mayor proporción de clicks serán detectados en el primer caso y mayor proporción de pops lo serán en el segundo. c) Comparar permanentemente la señal original con la procesada utilizando el botón "Bypass" (3) y la señal procesada con la porción que está siendo eliminada alternando los botones "Audio" y "Difference" (4). Waves X- Crackle El X-Click está diseñado para eliminar clicks (o pops) individuales pero no actúa eficientemente si se desea eliminar una serie de clicks cercanos entre sí (ruido conocido como "crackle"). A tal fin está destinado el X-Crackle. Interfaz gráfica del plug in Waves X-Crackle
3 2 1 4
Procedimiento: d) Mientras se escucha la señal de audio ajustar el control "Threshold" (1) hasta conseguir reducir o eliminar los crackles detectados. e) Ajustar el control "Reduction" (2) para establecer el monto de reducción deseado. f) Comparar permanentemente la señal original con la procesada utilizando el botón "Bypass" (3) y la señal procesada con la porción que está siendo eliminada alternando los botones "Audio" y "Difference" (4). w w w . c e t e a r . c o m
página
94
Restauración de un archivo de audio digital Waves X-Hum Diseñado para eliminar ruidos continuos con espectro armónico (aquellos con parciales cuya frecuencia es múltiplo de una frecuencia fundamental). El caso típico es el del ruido de línea de 50 ó 60 Hz (dependiendo del tipo de alimentación domiciliaria) inducido por deficiencias en la malla de cables de audio (entre otras causas). Interfaz del plug in Waves X-Hum
6 1
2 4 5
3
1. Freq: frecuencia fundamental del ruido que se desea eliminar. 2. Q: ancho de banda de los filtros. 3. Gain: atenuación de cada uno de los 8 filtros. Para cambiar el monto de atenuación se puede hacer doble click con el botón izquierdo del mouse y escribir el valor deseado para un ajuste preciso o hacer un click izquierdo sostenido y arrastrar para un ajuste grueso. 4. Link: permite seleccionar diferentes formas de ajustar el monto de atenuación. Linked: todos los filtros se ajustarán simultáneamente. Unlinked: permite ajustar la atenuación individualmente. Odd/Even: permite ajustar la atenuación de los filtros impares (odd) o pares (even) en conjunto. Es de destacar que el filtro 1 corresponde a la fundamental del espectro armónico (aquella cuya frecuencia es especificada en el control Freq (1), el filtro 2 al primer armónico (cuya frecuencia es el doble de la fundamental), el filtro 3 al segundo armónico (frecuencia triple de la fundamental) y así sucesivamente. 5. Filtro Pasa-alto para eliminar DC Offset o ruidos de baja frecuencia. Tiene controles para habilitar o deshabilitar el filtro, especificar el tipo de pendiente y la frecuencia de corte. 6. Static preset: cuadro combinado para seleccionar configuraciones predeterminadas. Procedimiento: Habitualmente es conveniente seleccionar una configuración predeterminada y luego realizar ajustes en los controles correspondientes. Como en los plug ins anteriores, se puede comparar la señal procesada con la original y la diferencia entre ambas.
w w w . c e t e a r . c o m
página
95
w w w . c e t e a r . c o m
página
96
Guardar y cargar configuraciones en los plug-ins de Waves.
Guardar y cargar configuraciones en los plug-ins de Guardar y cargar configuraciones en los plug ins de Waves. Una vez realizado los ajustes necesarios en los parámetros de un efecto o procesador, la configuración completa puede ser guardada en el disco rígido como un archivo, la cual puede luego ser cargada nuevamente en caso de que sea necesario aplicar el procesador en otro proyecto (o en nuestro caso, para enviar tal configuración para la corrección de los trabajos prácticos). Todos los plug ins, sin importar la empresa que lo haya desarrollado, permiten ésta operación, aunque con procedimientos diferentes. En la figura siguiente vemos la interfaz gráfica del plug in "Waves Req 6 Bands". En ella encontramos un área común a todos los procesadores de Waves y de cuya funcionalidad nos ocuparemos.
3
1
4
2
5
Figura 1. Interfaz gráfica del Req 6 Bands de Waves
1. Deshace la última edición. 2. Muestra la configuración activa y el nombre del preset cargado. Es posible utilizar dos configuraciones abiertas simultáneamente: A y B. Esto permite realizar comparaciones rápidas entre ellas, sean diferentes, o una variación de la otra. 3. Copia la configuración A en la B o viceversa, dependiendo de cual sea la activa en ese momento. 4. Carga un preset o una configuración previamente guardada. 5. Guarda la configuración activa. Guardar una configuración Al presionar el botón "Save" (5) se abrirá el siguiente menú emergente. En él podemos observar 4 posibilidades de almacenamiento, de las cuales sólo la primera (Save to New File…) y la última (Put into Preset Menu As…) estarán activas si no cargamos una configuración previamente guardada. w w w . c e t e a r . c o m
página
98
Guardar y cargar configuraciones en los plug-ins de Waves a)
"Save to New File…" (guardar en un archivo nuevo…) se utiliza para generar un archivo (con extensión .xps) en cualquier lugar del disco rígido. Es la que utilizaremos en el curso de masterización.
b)
"Put Into Preset Menu As…" (poner dentro del menú preset como…) no genera un archivo sino que almacena la configuración como "User preset" (preset del usuario) para tener un acceso más rápido a configuraciones que necesitamos usar continuamente. Si previamente hemos cargado una configuración, se activarán las opciones restantes (como muestra la figura de arriba), y cuya funcionalidad se explicará más adelante. Al seleccionar la opción "Save to New File…" se abrirá un explorador para especificar el lugar de la computadora donde se desea almacenar el archivo y el nombre con el que se desea guardarlo. Esta opción es útil, entonces, cuando se desea guardar la configuración por primera vez o cuando se desea generar un archivo con un nombre distinto. Inmediatamente después de aceptar aparecerá la siguiente ventana en la que se deberá escribir el nombre con el que se desea almacenar el nuevo preset (sobrescribiendo "Untitled Preset" en el cuadro combinado). Una vez que la configuración ha sido guardada (o que se ha abierto una configuración previamente guardada), podremos almacenar cualquier cambio que realicemos en los parámetros del procesador con la opción "Save (nombre del archivo).xps (nombre del preset)" o creando un nuevo preset dentro del mismo archivo con la opción "Save to (nombre del archivo).xps As…". Es decir, un solo archivo de configuración puede contener más de un preset internamente.
Cargar una configuración Para cargar un archivo de configuración previamente guardado, un preset predefinido del procesador (Factory Preset) o uno predefinido por el usuario (User Preset) se debe presionar el botón "Load" (4). Al hacerlo se abrirá el siguiente menú. En él encontramos las siguientes opciones: a)
"Open Preset File…" (abrir archivo de preset) nos permitirá abrir un archivo de configuración previamente guardado.
b)
Una vez abierto un archivo de configuración aparecerá en el menú un área identificada con el nombre (EQ de Ejemplo Req 6 Bands.xps en la figura) y una lista de los presets almacenados en él (EQ de Ejemplo en la figura). El preset activo aparecerá indicado con un tilde. Para cambiar de preset en cualquier momento bastará, entonces, apretar el botón "load" y señalar el preset deseado.
c) d)
"Factory Preset" muestra una lista de los presets predefinidos del procesador. No se muestra en la figura, pero si se hubieran guardado presets con la opción "Put into Presets Menu As…" aparecerá una lista bajo el rótulo "User Presets".
w w w . c e t e a r . c o m
página
99
w w w . c e t e a r . c o m
página
100
Ayuda básica de WaveLab 4
w w w . c e t e a r . c o m
página
102
Ayuda básica de WaveLab 4 Ayuda básica de WaveLab 4 La Interfaz gráfica
Barra de Herramientas
Barra de Menú
Canal Izquierdo (Left Channel)
Sección Maestra Canal Derecho (Right Channel)
Barra de Estado
Ventana de Forma de Onda de un archivo de audio
Consta de 5 áreas principales: a) Barra de menú: donde se pueden seleccionar las distintas funciones de WaveLab de manera similar a cualquier programa de Windows. b) Barra de herramientas: zona de íconos para acceso rápido a funciones que se utilizan habitualmente. c) Barra de estado: muestra información importante. d) Sección Maestra: utilizada para insertar plug-ins, controlar volumen general, comparación mono/estéreo, etc.
1.
La Barra de Menú
Como en todo programa de Windows, hay menús comunes que contienen funciones convencionales para la operación del software. Por ejemplo, en el menú Archivo (File) encontraremos las funciones Nuevo (New), Abrir (Open), Guardar (Save) y Guardar Como… (Save as…). Pero en éstos también encontraremos funciones especialmente incorporadas por WaveLab y formas particulares de uso de las habituales. Por ejemplo, para abrir un archivo de audio debes hacer click en el menú "File", seleccionar el submenú "Open" y de la lista desplegable elegir "Wave". Esto es así pues WaveLab permite crear y abrir distintos tipos de archivos.
w w w . c e t e a r . c o m
página
103
Ayuda básica de WaveLab 4 Observa la figura para visualizar ésta operación
Se abrirá una ventana de exploración para buscar y seleccionar el archivo que deseas abrir, el cual puede tener distintos formatos (.wav, .aiff, .mp3, etc.) seleccionables en el cuadro combinado "Tipo de archivos"
Observa que una vez abierto el archivo se agregan dos menús nuevos: "Edición" (Edit) y "Analizar" (Analyse). Del primero no hay mucho que aclarar ya que en él encontrarás las funciones habituales para Copiar (Copy), Cortar (Cut) y Pegar (Paste). Del segundo encontrarás un análisis detallado en el archivo "Análisis" ya que contiene funciones necesarias para realizar distintos tipos de análisis de grabaciones.
w w w . c e t e a r . c o m
página
104
Ayuda básica de WaveLab 4 2.
La Barra de Herramientas
Como dijimos, contiene íconos que permiten acceso rápido a funciones que utilizamos habitualmente. Tales funciones se pueden obtener también en alguno de los menús, pero, por repetitivas en su uso, resulta tedioso realizar la serie de movimientos necesarios para seleccionarlas en la barra de menú. Puede ser personalizada de tal forma de incorporar o quitar herramientas a tu gusto. Si observas detenidamente, verás dobles líneas verticales en relieve. Estas separan secciones de la barra de herramienta. La primera de las secciones que se observan en la figura corresponde a los menús "File", "Edit" y "Windows", en ella se pueden observar íconos para crear un archivo nuevo, abrir un archivo existente, guardar el archivo activo (guardar, no guardar como…, función para la cual deberás ir al menú correspondiente), cortar, copiar, pegar, deshacer (Undo), rehacer (Redo), etc. Si posicionas el puntero del mouse sobre un ícono obtendrás una indicación de la función que permite realizar el mismo. Es posible que no veas todos los íconos que muestra la figura. Por ejemplo, la última sección llamada "Transporte" (Transport) contiene las funciones Play, Stop, Rec, Rewind, Forward (usuales en cualquier dispositivo para grabar y reproducir música), más otras importantes para controlar la forma en que se producirá la reproducción; puede que no aparezca en la barra de herramientas cuando corres el programa por primera vez. En nuestro trabajo ocupa un rol muy importante y por lo tanto debes visualizarla. Para ello, abre el menú "View", elige el submenú "Control bars" y selecciona la opción "Transport". Se abrirá una ventana con los íconos correspondientes, la cual debes arrastrar a la barra de herramientas para incorporarla a ella. Observa que en "Control bars" hay varias opciones, las utilizadas tienen un tilde mientras que las otras no. Así, puedes incorporar y quitar secciones de la barra de herramientas según tus necesidades operativas.
3.
La Sección Maestra (Master Section)
Habitualmente es visible como muestra la figura, pero si estuviera oculta, se puede abrir seleccionando: View/Specialized Windows/Master Section. También es posible que alguna de las áreas esté minimizada. Para expandirla cebes hacer click en el cuadro a la derecha del rótulo de la sección. Consta de cuatro áreas diferentes para realizar distintas operaciones. a)
Effects
Permite insertar distintos tipos de plug-ins de efectos y procesadores como ecualizadores, compresores, etc., algunos de los cuales son instalados por el propio WaveLab y otros por el usuario (como los de Waves p. ej.). Wave Lab corre dos tipos de plug-ins: VST (desarrollados para programas de Steinberg) y DirectX (desarrollados para cualquier programa de edición y grabación de audio digital bajo Windows). Para insertar un efecto haz click en el número a la derecha, en el menú emergente elige el plug-in que deseas insertar. w w w . c e t e a r . c o m
página
105
Ayuda básica de WaveLab 4 Se pueden insertar hasta 8 efectos en cadena. La señal de audio pasará por todos ellos "en serie", es decir, será procesada primero por el que se encuentra más arriba y así sucesivamente. Si deseas cambiar el orden de procesamiento basta debes hacer click en el recuadro con el nombre y arrastrarlo a la posición deseada. Para deseleccionar o cambiar un plug-in haz click otra vez en el número o en el recuadro y selecciona "None" o el nuevo procesador. A la izquierda se observan dos botones: On (para activar o desactivar el plug-in) y solo (para escuchar la señal procesada por éste solamente). Cuando se inserta un efecto, éste se abre mostrando inmediatamente la ventana correspondiente para su configuración. Si luego de hacer los ajustes necesarios cerramos ésta ventana el efecto sigue actuando. Si son necesarios posteriores ajustes necesitaremos reabrirla y para ello debes hacer click con el botón derecho de mouse en el recuadro con el nombre del efecto y en el menú emergente seleccionar "Show". Finalmente, debajo de la sección se encuentran tres botones más, Bypass (para escuchar la señal sin procesar), Preset (para almacenar toda la sección maestra en un archivo a disco rígido) y +/- para agregar o quitar espacio para plug-ins. b)
Master Contiene los Vúmetros y medidores de picos para monitorear el volumen de la señal más los controles de volumen L/R. Debajo encontramos dos botones: Mono (permite escuchar "en mono" una señal estéreo para poder comparar ambas versiones y encontrar cualquier problema de fase que se pueda introducir en el procesamiento) y Unlink (desvincula los faders izquierdo y derecho para realizar ajustes de volumen independiente para cada canal) El led "Dropout" es para monitoreo del rendimiento del sistema y nos indica si nuestra computadora es capaz o no de procesar la señal "en tiempo real". Cuando se produce un atascamiento de la computadora por exceso de procesamiento, se prende el led para indicarnos el problema. Si esto ocurre, puede que sea necesario realizar ajustes la cantidad y tamaño de los Buffers asignados para la reproducción de audio si el problema es recurrente (esto se realiza en: Options/Preference/Audio Card/Buffer Number o Buffer Size), pero si ocurre una sola vez o no se escuchan interrupciones en la reproducción de la señal de audio, al hacer click sobre el led se apaga.
c)
Dithering Lugar para insertar plug-in de corrección de errores de cuantización (Dither y Noise Shaping) o aquellos que contengan éstas funciones (como L1-Ultramaximizer). Posteriormente a todos los procesos de aplicación de efectos y cambios de volumen, la señal, que originalmente puede ser de 16 bits por ejemplo, sufre distorw w w . c e t e a r . c o m
página
106
Ayuda básica de WaveLab 4 siones en su resolución pudiendo quedar con varios bits menos. Para asegurar la resolución final se utiliza dithering, recurso indispensable en el proceso de masterización. WaveLab incorpora varios tipos de dithering seleccionables con el mismo método de inserción de efectos: Internal (cuya configuración se realiza con los controles que se encuentran debajo del recuadro: "Noise Type", Noise Shaping" y "Output Bit Resolution"), UV22 (plug-in simulador del conversor homónimo de Apogee) y UV22HR (similar al anterior, incorpora la posibilidad de seleccionar la resolución final). d)
Render Para aplicar todos los procesos de la sección Maestra al archivo activo o crear uno nuevo a partir de él se debe hacer click en éste botón. Surgirá la ventana de la figura, la cual permite procesar solo la parte seleccionada del archivo (si hubiera alguna) o al archivo completo (Whole File) según se ve en la columna a la izquierda. A la derecha se puede especificar si el proceso se aplicará al archivo activo (Process in place) o si se creará uno nuevo (Create new file). En caso de seleccionar ésta última, se activará la opción "Create specific file" la cual deberá ser seleccionada si se desea crear un archivo específico con un nombre, ubicación y una resolución determinadas. Caso contrario se creará uno nuevo con el nombre genérico "Untitled". Tanto si se procesa el archivo original o si se crea uno nuevo genérico, se deberán guardar los cambios para conservarlos.
4.
Barra de estado
Contiene información importante cuando se encuentra un archivo abierto. A la izquierda, datos de procesos realizados como tiempo de apertura y dibujado. En el extremo opuesto y de izquierda a derecha: ·
Ubicación del cursor o tamaño de la selección (en seg. y miliseg.)
·
Duración total
·
Zoom: escala de visualización de la forma de onda.
·
Formato de canales y Resolución.
·
Velocidad de muestreo (Sample Rate)
w w w . c e t e a r . c o m
página
107
Ayuda básica de WaveLab 4 Secciones especiales Caja de herramientas (Wave toolbox)
Nudges
Herramienta de reproducción
Reproduce el archivo de audio desde un punto de la forma de onda en adelante, haciendo click sostenido en el mouse.
Herramientas para mover una región seleccionada de la forma de onda hacia la izquierda o la derecha. Una vez elegida, se debe hacer click para mover la selección un pixel (punto de pantalla) en la dirección deseada. La cantidad de muestras que se desplaza la selección dependerá del zoom
Herramienta de edición.
Permite posicionar el cursor en cualquier punto de la forma de onda, seleccionar fragmentos de la misma y ajustar los extremos de la región seleccionada
Herramienta de dibujo
Al magnificar una región con una relación 1:8 o superior, permite realizar cambios en la forma de onda dibujando sobre ella. Util para eliminar clicks que no pueden ser corregidos de otra manera.
Zoom
Permite magnificar una sección de la forma de onda parra una edición más precisa
Transporte Comienzo de reproducción.
Especifica desde que punto se reproducirá el archivo de audio.
Herramienta para omitir regiones en la reproducción
Fin de reproducción
Especifica hasta que punto se reproducirá el archivo de audio.
Herramienta para cambiar la velocidad de reproducción
Loop on / off
Herramienta para reproducir hacia delante o hacia atrás una porción de audio. Util para encontrar puntos exactos para edición, etc.
Funciones habituales de transporte: GTS (ir al principio), Rew, FF, GTE (ir al final), Stop, Play y Record.
w w w . c e t e a r . c o m
página
108
Ejercicios de Teoría
Ejercicios de teoría. Cuestionario 1
PREGUNTA 1 En un sistema de audio digital a frecuencia de muestreo debe ser
RESPUESTAS a) El doble de la máxima frecuencia de interés presente en la señal b) Al menos la mitad de la máxima frecuencia presente en la señal. c) Al menos el doble de la máxima frecuencia efectivamente presente en la señal.
PREGUNTA 2 La resolución de un sistema de audio digital debe ser
RESPUESTAS a) Suficientemente alta como para representar correctamente todas las frecuencias b) Numéricamente mayor o igual a la relación señal/ruido deseable dividida por 6 c) La misma en todos los componentes del sistema, desde los conversores de entrada hasta la señal a replicar para su distribución comercial.
PREGUNTA 3 El filtro antialias
RESPUESTAS a) Sólo es necesario en los sistemas de audio digital para uso profesional b) Es imprescindible sólo cuando existe ruido de alta frecuencia c) Es imprescindible aunque no haya ruido apreciable en el sistema.
PREGUNTA 4 Las memorias RAM
RESPUESTAS a) Permiten borrar el contenido y reemplazarlo con información nueva b) Son más rápidas que las ROM y por eso se las prefiere d) Son imprescindibles para guardar información por largos periodos de tiempo.
PREGUNTA 5 El dither consiste en
RESPUESTAS a) Un ruido de frecuencias inaudibles cuyo fin es contrarrestar la distorsión b) Un ruido de pequeña amplitud agregado a la señal antes del muestreo c) Una distorsión controlada con el objeto de compensar psicoacústicamente el ruido.
w w w . c e t e a r . c o m
página
111
Ejercicios de teoría. Cuestionario 2
PREGUNTA 1 El campo magnético
RESPUESTAS a) Es el resultado de la presencia de cargas eléctricas acumuladas b) Provoca, al variar en el tiempo, una fuerza electromotriz en cualquier conductor inmerso en él c) Provoca, al variar en el tiempo, la circulación de corriente en un conductor abierto.
PREGUNTA 2 El ferromagnetismo es
RESPUESTAS a) Una propiedad de algunos materiales por la cual a igual excitación magnética desarrollan un mayor campo magnético en su interior b) El estudio del campo magnético provocado en el aire por un arrollamiento c) La razón por la que el aluminio es rechazado por los imanes
PREGUNTA 3
RESPUESTAS
El magnetismo
a) Es proporcional a la corriente que circula por una bobina.
remanente
b) Es el campo magnético que queda dentro de un material cuando se anula la excitación externa c) El valor de corriente necesario para alcanzar la fuerza coercitiva.
PREGUNTA 4 La polarización de una cinta por corriente alterna
RESPUESTAS a) Permite obtener una relación completamente lineal entre la excitación y el campo remanente b) Permite una mayor respuesta en frecuencia que la polarización con corriente continua c) Permite aumentar mucho la relación señal / ruido frente a la polarización con corriente continua
PREGUNTA 5
RESPUESTAS
La ecualización para
a) 29 ms
una cinta cuya
b) 70 ms
emulsión
c) 120 ms.
es de 440 micropulgadas de espesor que se mueve a una velocidad de 15 pulgadas por segundo, es w w w . c e t e a r . c o m
página
112
Ejercicios de teoría. Cuestionario 3
PREGUNTA 1 En un sistema de registro digital de 4 bits se representan
RESPUESTAS a) 011110011010 b) 101010010111 c) No es posible trabajar en PCM con menos de 8 bits.
sucesivamente los valores 7, 9 y 10. La representación PCM de los mismos es PREGUNTA 2 El sincronismo en el registro digital es importante porque
RESPUESTAS a) Permite evitar que dos instrumentos que fueron grabados simultáneamente en dos canales (izquierdo y derecho) se desfasen. b) Evita una sensación molesta de wow y flutter que es más propia de los sistemas analógicos. c) Permite evitar errores en la lectura de una muestra por corrimientos debidos a las fluctuaciones de frecuencia del reloj.
PREGUNTA 3 El código de Reed-Solomon
RESPUESTAS a) Permite detectar errores de ráfaga pero no aleatorios. b) Reordena la información de modo que los bits sucesivos en un código PCM vayan a parar a diferentes lugares del disco. c) Funciona desordenando en forma conocida los bits correspondientes a 192 muestras de audio.
PREGUNTA 4 La lectura en un disco compacto (CD) se realiza
RESPUESTAS a) Asignando a los valles un 1 y a las fosas, que son más oscuras, un 0. b) Apelando a la interferencia entre la luz que incide sobre el fondo y sobre la superficie en el borde de cada fosa. c) Utiliza el cambio de longitud de onda de la luz que incide sobre la laca con respecto a la que incide en una fosa.
PREGUNTA 5 Los sistemas de compresión de datos para registro digital
RESPUESTAS a) Reducen la resolución en aquellas bandas cuyo umbral es más alto por efecto del enmascaramiento. b) Reducen la cantidad de muestras por segundo manteniendo la resolución. c) Priorizan las componentes de baja frecuencia y luego restituyen el brillo mediante excitadores aurales.
w w w . c e t e a r . c o m
página
113
Ejercicios de teoría. Cuestionario 4
PREGUNTA 1 El ajuste de nivel de entrada en una consola
RESPUESTAS a) Permite uniformar el nivel de todas las señales antes de proceder a su mezcla. b) Debe usarse con cautela pues puede colorear tonalmente las señales de bajo nivel. c) Puede usarse en reemplazo de los faders de canal siempre y cuando no se deba ecualizar.
PREGUNTA 2 Las conexiones de inserción
RESPUESTAS a) Permiten intercalar amplificadores externos cuando la señal es muy débil como en ciertos micrófonos. b) Se encuentran antes del fader de canal para permitir el ajuste de nivel después del efecto. c) Se encuentran después del paneo para posibilitar el uso de efectos estereofónicos.
PREGUNTA 3 La salida auxiliar post fader es útil cuando
RESPUESTAS a) Se desean utilizar mezclas parciales para monitoreo. b) Se debe transformar en monofónica una señal originalmente estereofónica. c) Se aplican efectos en paralelo en los que la señal seca va por fuera del efecto.
PREGUNTA 4 Los retornos auxiliares
RESPUESTAS a) Están previstos para la entrada y ecualización de señales que no han podido ingresar por los canales de entrada en las consolas de pocos canales. b) Requieren la reducción a 0 de su ajuste de nivel cuando no se desea que ingresen en los buses principales . c) Se vuelcan sobre pares de grupos para aprovechar los efectos estereofónicos.
PREGUNTA 5 Los bucles de tierra
RESPUESTAS a) Se evitan conectando la masa circuital a la tierra física en un solo punto. b) Son perjudiciales porque permiten la captación de ruido térmico del ambiente. c) Producen radiación electromagnética que perjudica a los receptores de los micrófonos inalámbricos.
w w w . c e t e a r . c o m
página
114
Soporte teórico Capitulos 15, 23, 24 y 25 del libro Acústica y Sistemas de Sonido por el Ing. Federico Miyara
Audio Digital
163
15.
Capítulo 15
Audio Digital 15.1. Introducción Las técnicas digitales han cobrado en las últimas décadas una importancia fundamental en el desarrollo de nuevas tecnologías para la generación, el procesamiento, el almacenamiento y el análisis del sonido. Ello ha sido posible gracias al avance vertiginoso de la microelectrónica y su aplicación a la producción de dispositivos poderosos y complejos capaces de manejar y transformar cada vez más con mayor precisión y rapidez la enorme cantidad de información contenida en el sonido. Una de las primeras consecuencias de la aplicación de la tecnología digital al audio fue el desarrollo de sistemas de almacenamiento del sonido de gran confiabilidad, inalterabilidad y fidelidad. Otra fue el gran impulso al desarrollo de instrumentos musicales electrónicos de gran complejidad y versatilidad. La tercera consecuencia fue el desarrollo y aplicación de técnicas para el procesamiento de la señal sonora, que permitieron no sólo el mejoramiento de procesos que antes se llevaban a cabo analógicamente sino también la introducción de nuevos procesos, entre los cuales se encuentran una gran cantidad de efectos tales como retardos, modulaciones, reverberaciones y espacializaciones de gran realismo y naturalidad, cuya implementación analógica sería mucho más costosa y por lo tanto destinada a un mercado mucho más restringido. La idea básica detrás del audio digital es la de representar el sonido por medio de números (“digital” viene de dígito, es decir número). Aún antes de profundizar el análisis, es fácil ver que esto tiene varias ventajas. En primer lugar, se elimina el problema de la alterabilidad de la información. Es mucho más fácil guardar un número que la magnitud física que ese número representa. Por ejemplo, si quisiéramos guardar una varilla de 57,235 cm de longitud, tendríamos serias dificultades, ya que la dilatación a causa de la temperatura, o cualquier partícula de polvo que se adhiriera a sus extremos, o simplemente el desgaste, podrían causar un error. Esto, que es válido para la longitud de una varilla, lo es más para el campo magnético almacenado en una cinta grabada. En segundo lugar, existen algoritmos (métodos de cálculo) para realizar digitalmente no sólo todos los tipos de procesamiento utilizados en el audio tradicional, como la amplificación, la mezcla, la modulación, el filtrado, la compresión y expansión, etc., sino muchos otros más, entre los cuales se encuentran los retardos, los sincronismos, los desplazamientos de frecuencia, la generación de sonidos por diversos procedimientos, etc. Estos algoritmos pueden implementarse en una computadora de propósito general o bien en dispositivos específicos llamados procesadores digitales de señal (DSP).
164
Acústica y Sistemas de Sonido
En tercer lugar, el reemplazo de los procesadores analógicos por sus equivalentes digitales permite evitar la degradación de la señal a causa del ruido analógico, lo cual es conveniente dado que el ruido analógico es muy difícil de eliminar.
15.2. Numeración binaria Dado que todos los sistemas digitales se basan en la numeración binaria, antes de comenzar a describir los procesos básicos de muestreo y digitalización del sonido nos referiremos brevemente a esa numeración. En la numeración decimal (el sistema que empleamos habitualmente), se utilizan diez símbolos (los dígitos 0, 1, 2, ..., 9) en un sistema posicional para representar las sucesivas cantidades. Esto significa que cada nueva cifra que se agrega tiene un peso 10 veces mayor que la que se encuentra a su derecha. Por ejemplo, 27 = 2 × 10 + 7 , 306 = 3 × 102 + 0 × 10 + 6 . En la numeración binaria, se utilizan sólo dos símbolos (los dígitos 0 y 1), también en un sistema posicional, sólo que ahora cada nueva cifra tiene un peso sólo 2 veces mayor que la anterior. Por ejemplo, 101 = 1 × 22 + 0 × 2 + 1 ≡ 5 , 11011 = 1 × 24 + 1 × 23 + 0 × 22 + 1 × 2 + 1 ≡ 27 . En esta numeración, el 1 tiene características similares al 9 del sistema decimal, es decir, una vez que llegamos al 1 debemos agregar una nueva cifra 1 y cambiar la primera por 0. En la Tabla 15.1 se muestra la conversión de decimal a binario para los números del 0 al 15. La razón por la que se utilizan los números binarios es porque eléctricamente es muy fácil codificar los 0’s y los 1’s. Basta utilizar un nivel de tensión alto (5 V) para un 1 y un nivel de tensión bajo (0 V) para un 0. Esto hace que la representación sea extremadamente insensible al ruido. En efecto, la señal seguiría siendo recuperable aún en presencia de un ruido de 2 V, que corresponde a una relación señal/ruido tan baja como 20 log 5/2 = 8 dB (inadmisible si el sistema fuera analógico).
15.3. Muestreo Pasemos ahora al concepto de muestreo (sampling). Las señales acústicas (y por lo tanto las señales eléctricas que las representan) varían en forma continua, lo que significa que en un intervalo de tiempo dado, por pequeño que sea, existen infinitos valores diferentes. Sin embargo, a los efectos del mensaje auditivo, no hace falta tanta información. Primero, porque el oído no tiene tanta discriminación en el tiempo, y segundo porque tampoco tiene tanta discriminación en la amplitud como para distinguir valores que por estar muy próximos en el tiempo difieren muy poco en amplitud. No solamente
Audio Digital
165
Tabla 15.1. Conversión del sistema binario al decimal. Los ceros ubicados a la izquierda son opcionales. Decimal
Binario
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111
no hace falta tanta información sino que desde el punto de vista práctico tampoco es conveniente ni posible manejarla. Entonces surge el concepto de muestreo (sampling). Muestrear una señal significa reemplazar la señal original por una serie de muestras tomadas a intervalos regulares. La frecuencia con la que se toman las muestras se denomina frecuencia de muestreo, fM, y el tiempo entre muestras, periodo de muestreo, TM. Se cumple que fM
=
1 . TM
En la Figura 15.1 se ilustra el proceso de muestreo. En la grafica superior se grafica la onda original y los instantes de muestreo, y en la figura de abajo se indican las muestras.
15.4. Frecuencia de muestreo Es intuitivamente evidente que la frecuencia de muestreo debe ser bastante alta, ya que entonces se logra un grado de detalle mucho mayor, lo cual significa que el sonido será reproducido con mayor fidelidad al original. En realidad existe un criterio que debe cumplirse obligatoriamente en todo proceso de muestreo, y es que la frecuencia de muestreo debe ser mayor que el doble de la máxima frecuencia presente en la señal. Es decir fM
> 2f máx .
166
Acústica y Sistemas de Sonido
Esto es consecuencia de un teorema llamado Teorema del muestreo, que dice que una señal muestreada puede recuperarse totalmente sólo si fue muestreada cumpliendo con el criterio anterior. La frecuencia fM/2 se denomina frecuencia de Nyquist.
señal
t TM
señal muestreada
t
Figura 15.1. Efecto del proceso de muestreo sobre una onda senoidal. La frecuencia de muestreo es en este caso 14,7 veces mayor que la frecuencia de la onda.
Es importante comprender que la frecuencia máxima que aparece en la fórmula anterior no se refiere sólo a la máxima frecuencia de interés, sino en realidad a la máxima frecuencia que efectivamente aparece en la señal a muestrear, aunque dicha frecuencia provenga de un ruido de alta frecuencia que contamina la señal. En caso de no cumplirse el criterio, al intentar recuperar la señal aparecerán componentes de frecuencia en la banda útil. Para verlo, supongamos que muestreamos con una frecuencia de 40 kHz una señal de audio, y que aparece un ruido (inaudible) de 35 kHz superpuesto a la señal, situación ilustrada en la Figura 15.2. Como consecuencia del proceso de muestreo y posterior reconstrucción de la señal, aparece una frecuencia de 5 kHz que no se encontraba presente en la señal original. Esta frecuencia, que sustituye a la original de 35 kHz, se denomina alias de aquélla. Obsérvese especialmente que la frecuencia original (35 kHz) no producía sensación audible, pero la nueva frecuencia, no sólo es audible sino que está cerca de la región de máxima sensibilidad del oído y por lo tanto se percibirá como un silbido notorio y molesto.
Audio Digital
señal
167
Señal original
t
señal muestreada Señal “reconstruida”
t TM
Figura 15.2. Efecto del muestreo con una frecuencia menor que el doble de la máxima frecuencia contenida en la señal. Una señal de 35 kHz se muestrea con una frecuencia de 40 kHz; al intentar reconstruirla, aparece una frecuencia alias de 5 kHz.
El ejemplo anterior nos está señalando que si pretendemos que la señal pueda reconstruirse correctamente después del proceso de muestreo es imprescindible eliminar toda frecuencia espuria que caiga más allá del espectro de audio, es decir por encima de 20 kHz. Se utiliza para ello un filtro pasabajos de pendiente muy abrupta en la banda de corte (96 dB/octava ó más), denominado filtro antialias (en inglés antialiasing filter). La elección como frecuencia de muestreo estándar de 44,1 kHz para audio digital obedece precisamente a este problema de las frecuencias alias y la consecuente necesidad de un filtro antialias. Si imponemos una frecuencia máxima de 20 kHz para el audio de alta calidad, el filtro antialias deberá tener su frecuencia de corte en 20 kHz, y como su caída es rápida pero no infinitamente rápida, recién después de los 22 kHz se puede considerar que las señales espurias han quedado reducidas a niveles despreciables (Figura 15.3). Por ello se ha adoptado una frecuencia de algo más del doble, es decir 44,1 kHz (el valor exacto de 44,1 kHz en lugar de 44 kHz surgió en los comienzos de la grabación digital en cinta de video, para compatibilizar la norma de audio con la de video). Un inconveniente de los filtros antialias es su gran complejidad y el hecho de que no son del todo inofensivos para la señal dentro de la banda de paso (en este caso la de audio). Aunque el filtro afecte sólo imperceptiblemente la amplitud de la señal en dicha banda, afecta de un modo apreciable la fase, lo cual puede alterar la imagen estéreo.
168
Acústica y Sistemas de Sonido
Además, afecta las señales rápidamente variables agregando pequeños transitorios de frecuencias próximas a la de corte. Por esa razón, otros formatos de audio digital utilizan frecuencias de muestreo más altas, como 48 kHz (el DAT, por ejemplo), que requieren filtros menos complejos. En realidad la frecuencia de 44,1 kHz obedece limitaciones tecnológicas propias de la época en que surgió el compact disc.
ganancia 1
20 22
f [kHz] fM = 44,1
Figura 15.3. Respuesta en frecuencia de un filtro antialias utilizado para audio digital de alta calidad.
15.5. Digitalización Una vez tomada cada muestra es necesario almacenarla, y para ello debe ser transformada en un número, más específicamente, en un número binario. Esta función la cumple un dispositivo denominado conversor analógico-digital (A/D), que convierte valores de tensión en números binarios. Consideremos el ejemplo de la Figura 15.4, en el cual utilizamos números binarios de 3 dígitos. Dado que un dígito binario se denomina bit (del inglés, binary digit), estaremos utilizando, por lo tanto, números de 3 bits. Es fácil ver que existen 8 (= 23) números de 3 bits: 000, 001, 010, 011, 100, 101, 110 y 111. Para representar los diversos valores de tensión que pueden tomar las muestras, dividimos el rango de variación de la señal en 8 niveles, y aproximamos cada muestra al nivel inmediato inferior. En la parte central de la Figura 15.4 se comparan las muestras exactas (puntos vacíos), y las muestras digitalizadas (puntos llenos), aproximándolas de la manera comentada. Vemos que el error máximo que se comete es de una división, que a su vez corresponde a 1 bit. La forma de onda reconstruida difiere considerablemente de la original debido a que una resolución de 3 bits es muy pequeña. En el ejemplo anterior adoptamos, en forma arbitraria, una resolución de 3 bits. El resultado fue, como pudo observarse, bastante deficitario, ya que la onda reconstruida estaba muy distorsionada. Sería interesante disponer de algún criterio más sistemático para seleccionar la resolución requerida. El problema es similar al de decidir cuántos dígitos decimales se necesitan para representar una longitud dada con suficiente precisión. Por ejemplo, si quisiéramos representar la longitud de objetos menores de 1 m con una precisión milimétrica, necesitaríamos 3 dígitos decimales, ya que dichos objetos podrían medir entre 0 y 999 mm. Si en cambio quisiéramos una precisión de décimas de milímetro, necesitaríamos 4 dígitos, ya que los objetos podrían medir entre 0 y 9.999 décimas de mm.
Audio Digital
169
señal 111 110 101 100 011 010 001 000
t
señal muestreada y digitalizada 111 110 101 100 011 010 001 000
t
señal reconstruida
t
Figura 15.4. Efecto del proceso de muestreo y digitalización sobre una onda senoidal. La resolución es de 3 bits y la frecuencia de muestreo 14,7 veces mayor que la frecuencia de la onda. En la figura central los puntos vacíos representan las muestras exactas y los puntos llenos las muestras digitalizadas. Abajo se muestra la señal reconstruida.
En audio, el criterio para determinar la “precisión” es la relación señal/ruido. Analicemos desde este punto de vista el ejemplo de la Figura 15.4. Dejando de lado el ruido propio que pudiera contener la señal, un efecto colateral de la digitalización es la aparición de un error, el cual puede asimilarse a un ruido. Este ruido se conoce como ruido de digitalización. Bajo esta interpretación, el máximo valor pico a pico de la señal es proporcional a 8, y el máximo valor pico a pico de ruido es proporcional a 1. Entonces, la relación señal a ruido es 8/1 = 8, que expresada en dB es
170
Acústica y Sistemas de Sonido
S/R
=
20 log10
8 1
= 18 dB .
Si tenemos en cuenta que en audio de alta fidelidad se manejan hoy en día relaciones señal/ruido mayores de 90 dB, podemos comprender por qué una resolución de 3 bits es por completo insuficiente. Supongamos ahora que aumentamos la resolución a 4 bits. Dado que ahora hay 16 posibles valores en lugar de 8, la relación señal a ruido en dB será ahora S/R
=
20 log10
16 1
=
24 dB .
Vemos que se ha incrementado en 6 dB. Esto puede interpretarse así: si bien la amplitud de la señal no cambió, al duplicar la cantidad de niveles, cada nivel se redujo a la mitad, por lo cual el ruido de digitalización también se redujo a la mitad. Entonces la relación señal a ruido se duplica, y una duplicación equivale a un incremento de 6 dB. Si ahora incrementáramos la resolución nuevamente en 1 bit, llevándola a 5 bits, observaríamos que nuevamente el ruido se reduciría a la mitad, por lo que la relación señal/ruido experimentaría otro incremento de 6 dB. Podemos obtener una expresión general para la relación señal a ruido. Si adoptamos una resolución de n bits, donde n es cualquier número entero, resulta S / R n bits
= 6 ⋅ n dB .
Aplicando esta fórmula a la resolución estándar de 16 bits utilizada en los formatos más populares de almacenamiento de sonido digital, resulta una relación señal/ruido de 96 dB. Esta relación señal/ruido es, en condiciones normales, suficiente para crear contrastes dinámicos imponentes. En efecto, tengamos en cuenta que muy rara vez se tiene en la música un nivel sonoro de más de 110 dB (el cual es realmente ensordecedor y para nada recomendable). Si restamos a este valor 96 dB, obtenemos 14 dB, nivel sonoro que probablemente pocas personas tengan el privilegio de haber “escuchado”, ya que aún en condiciones de gran silencio durante la noche, en una habitación interior, normalmente es difícil bajar de los 20 dB de nivel de presión sonora. Es necesario advertir que aunque un sistema funcione con formato de audio digital de 16 bits, su relación señal/ruido no necesariamente será de 96 dB. Esto se debe a que en los diversos componentes analógicos que forman parte de todo dispositivo se genera ruido que se agrega al ruido de digitalización. En los equipos de bajo costo, como por ejemplo los discman o los minicomponentes, la electrónica de baja costo (y baja calidad) utilizada en su fabricación es particularmente ruidosa y la relación señal/ruido real es bastante menor que 96 dB.
15.6. Reconstrucción de la señal Veamos ahora con más detalle el proceso de reconstrucción de la señal. El procedimiento más simple consiste en obtener, mediante un conversor digital-analógico (D/A), un valor proporcional al número binario de cada muestra y mantenerlo constante
Audio Digital
171
hasta que llegue una nueva muestra, es decir durante un periodo de muestreo TM. Este procedimiento se denomina retención simple. En la Figura 15.5 se muestra este procedimiento para la señal digitalizada de la Figura 15.4. señal reconstruida
t
Figura 15.5. Reconstrucción de la señal digitalizada de la Figura 15.4 mediante una retención simple.
Una vez reconstruida la señal, debemos utilizar un filtro de suavizado, es decir un filtro pasabajos que quite la forma escalonada que resulta de la retención simple. Dicho filtro debe tener características similares a las del filtro antialias que habíamos introducido para la digitalización, es decir, debe ser bastante abrupto para eliminar casi por completo las frecuencias superiores a los 20 kHz, y en cambio permitir pasar las inferiores. Nuevamente, un filtro de ese tipo por un lado es complejo y por el otro produce distorsiones de fase. Para resolver esta situación se ha introducido el concepto de sobremuestreo (oversampling). El sobremuestreo consiste en intercalar, entre las muestras de la señal realmente obtenidas o almacenadas, otras “muestras” calculadas por interpolación. Así, por ejemplo, un sobremuestreo por 8 agrega 7 muestras calculadas por cada muestra real. El resultado equivale a una frecuencia de muestreo 8 veces superior a la original. Si fM = 44,1 kHz, entonces la nueva frecuencia de muestreo es de 352,8 kHz, la cual puede eliminarse con filtros pasabajos mucho más sencillos y con menos efectos sobre la fase y sobre los transitorios de la señal. El sobremuestreo se utiliza hoy corrientemente en los reproductores de compact disc, lo cual es posible porque la velocidad de la electrónica es mucho mayor que lo que era cuando recién había surgido esta nueva tecnología.
15.7. Memorias electrónicas Introduzcamos ahora algunos conceptos relativos a las memorias electrónicas. Existen básicamente dos tipos de memorias: las memorias RAM (random access memory), y las memorias ROM (read only memory). Las memorias RAM son memorias de lectura y escritura, es decir en las cuales es posible escribir (guardar) números binarios, y posteriormente leerlos. Son memorias volátiles, es decir que una vez interrumpido el suministro de energía eléctrica (al desconectar el equipo) la información se pierde. Las memorias ROM son memorias de lectura solamente, en las cuales no es posible
172
Acústica y Sistemas de Sonido
escribir. En ellas hay datos fijos de fábrica, que no se pierden al desenergizar el equipo. Se utilizan mucho para guardar formas de onda muestreadas, como en la mayoría de los sintetizadores actuales. En ambos tipos de memoria los datos se almacenan en posiciones sucesivas, cada una de ellas identificada con un número binario denominado dirección. En la Figura 15.6 se ilustra con un ejemplo la estructura de una memoria con datos de 4 bits y direcciones de 3 bits. Así, en la dirección 0, es decir 000, se encuentra almacenado el número binario 0110 (en decimal, 6), y en la dirección 3, es decir 011, se encuentra
000
001
010
011
100
101
110
111
0110
0001
1110
1101
0010
1000
0001
0010
Figura 15.6. Estructura de almacenamiento de una memoria digital. La memoria se organiza en posiciones identificadas con direcciones.
almacenado el número binario 1101 (en decimal, 13). En la Figura 15.7 se muestran las entradas y salidas principales de una memoria RAM. Cuando nos referimos a una entrada de datos de 4 bits, por ejemplo, en realidad está formada por 4 líneas o cables, y por eso tanto la entrada como la salida y la dirección se han dibujado como flechas
Datos Lectura
Memoria RAM
Datos
Escritura
Dirección
Figura 15.7. Entradas y salidas de una memoria RAM. Las flechas delgadas representan señales binarias de 1 bit de control, y las flechas gruesas son datos digitales de varios bits.
gruesas. Las entradas de lectura y escritura son señales binarias de 1 bit, cuya función es de control. Cuando la entrada de escritura toma el valor 1, el dato digital X presente en ese instante en la entrada de datos se escribirá en la dirección D indicada por la entrada de direcciones. Para leer dicho valor, bastará volver a aplicar el valor D en la entrada de direcciones y dar valor 1 a la entrada de lectura. El valor guardado aparecerá en la salida de datos. Desde el punto de vista del conexionado, la única diferencia entre una memoria RAM y una ROM es que esta última no tiene entrada de escritura. En el caso de la RAM, después de escribir un dato en una dirección éste quedará almacenado allí hasta
Audio Digital
173
que se escriba un nuevo dato en el mismo lugar o hasta que se interrumpa el suministro de energía eléctrica al circuito. Aunque por razones conceptuales nos hemos referido a la entrada y la salida de datos como si fueran entidades físicamente diferentes, en realidad son el mismo conjunto de líneas cuya función en cada instante depende de cuál de las entradas de control valga 1. Si ambas entradas son 0, dichas líneas se desconectan de modo de no cargar al resto del circuito.
15.8. Dither Cuando se digitalizan señales de muy bajo nivel (cercano a la resolución del conversor) el ruido de digitalización se convierte en una distorsión, cuyo efecto es más perjudicial que el de un ruido aleatorio. Por ejemplo, si se digitaliza una señal senoidal de 100 Hz y amplitud apenas menor que un escalón (Figura 15.8), se obtiene una señal señal 101 100 t 011 010
Figura 15.8. Distorsión creada al muestrear señales de bajo nivel.
que al reconstruirse será nuy similar a una onda cuadrada, y por lo tanto contendrá armónicos de 300 Hz, 500 Hz, 700 Hz, etc. Si en lugar de una onda senoidal se aplicaran dos o más, aparecería, similarmente, una distorsión por intermodulación sumamente indeseable. Una manera de evitar estos inconvenientes es aplicar una pequeña cantidad de ruido aleatorio antes del muestreo y posterior digitalización. Este ruido, cuyo valor eficaz es, normalmente, menor que un escalón, se denomina dither. Si bien el efecto es empeorar ligeramente la relación señal a ruido, desde el punto de vista auditivo transforma esta distorsión en un ruido aleatorio, que es mucho más aceptable, sobre todo en niveles tan bajos. También se acostumbra a aplicar dither en los procesos de recuantización, es decir cuando, por ejemplo, se desea reducir la resolución de una señal grabada en 20 bits a 16 bits a fin de volcarla a un formato comercial como el compact disc. Si solamente se truncaran los datos de 20 bits eliminando los 4 bits menos significativos, se producirían inconvenientes similares al descripto. En ese caso, el ruido se genera digitalmente y se agrega antes de proceder al truncado.
206
Acústica y Sistemas de Sonido
23.
Capítulo 23
Registro magnético 23.1. Introducción Al hablar de registro magnético se hace referencia al registro de señales o información en cualquier tipo de soporte basado en la magnetización. Así, al principio de la magnetofonía se utilizaban alambres y cintas de acero, y posteriormente durante algún tiempo se utilizaron cintas de papel recubiertas con materiales magnéticos. En la actualidad se utilizan cintas plásticas (por ejemplo de poliéster, o mylar) recubiertas por una emulsión con partículas ferromagnéticas, discos flexibles (diskettes o floppy disks), y discos rígidos (hard disks). Estos dos últimos se utilizan para almacenar información y/o señales digitales, mientras que las cintas permiten almacenar señales analógicas y digitales, así como información digital no temporal (por ejemplo el tape back up). Aún cuando a mediano plazo el soporte magnético deje de tener la prevalencia de que goza hoy en día (2000) para ser reemplazado por la memoria digital integrada y los diversos tipos de tecnología óptica, por algún tiempo va a continuar siendo una opción económica para el registro de la señal de audio, tanto en su forma analógica (cinta, cassette) como en su forma digital (DAT, 8mm, SVHS ), y por ello es importante conocer sus principios, así como sus posibilidades y sus limitaciones.
23.2. Magnetismo y electromagnetismo Probablemente la mayoría de las personas esté familiarizada con algunos fenómenos magnéticos básicos, como la atracción que producen los imanes sobre el hierro, o la atracción o repulsión que tiene lugar entre dos imanes según la orientación relativa de sus polos. Sin embargo, no todos conocen la importante interacción que existe entre los fenómenos eléctricos y los magnéticos. 23.2.1. Campo magnético y fuerza sobre cargas móviles El fenómeno más elemental es el que permite definir el campo magnético. Se dice que en un determinado punto hay presente un campo magnético cuando una carga eléctrica móvil que pasa por ese punto experimenta una fuerza que tiende a desviar su movimiento. El ejemplo más conocido de cargas en movimiento es la corriente eléctrica, de manera que un cable que transporta corriente eléctrica experimenta una fuerza cuando se encuentra en un campo magnético.
Registro Magnético
207
Los imanes son objetos capaces de provocar espontáneamente un campo magnético a su alrededor, de modo que si acercamos un imán a un cable por el que circula corriente eléctrica, se producirá una fuerza sobre el cable. De hecho este es el principio de operación no sólo del motor sino de los altavoces de bobina móvil, ya vistos en el capítulo 10. También se ha utilizado este principio en los instrumentos de medición analógicos (por ejemplo el téster o multímetro y los vúmetros de algunos amplificadores, consolas, etc.). En estos casos, dado que la fuerza sobre un solo conductor es relativamente pequeña, se utilizan varios conductores transportando la misma corriente, y para ello simplemente se arrolla el conductor en forma de bobina. Así, si la bobina tiene 50 espiras, a pesar de que se trata de la misma corriente que pasa por todas las espiras, desde el punto de vista de la interacción electromagnética es como si hubiera 50 cables independientes, o un solo cable con una corriente 50 veces mayor. Cualquiera sea la interpretación, el resultado concreto es que la fuerza es 50 veces más alta. 23.2.2. Campo magnético creado por cargas móviles El segundo fenómeno importante de interacción eléctrica y magnética es el hecho de que una carga móvil crea a su alrededor un campo magnético. Dado que una corriente eléctrica son cargas en movimiento, resulta que una corriente genera un campo magnético. Igual que en el caso anterior, cuanto mayor sea la corriente circulando en un mismo sentido, mayor será el campo magnético generado, y por lo tanto también es válido el recurso de arrollar un mismo cable formando una bobina con varias espiras. En la sección siguiente veremos que también es posible aumentar el campo magnético producido utilizando un núcleo de hierro dentro de la bobina. 23.2.3. Fuerza electromotriz inducida El tercer fenómeno de interacción electromagnética es, quizás, el más sorprendente. Cuando se tiene un circuito cerrado atravesado por un campo magnético variable aparece una fuerza electromotriz inducida en el circuito, que equivale a insertar una fuente de tensión en el circuito. Dicha tensión inducida es tanto mayor cuanto más rápido esté cambiando el campo magnético. Si el circuito (o parte de él) se arrolla en forma de bobina, el campo magnético induce en cada espira la misma tensión, con lo cual la tensión total inducida se multiplica por el número de espiras. Hay dos formas sencillas en que se puede obtener un campo variable en el tiempo. La primera es moviendo el circuito cerca de un imán, alejándolo y acercándolo (el campo magnético es mayor cerca de los polos). Esto es lo que sucede en el micrófono dinámico. La bobina se desplaza impulsada por las variaciones de presión sonora. También sucede en las dínamos. En este caso la bobina gira a causa de un movimiento impuesto externamente, pasando alternativamente frente a un imán. El campo magnético que atraviesa la bobina varía, y ésta genera tensión. La otra forma de obtener un campo magnético variable es la que se usa en los transformadores: el campo magnético es generado por otra bobina (denominada arrollamiento primario) por la cual circula una corriente variable en el tiempo, es decir alterna. 23.2.4. Líneas de fuerza Una forma útil para visualizar un campo magnético son las llamadas líneas de campo o líneas de flujo, o también líneas de fuerza. Son siempre curvas cerradas, y en las zonas donde el campo magnético es más intenso tienden a estar más próximas unas
208
Acústica y Sistemas de Sonido
de otras. Esto permite, de un simple golpe de vista, tener idea de cómo está distribuido el campo, como se puede ver en el ejemplo de la Figura 23.1a. En algunos casos es posible poner de manifiesto experimentalmente las líneas de campo. El ejemplo más conocido consiste en colocar un imán debajo de una cartulina y espolvorear limaduras de hierro sobre la cartulina. Las limaduras se acomodan creando un diseño muy similar a las líneas de campo Figura 23.1b.
N N
S S (a)
(b)
Figura 23.1. (a) Líneas de campo trazadas gráficamente en el caso de un imán. (b) Las líneas de campo puestas en evidencia experimentalmente mediante limaduras de hierro.
23.3. Ferromagnetismo Antes de enfocar el problema específico del registro magnético es preciso incursionar brevemente en los aspectos básicos del ferromagnetismo. Los materiales ferromagnéticos, como el hierro, el cobalto, el cromo, el níquel, el gadolinio, el neodimio, y algunos compuestos y aleaciones de éstos, tienen la particularidad de que al ser inmersos en un campo magnetizante suficientemente intenso, luego de interrumpido éste conservan un magnetismo remanente, es decir que crean por sus propios medios un campo magnético en sus proximidades. La explicación física de la aparición de magnetismo espontáneo sin corrientes aparentes está en el movimiento de los electrones dentro del átomo, tanto alrededor del núcleo atómico (orbital) como alrededor de sí mismos (spin). Estos movimientos giratorios constituyen minúsculas corrientes que producen pequeños campos magnéticos (Figura 23.2). En los materiales no ferromagnéticos (llamados paramagnéticos o diamagnéticos), estos campos magnéticos están orientados al azar, por lo cual sus efectos se cancelan, dando origen a campos magnéticos despreciables. En los materiales ferromagnéticos, en cambio, existen pequeñas regiones (de dimensiones normalmente de algunas centésimas de mm o menos) con la propiedad de que los campos magnéticos de todos sus átomos tienen la misma orientación, y por lo tanto se suman. Estas regiones se denominan dominios magnéticos, y son comparables a pequeños pero poderosos imanes (Figura 23.3).
Registro Magnético
209
órbita spin
núcleo
electrón
Figura 23.2. Un electrón moviéndose alrededor del núcleo del átomo y alrededor de su propio eje implica la existencia de minúsculas corrientes que producen un campo magnético.
Figura 23.3. Representación esquemática de los dominios magnéticos en un trozo de hierro como pequeños imanes orientados al azar. El campo magnético resultante es nulo.
En 1 cm3 de hierro virgen, es decir no magnetizado, puede haber miles de millones de estos dominios, y si bien dentro de cada dominio los campos magnéticos atómicos o moleculares están alineados, los campos resultantes de dominios diferentes están orientados al azar, de manera que se tiende a producir una cancelación de dichos campos. El resultado es que no existe campo magnético a nivel global. Pero si se aplica un campo magnético externo, se producen dos fenómenos: a) los dominios cuya orientación coincide con la orientación del campo magnético aplicado aumentan de tamaño en detrimento de los restantes, y b) se produce una reorientación del campo magnético de los dominios. El fenómeno a) ocurre cuando el campo aplicado es débil o medianamente intenso, y el b) cuando es muy intenso (Figura 23.4). Debe aclararse que la reorientación del campo no implica movimiento mecánico de los dominios. Una primera consecuencia es que el campo magnético se multiplica enormemente, tanto más cuanto más fácilmente se produzcan los fenómenos mencionados, es decir cuanto mayor sea la permeabilidad magnética del material. En el hierro puro, por ejemplo, la reorientación se logra fácilmente, es decir que es suficiente un campo magnético externo pequeño. El acero, por el contrario, requiere campos más intensos. Un ejemplo de esta multiplicación del campo la constituye el electroimán. Si tomamos alambre de cobre esmaltado (como el que se usa para bobinar transformadores) y lo arrollamos formando una bobina alrededor de un carretel vacío de hilo de coser, y conectamos los extremos (raspados para eliminar el esmalte) a una pila, circulará una co-
210
Acústica y Sistemas de Sonido
rriente por el arrollamiento, generando un campo magnético bastante débil en su interior, de hecho insuficiente para atraer trozos de hierro. Pero si ahora introducimos una barra de hierro en el orificio del carretel, el campo magnético se incrementará, obteniendo el equivalente de un pequeño imán, que podrá atraer ahora alfileres y otros objetos de hierro (Figura 23.5).
(a)
(b) Figura 23.4. (a) En un campo magnético débil los dominios mejor orientados aumentan de tamaño, a costa del resto. (b) Si el campo aplicado es más intenso, además se reorientan los dominios, de modo que la mayoría están en direcciones próximas a la del campo.
La segunda consecuencia es que si retiramos el campo magnetizante (en el ejemplo anterior, si desconectamos la pila) el hierro no vuelve al estado previo, sino que queda magnetizado con un magnetismo residual o magnetismo remanente, y entonces se obtiene un imán permanente (Figura 23.5c). En otras palabras, el fenómeno de magnetización no es reversible. La tercera consecuencia es que la relación entre el campo magnetizante y el campo magnético obtenido no es lineal. Si se incrementa demasiado el campo magnetizante, finalmente terminan reorientándose todos los dominios y entonces se llega al máximo campo magnético posible. Este estado del material se denomina saturación magnética (ver la Figura 23.6).
Registro Magnético
(a)
211
(b)
(c)
Figura 23.5. (a) Una bobina sin núcleo por la que circula una corriente genera un campo magnético muy débil para atraer objetos. (b) Al agregar un núcleo ferromagnético, se transforma en un electroimán. (c) Al retirar la bobina, el núcleo conserva un magnetismo remanente, comportándose ahora como un imán.
Figura 23.6. Cuando el campo aplicado es demasiado intenso, todos los dominios se orientan en la dirección del campo aplicado y el material entra en saturación magnética.
Todo lo anterior puede resumirse en la curva de la Figura 23.7. En lugar del campo magnetizante se utiliza la fuerza magnetizante, H, que difiere sólo en una constante de aquél (lo cual equivale a un simple cambio de escala). Vemos que cuando H es pequeño, el campo magnético resultante del cambio de tamaño de los dominios crece lentamente. Cuando H es más intensa, el campo comienza a crecer más rápidamente, hasta que se alcanza el nivel en el que se reorientan los dominios, donde sobreviene la saturación. Al disminuir nuevamente H, el campo magnético no disminuye tan rápido como había aumentado, de suerte que al llegar a H = 0 el campo B no se reduce a 0 sino que queda en un valor residual, el magnetismo remanente, BR. La vuelta por una curva diferente de la de ida se denomina histéresis, y puede interpretarse como que el material ferromagnético tiene “memoria” de su historia magnética. Esta histéresis es la base de la grabación magnética, tanto analógica como digital. Nos preguntamos ahora qué sucede si en lugar de aplicar una fuerza magnetizante que lleva al material a la saturación aplicamos diferentes valores menores. Resulta que
212
Acústica y Sistemas de Sonido
el magnetismo remanente depende del valor de la fuerza magnetizante aplicada (Figura 23.8). Podemos trazar una curva de transferencia, graficando el valor del magnetismo remanente BR en función de la fuerza magnetizante máxima aplicada en cada caso. La gráfica, presentada en la Figura 23.9 para fuerzas magnetizantes positivas y negativas, resulta bastante alineal.
B Saturación
2 Magnetismo Remanente
1 H Figura 23.7. Curva que da la relación entre la fuerza magnetizante H y el campo magnético B. A partir de 1 el aumento de tamaño de los dominios se hace irreversible. A partir de 2 comienza la reorientación de los dominios. El descenso por un camino diferente del ascenso se conoce como histéresis.
B
H Figura 23.8. Curvas de histéresis mostrando cómo para diferentes valores de la fuerza magnetizante H se obtienen diferentes magnetismos remanentes, al hacer luego H = 0.
BR
H
Figura 23.9. Curva de transferencia entre la fuerza magnetizante y el magnetismo remanente.
Registro Magnético
213
23.4. Principios de la grabación magnética La idea subyacente en la grabación magnética es la de generar una fuerza magnetizante proporcional a la señal a grabar, y aplicarla mediante el cabezal de grabación en una pequeña región de una cinta recubierta con partículas ferromagnéticas. Estas partículas reaccionan produciendo un campo magnético determinado mientras se encuentra presente la fuerza magnetizante. Al desplazarse la cinta, la región afectada deja de ser alcanzada por la fuerza magnetizante y su campo magnético disminuye hasta llegar al magnetismo remanente (Figura 23.10). Dado que este magnetismo remanente depende del valor de la fuerza magnetizante, y ésta a su vez dependía de la señal, resulta que el magnetismo remanente varía con la señal.
+
+
Emulsión Base (a)
(b)
Figura 23.10. Proceso simplificado de grabación en una cinta recubierta con partículas ferromagnéticas. En (a) se aplica un pulso de corriente a la bobina. En (b) la cinta se ha desplazado, y la zona previamente sometida a una fuerza magnetizante permanece magnetizada.
23.5. Principios de la reproducción magnética Una vez grabada la señal en una cinta, es necesario disponer de un método para reproducirla. La idea consiste en volver a pasar la cinta frente al núcleo de una bobina, que funcionará ahora como fuente generadora de señal bajo el principio de la fuerza electromotriz inducida. Al pasar la región magnetizada frente al núcleo de la bobina, el campo magnético que la atraviesa va variando, lo cual hace aparecer una fuerza electromotriz que puede aplicarse a la entrada de un preamplificador (Figura 23.11). Lamentablemente, la respuesta en frecuencia obtenida mediante este proceso de reproducción no es plana, sino que corresponde a un filtro pasaaltos. En efecto, dado que la bobina genera tensión sólo cuando el campo varía, cuanto más rápidamente varíe éste, es decir cuanto mayor sea su frecuencia, mayor será la fuerza electromotriz inducida. Este inconveniente se soluciona por medio de una ecualización, que ordinariamente se encuentra en el mismo preamplificador. Como ecualizador se utiliza un filtro pasabajos de un tipo particular llamado integrador. La salida de este ecualizador provee una respuesta razonablemente plana, al menos dentro de los límites que se comentarán más adelante.
214
Acústica y Sistemas de Sonido
Preamplificador y ecualizador + −
Emulsión Base
Figura 23.11. Proceso simplificado de reproducción de la cinta magnética de la Figura 23.10
23.6. Estructura del cabezal de grabación/reproducción En el diagrama de la Figura 23.10 se dibujó el elemento transductor entre la señal eléctrica y la señal magnética como un simple electroimán enfrentado a la cinta. Este esquema tiene dos inconvenientes serios: a) hay una gran dispersión del campo magnético, es decir una imprecisión en la localización del mismo, que entre otras cosas reduce enormemente la respuesta en frecuencia del sistema, y b) si bien una fuerza magnetizante produce un campo magnético muy intenso dentro del núcleo, fuera de él el campo se atenúa debido a que hay demasiado aire entre uno y otro extremo del núcleo, y las líneas de campo tienden a separarse en el aire mucho más que en el hierro (recordemos que el campo magnético es mayor donde hay gran concentración de líneas de campo). Estas dificultades pueden subsanarse adoptando un diseño semicerrado para el núcleo de la bobina, como se ilustra en la Figura 23.12. Si el núcleo estuviera completamente cerrado, el campo magnético quedaría prácticamente confinado a él sin posibilidad de afectar a la cinta (ya que las líneas de campo no tendrían por donde salir). Por esa razón, existe una pequeña abertura, denominada entrehierro, que es precisamente
+
Bobina Núcleo
Entrehierro Figura 23.12. Estructura de un cabezal de grabación. El núcleo se ha cerrado sobre sí mismo, dejando sólo una pequeña abertura: el entrehierro.
Registro Magnético
215
donde el núcleo toma contacto con la cinta. Para minimizar los problemas anteriores, el entrehierro se hace muy pequeño, del orden de 2 µm (unas 50 veces más delgado que una hoja de papel). De ese modo, la dispersión se reduce mucho, lo cual implica a su vez que las líneas de campo no se separan tanto (Figura 23.13). Por otra parte, cuando se apoya la cinta en el entrehierro, dado que se sustituye parte del aire por un material magnético (las partículas de la cinta), el campo creado será mayor. El entrehierro no puede hacerse mucho menor que eso, ya que el campo de dispersión en la parte expuesta comenzaría a reducirse ya excesivamente, produciendo una magnetización muy pobre de la cinta. Normalmente el entrehierro se rellena con un material no magnético, que puede ser un aislante o un metal como el oro, el bronce fosforoso o el aluminio. En cada instante, cada extremo del entrehierro adquiere una polaridad magnética (que se invierte cuando la señal cambia de signo).
Entrehierro Núcleo
S
N
Figura 23.13. Las líneas de campo se dispersan algo en el entrehierro, pero mucho menos que en el caso de una barra.
En los grabadores profesionales se utilizan dos bobinas en paralelo en lugar de una sola (Figura 23.14), ya que de esa forma se consigue reducir los campos magnéticos externos, particularmente los provenientes de zumbidos de transformadores, motores, etc. El concepto es similar al de las líneas balanceadas. Un campo magnético externo tiende a atravesar todo el núcleo en la misma dirección, mientras que el campo creado por los arrollamientos es opuesto en cada lateral. El campo externo inducirá (al variar) tensiones opuestas en los dos arrollamientos. Como éstos están en paralelo, tenderá a circular una corriente, la cual generará un campo magnético opuesto al externo, contrarrestándolo. Otra ventaja de las bobinas en paralelo es que permiten circular mayor corriente, con lo cual la fuerza magnetizante será mayor.
+
Figura 23.14. Cabezal de grabación con dos bobinas para contrarrestar el efecto de los campos magnéticos externos.
216
Acústica y Sistemas de Sonido
Los campos magnéticos externos también pueden contrarrestarse mediante adecuados blindajes magnéticos. Se consigue un blindaje magnético rodeando cualquier bobina con una cubierta de material ferromagnético. En el caso del cabezal, salvo la abertura del entrehierro, se lo recubre completamente con una funda de materiales como el mumetal (Muntz metal, aleación de níquel, hierro y cobre de alta permeabilidad). Normalmente, el núcleo se fabrica laminado (igual que el núcleo de un transformador), lo cual significa que se utilizan delgadas láminas con la forma mostrada en la Figura 23.12 superpuestas hasta obtener el espesor requerido (Figura 23.15). Esto es para evitar la generación de corrientes inducidas en el propio núcleo, llamadas corrientes de Foucault. Estas corrientes aparecen porque al ser el núcleo conductor eléctrico, se forman miles de pequeños circuitos que son atravesados por un campo magnético variable. Entonces en cada uno se genera una fuerza electromotriz que hace circular corriente. Las corrientes de Foucault tienen dos inconvenientes: crean campos magnéticos que se oponen al que se quiere producir, y generan potencia que se disipa en forma de calor. El resultado es una disminución del campo efectivo y un calentamiento del núcleo. Al dividir el núcleo en láminas, los circuitos se reducen, por lo cual el campo magnético que abarcan es menor, haciendo disminuir estas corrientes parásitas.
Figura 23.15. Núcleo laminado para reducir las corrientes de Foucault (por simplicidad se muestran sólo tres láminas).
La estructura del cabezal de reproducción es muy similar, y de hecho en la mayoría de los grabadores de cassette se utiliza un solo cabezal que cumple alternativamente una y otra función. Cuando se utilizan cabezales separados, como en los grabadores profesionales, la diferencia es que el cabezal de reproducción puede tener un entrehierro más pequeño, lo cual favorece, según veremos, la respuesta frecuencial (sección 23.8). Otra diferencia estriba en la forma de conexión de las bobinas. Para la reproducción se conectan en serie y no en paralelo, porque así se obtiene mayor salida de señal, y en cambio se cancelan las tensiones, opuestas, debidas a campos parásitos externos.
23.7. Polarización con corriente continua y alterna La curva de la Figura 23.9 muestra que la relación entre la señal aplicada al cabezal (que es proporcional a la fuerza magnetizante H) no es lineal, lo cual implica que la señal se grabará con grandes distorsiones, como se muestra en la Figura 23.16, a menos que hagamos algo al respecto. La primera idea es sumar a la señal una componente
Registro Magnético
217
BR
BR b
Curva de transferencia no lineal
Salida a H
t
H
Entrada
t Figura 23.16. Distorsión producida sobre una onda senoidal por la curva de transferencia no lineal entre la fuerza magnetizante y el campo magnético remanente. Para referencia se ha incluido en línea de puntos la onda que se obtendría si no hubiera distorsión.
constante de modo de llevar la operación a la zona entre los puntos a y b, que es bastante lineal, lo cual se muestra en la Figura 23.17. Según se puede observar, previamente es preciso reducir el nivel de la señal, lo cual repercute negativamente en la relación señal/ruido (disminuye la señal pero no el ruido). Este tipo de acción por la cual se desplaza el punto de operación de un sistema para obtener alguna mejora en su comportamiento se denomina polarización. En este caso se trata de una polarización con corriente continua, dado que se está sumando una corriente continua. La señal grabada posee una componente constante, ya que está desplazada en su totalidad hacia las magnetizaciones positivas. Esto carece de importancia, dado que el cabezal de reproducción es sensible sólo a las variaciones de campo, como ya se ha señalado, por lo tanto es lo mismo que las variaciones se produzcan entre un valor negativo y otro positivo que entre dos valores positivos, en tanto la velocidad de variación sea la misma. La polarización de corriente continua, si bien permite resolver el problema de la linealidad, adolece del problema ya comentado de una pobre relación señal/ruido. Esto se debe a que de toda la curva de magnetización se está utilizando una zona muy restringida, y dado que la cinta es un medio inherentemente ruidoso (ver la sección 23.10), en la práctica es muy difícil lograr una relación señal/ruido mayor de 30 dB, lo cual para los estándares de audio de buena calidad es inadmisiblemente bajo.
218
Acústica y Sistemas de Sonido
BR
BR Salida
b Curva de transferencia no lineal
a H
t
H
Entrada
t Figura 23.17. Efecto de linealización de una polarización de corriente continua.
Afortunadamente, todavía en los albores de la grabación (1927), Carlson y Carpenter propusieron un método de polarización por corriente alterna que mejoró notablemente las posibilidades de la grabación en cinta magnética. Esta polarización consiste en superponer a la señal una senoide de alta frecuencia (típicamente mayor de 70 kHz, llegando inclusive a más de 250 kHz) de amplitud entre 5 y 25 veces mayor que el nivel máximo de grabación (Figura 23.18). Aunque las razones por las cuales este tipo de polarización funciona no son tan sencillas de explicar como en el caso de la polarización con corriente continua, la idea es la siguiente. El nivel de polarización aplicado es tan grande, que el material ferromagnético de la cinta es obligado, mientras la cinta está pasando frente al cabezal de grabación, a ir una y otra vez entre la saturación en un sentido y la saturación en el otro sentido. Esto hace que se describa un ciclo de histéresis completo una y otra vez, como se muestra en la Figura 23.19. Cuando la cinta está abandonando el entrehierro, la fuerza magnetizante efectiva que recibe la cinta se va haciendo cada vez menor, y entonces el ciclo de histéresis se reemplaza por una espiral de histéresis que tiende a un valor límite de magnetismo remanente (Figura 23.20). Resulta que ese valor límite está relacionado mucho más linealmente con la señal que sin polarización, con la ventaja con respecto a la polarización con corriente continua de que se aprovecha casi todo el rango magnético del material de la cinta.
Registro Magnético
219
H
t
Figura 23.18. Forma de onda de una polarización con corriente alterna. En línea de puntos, la señal. En línea llena, la señal más la polarización (en este ejemplo de frecuencia 5 veces mayor que la señal).
B
Br
Hc
H
Figura 23.19. Ciclo o lazo de histéresis, formado al llevar las partículas ferromagnéticas hasta saturación en uno y otro sentido repetitivamente. Hc es la denominada fuerza coercitiva, y Br, la remanencia.
23.8. Borrado Para el borrado de la cinta se utiliza un principio similar al de la grabación, sólo que en este caso se “graba” una señal nula, pero con una polarización de corriente alterna de nivel mucho más alto. En general se utiliza el mismo oscilador de la polarización del cabezal de grabación, pero más amplificado. La idea es que la cinta experimente una serie de ciclos de histéresis como los de la Figura 23.20 pero que la lleven a un valor nulo. Este proceso se conoce como desmagnetización de la cinta.
220
Acústica y Sistemas de Sonido
B
Valor límite
H
Figura 23.20. Proceso de grabación con polarización de alta frecuencia. Se ha supuesto un valor positivo de señal. Cuando la cinta va abandonando el entrehierro del cabezal, se produce una espiral de histéresis que tiende a un valor límite de magnetización remanente.
Una razón por la cual hace falta una polarización de mayor nivel reside en que se parte de un valor original pregrabado, y en el fenómeno de histéresis el valor inicial tiene influencia aún muchos ciclos después. Con una mayor señal se logra entrar repetidamente en una saturación más profunda, lo cual ayuda a que el material “olvide” su magnetización previa. Otra razón estriba en que cuanto mayor sea el número de ciclos del proceso de desmagnetización, más perfecta será ésta, razón por la cual conviene que el entrehierro sea más bien ancho, por ejemplo 100 µm (es decir 0,1 mm), lo cual atenúa el campo considerablemente, a menos que se eleve la fuerza magnetizante. En la Figura 23.19 se introduce el concepto de fuerza coercitiva, Hc, que corresponde al valor de fuerza magnetizante opuesta a una magnetización dada para llevar el campo magnético a 0. Si bien esto no es equivalente a borrar la cinta (dado que al eliminar la fuerza magnetizante externa el magnetismo vuelve a aumentar), el valor de la fuerza coercitiva influye en la facilidad o dificultad de borrado. Así, un material con pequeña fuerza coercitiva se desmagnetizará fácilmente, en tanto que uno con alta fuerza coercitiva lo hará con dificultad.
23.9. Respuesta en frecuencia Una consideración muy importante en el proceso de grabación es la respuesta en frecuencia del sistema. Veremos que depende del ancho del entrehierro del cabezal de reproducción y de la velocidad de la cinta. También depende del espesor de la emulsión ferromagnética sobre la cinta y de su composición.
Registro Magnético
221
Antes de obtener relaciones entre los parámetros mencionados y la respuesta en frecuencia, tengamos en cuenta que si grabamos una senoide de frecuencia f en una cinta que se mueve a una velocidad v, dado que un ciclo demora un tiempo T = 1/f, la distancia recorrida por la cinta durante un ciclo será d = v⋅T =
v f
.
Esto significa que cada ciclo ocupará sobre la cinta una longitud igual a d. Por ejemplo, si la cinta se mueve a una velocidad de 7,5 ”/s, es decir 190,5 mm/s, un ciclo de frecuencia 20 kHz ocupará d =
190,5 20.000
= 0,00952 mm = 9,52 µm
Por cada ciclo grabado habrá sobre la cinta un polo norte y un polo sur, correspondientes al máximo y al mínimo de la senoide. La distancia entre estos polos será d/2, que en nuestro ejemplo corresponde a 4,76 µm. Ahora bien, dado que en el entrehierro sólo hay dos polos, el entrehierro del cabezal reproductor deberá abarcar como máximo una distancia d/2 para obtener una respuesta aceptable de la bobina. Para comprender mejor esto, supongamos que el entrehierro ocupa una distancia igual a d, como se muestra en la Figura 23.21. En este caso ambos lados del entrehierro están siempre sometidos al mismo valor de magnetización, ya sea positivo (polo norte), negativo (polo sur) o cero, de manera que la diferencia es siempre cero. Al no haber variación del campo magnético dentro del núcleo, no puede haber tensión inducida en las bobinas del cabezal, por lo que la respuesta es nula.
e
h
Emulsión N
S
Base Figura 23.21. Si el entrehierro es demasiado ancho, ambos lados están sometidos siempre al mismo campo magnético, por lo tanto no hay variaciones de campo y no se induce tensión en los bobinados.
Si, en cambio, se cumple la condición de que el entrehierro tenga un ancho e menor que d/2, el resultado es que siempre serán captadas correctamente las diferencias de magnetización, obteniéndose una respuesta aceptable.
222
Acústica y Sistemas de Sonido
En la práctica existen otros factores que hacen que la longitud efectiva del entrehierro sea mayor que la real, como el hecho de que en presencia de la cinta el campo magnético se dispersa un poco a ambos lados del entrehierro, por lo que es recomendable que el ancho físico del entrehierro cumpla en realidad e <
d
v
=
5
5f
.
En nuestro ejemplo anterior, resultará necesario un ancho de aproximadamente unos 2 µm para asegurar la reproducción satisfactoria de los 20 kHz. Despejando f de la desigualdad anterior, se puede obtener la frecuencia máxima que será reproducida si se conoce la velocidad de la cinta y el entrehierro: v
=
f máx
.
5e
Esta fórmula es interesante porque indica que la respuesta en frecuencia aumenta al aumentar la velocidad de la cinta y al reducir el entrehierro. El tercer parámetro que afecta la respuesta en frecuencia está dado por el espesor h de la emulsión ferromagnética de la cinta, ya que las altas frecuencias sólo utilizan la parte más superficial de la emulsión. Si la emulsión es gruesa, se verán favorecidas las bajas frecuencias, pero no las altas. Esto es equivalente a un filtro pasabajos con una frecuencia de corte dada por fc
=
v 2π h
,
donde v es, nuevamente, la velocidad de tracción de la cinta, y h es el espesor de la emulsión. Este valor suele ser demasiado bajo para ser admisible. Por ejemplo, para un espesor típico de 440 micropulgadas, es decir 11,2 µm, resulta una frecuencia de corte fc
=
190,5 2 × π × 0,0112
= 2.707 Hz .
Esto se soluciona por medio de un ecualizador en el circuito de grabación que aumenta la respuesta en alta frecuencia (por encima de la frecuencia de corte), compensando esta caída. Es habitual especificar este valor como una constante de tiempo, T: T =
h v
,
lo cual permite seleccionar la red de ecualización para cada tipo de cinta. En las cintas de los cassettes, por ejemplo, estas constantes suelen ser de 120 µs para cintas normales y 70 µs para cintas de cromo o de metal. Es conveniente aclarar que a la ecualización llevada a cabo en el grabador se agregan otras cuatro componentes de ecualización en el sistema:
Registro Magnético
223
a) Una compensación de las pérdidas en el cabezal de grabación. b) Una compensación de las pérdidas en el cabezal de reproducción. c) Una caída en alta frecuencia incluida en el preamplificador de reproducción, denominada integración, necesaria para compensar la mayor respuesta de una bobina a campos magnéticos de alta frecuencia. d) Un par de curvas de ecualización complementarias (una en el grabador y la otra en el reproductor), normalizadas por la NAB (National Association of Broadcasters) para las cintas abiertas y por DIN (Deutsche Industrie Norm) para los cassettes. Estas ecualizaciones son “transparentes” al usuario, es decir que el usuario no advierte su presencia ni tiene control sobre ellas. Otro elemento que influye en la respuesta en frecuencia de la cinta es el borrado residual que produce la propia polarización con corriente alterna, el cual se manifiesta más en alta frecuencia, ya que la señal de alta frecuencia se registra con menor nivel. Podemos concluir, entonces, que las cintas con una gran fuerza coercitiva, y que por lo tanto resisten más la desmagnetización, poseerán mejor respuesta en alta frecuencia. El último factor que incide en la respuesta en frecuencia de un sistema de grabación en cinta es el azimut del entrehierro, es decir el ángulo que forma éste respecto a su posición normal (perpendicular a la dirección de movimiento de la cinta; ver Figura 23.22). En general siempre hay un pequeño ángulo de azimut, debido imprecisiones en los ajustes o al desgaste o aflojamiento de los tornillos de sujeción. La respuesta en baja frecuencia se ve poco afectada por el azimut, pero la respuesta en alta frecuencia es sumamente sensible a dicha inclinación, reduciéndose considerablemente. cabezal
cabezal azimut
cinta
cinta
(a)
(b)
Figura 23.22. (a) Posición normal del entrehierro, perpendicular a la dirección de movimiento de la cinta. (b) Entrehierro inclinado un cierto ángulo, denominado azimut.
23.10. La cinta magnética La cinta magnética está formada, como se indicó, por una base plástica, generalmente de mylar (tereftalato de polietileno), y una emulsión o revestimiento magnético. La base debe poseer una gran resistencia a la tensión, y una muy baja deformación por estiramiento, para evitar fluctuaciones de la frecuencia grabada, conocidas como flutter (flameo). Estas fluctuaciones se deben a estiramientos desparejos, que hacen que ciclos originalmente iguales queden registrados ocupando longitudes diferentes, por lo cual se reproducen con duraciones diferentes. También es preciso que la base no expe-
224
Acústica y Sistemas de Sonido
rimente dilataciones con la temperatura, que conducirían a un desplazamiento de la frecuencia reproducida y un consecuente cambio en la duración del registro. Respecto al espesor de la base, por un lado conviene que sea pequeño, para permitir una mayor cantidad de cinta por carrete, lo cual posibilita mayor tiempo de grabación o mayor velocidad (con la consecuente mejora en la respuesta en alta frecuencia). Por otro lado, un espesor demasiado pequeño implica la posibilidad de que el magnetismo remanente de una capa de cinta afecte a la capa vecina, produciendo una filtración de señal (en inglés, print-through). En algunos casos esto puede producir lo que se denomina preeco, es decir una anticipación de la señal durante un pasaje en silencio. Otro inconveniente de las cintas delgadas es la tendencia a vibrar, produciendo pequeños silbidos que pueden ser audibles y pueden inclusive quedar grabados. La emulsión debe estar formada por partículas ferromagnéticas de pequeño tamaño (menor de 1 µm), con forma acicular (de aguja), distribuidas uniformemente sin defectos como grumos (acumulaciones), burbujas o zonas no cubiertas. La razón para el reducido tamaño es que se pretende que en cada ciclo de la máxima frecuencia a registrar (20 kHz) haya por lo menos 10 partículas, y la forma de aguja es para lograr que cada partícula se comporte como dominio simple, lo cual requiere que estén separadas entre sí. Otra ventaja del tamaño reducido de las partículas está en la reducción del ruido de fondo de la cinta. Para mejorar aún más la respuesta de la cinta, dado que los materiales utilizados son fuertemente anisotrópicos (es decir que las propiedades magnéticas dependen de la orientación), se somete a la cinta durante el proceso de secado de la emulsión a un fuerte campo magnético que reorienta físicamente las partículas en la dirección longitudinal de la cinta. La respuesta en alta frecuencia de la cinta depende entre otras cosas del espesor de la emulsión y de su fuerza coercitiva (ver Figura 23.19), según ya se comentó. Un factor de gran importancia en la selección de cintas es el máximo nivel de magnetización con respuesta lineal (se sobreentiende que se utiliza polarización de corriente alterna). Este parámetro depende muchísimo de cómo está formulada la emulsión. Así, tenemos tres composiciones básicas. La de óxido férrico gama rojo (Fe2O3) es la más común. A partir de 1960 comenzaron a introducirse las cintas de dióxido de cromo (CrO2), que tienen una fuerza coercitiva más alta, lo cual permite obtener mejor respuesta en frecuencia. El nivel máximo de magnetización también es mayor mejorando la relación señal a ruido. En 1972 se introdujeron las cintas de metal, que contienen partículas de hierro o hierro y cobalto en estado metálico. Logran una mayor coercitividad (y por lo tanto mayor respuesta en frecuencia) y un mayor nivel de magnetización que las de dióxido de cromo. El nivel de grabación se define como el nivel de magnetización aplicado a la cinta, y se lo expresa en dB respecto a cierto valor estándar, que corresponde a 0 dB (no debe confundirse este valor con un nivel de tensión, ni mucho menos con un nivel de presión sonora). En las cintas resulta importante el máximo nivel de grabación sin distorsión, es decir sin que la cinta llegue a su saturación magnética. Dicho nivel depende fuertemente de la composición de la cinta. Así, las cintas normales (óxido férrico) admiten un nivel de hasta 3 dB sin distorsión apreciable, mientras que las de cromo permiten 6 dB y las de metal, 10 dB. En general el mayor nivel de grabación repercute favorablemente en la relación señal/ruido, por lo cual las cintas de cromo y las de metal posibilitan registros más limpios de ruido.
Registro Magnético
225
Técnicamente se define un parámetro denominado máximo nivel de salida (maximum output level, MOL) para las cintas magnéticas. Este valor es bastante mayor que los mencionados anteriormente, ya que en su medición se admite un 3% de distorsión de tercer armónico (es decir que si se graba una senoide pura, aparece un tercer armónico cuya amplitud es un 3% de la amplitud de la senoide, es decir unos 30 dB menor). Esta distorsión es apreciable, y normalmente debería evitarse, considerándose el MOL como un parámetro de la cinta, no como una condición aceptable de operación.
23.11. Especificaciones de los grabadores de cinta Las especificaciones de un grabador incluyen algunos parámetros generales comunes a otros equipos, como la respuesta en frecuencia y la distorsión, y otros parámetros específicos, como el número de pistas, los tamaños y tipos de cinta soportados, etc. 23.11.1. Parámetros generales La respuesta en frecuencia de un grabador depende del tipo y composición de la cinta, de la velocidad de arrastre en caso de tener más de una velocidad, y del nivel de grabación. Así, siempre que se haga la comparación sobre cintas de igual calidad de fabricación, las cintas de cromo ofrecen una mayor respuesta en frecuencia que las normales (de óxido férrico), y las cintas metálicas mayor que las de cromo. Ya se comentó la relación bastante directa entre la velocidad de la cinta y la respuesta en frecuencia. Sin embargo, debe tenerse en cuenta que una duplicación de la velocidad no necesariamente duplica la máxima frecuencia. Por último, la respuesta en frecuencia empeora (se reduce) cuando se incrementa el nivel de grabación. Generalmente se especifica la respuesta en frecuencia para dos o más niveles. En la Figura 23.23 se muestra un ejemplo. dB Metal Cromo
10 0
0 dB
- 10 - 20
-20 dB
- 30 20
100
500
1000
5000
10000 Hz
Figura 23.23. Ejemplo de la variación de la respuesta en frecuencia de un grabador con el tipo de cinta (cromo y metal) y el nivel de grabación (0 dB y - 20 dB respecto al nivel estándar de grabación).
Con respecto a la distorsión, también se especifica indicando el tipo de cinta utilizado, la frecuencia (en general 1 kHz), y el nivel de grabación (generalmente, 0 dB).
226
Acústica y Sistemas de Sonido
Se puede especificar la distorsión total armónica, THD, o la distorsión de tercer armónico, K3. Esta última es la relación porcentual entre el tercer armónico causado por la distorsión y la fundamental (primer armónico). Por supuesto, siempre es THD > K3. La relación señal/ruido, S/R, se especifica en general filtrando previamente el ruido con un filtro denominado CCIR/ARM (introducido por el International Radio Consultive Committee, Comité Internacional Consultivo de Radio). Dicho filtro enfatiza las frecuencias entre 2 kHz y 10 kHz, atenuando las restantes, y su propósito es medir no la magnitud eléctrica del ruido, sino el efecto perceptivo de la molestia que ocasiona durante la escucha de música. Se especifica a frecuencias determinadas, por ejemplo a 1 kHz y a 5 kHz, indicando el tipo de cinta, y si se usó algún reductor de ruido. En el caso de grabadores multicanal, se especifica la separación de canales, o diafonía, debiendo indicarse si son canales contiguos o no, así como las condiciones de medición (frecuencia, nivel de grabación, presencia o no de reductor de ruido). Por último existen especificaciones de carácter administrativo, como el tipo de conectores, las impedancias de entrada y salida, consumo de energía eléctrica, peso, dimensiones, etc. 23.11.2. Parámetros específicos de los sistemas de grabación Los grabadores pueden tener pequeñas fluctuaciones de velocidad, que se manifiestan ocasionando fluctuaciones lentas de la frecuencia de un tono grabado, o variaciones más rápidas que producen una especie de vibrato parásito. Estos fenómenos se denominan Wow y Flutter respectivamente, y pueden especificarse como variación porcentual. Por lo general no se discriminan, brindándose un dato único que representa los dos fenómenos conjuntamente. Ese dato puede suministrarse como porcentaje en valor eficaz (RMS) o en valor de pico (peak), o ambos valores. También se especifican la polarización y la ecualización de los cabezales, especialmente cuando se provee al usuario la posibilidad de ajustarlas. Otros datos se refieren a las velocidades disponibles, tiempo de retroceso o avance rápido, y rango de los ajustes finos de velocidad en caso de haberlos. También se especifica el nivel de borrado, es decir el nivel de ruido residual por debajo del nivel estándar de grabación, en dB. Por último, puede haber especificaciones como la vida útil de los cabezales en horas de uso continuo, tiempo recomendado entre operaciones de limpieza y desmagnetización de los cabezales, etc.
23.12. Reductores de ruido La grabación analógica en cinta magnética adolece de un serio inconveniente: el excesivo ruido originado, entre otras causas, por la granularidad del material magnético de la emulsión y por la polarización de corriente alterna. Debido a este ruido, el rango dinámico que puede obtenerse resulta demasiado bajo para aplicaciones de un mínimo de calidad. De hecho, es difícil obtener una relación señal a ruido mayor de 55 a 60 dB. Esto implica que el registro en cinta magnética sería inviable para aplicaciones serias si no existieran dispositivos reductores de ruido. Existen dos tipos de reductores de ruido: los reductores complementarios, y los reductores no complementarios. Los reductores complementarios procesan la señal
Registro Magnético
227
antes de grabarla, de manera de hacerla más inmune o insensible al ruido del proceso de grabación/reproducción, y luego aplican el procesamiento inverso para devolver a la señal sus características originales, pero con menos ruido. Los reductores no complementarios, en cambio, toman la señal ya grabada y la procesan (durante la reproducción) de manera de reducir el ruido, o bien su efecto perceptivo, en general por medio de técnicas basadas en el enmascaramiento. Según veremos a continuación, ambos tipos de reductores de ruido responden a principios que hemos estudiado anteriormente. 23.12.1. Reductores de ruido complementarios Los reductores complementarios se basan en el concepto de la compresión y expansión. Ya vimos oportunamente cómo la compresión puede ayudar a que la señal resulte más inmune al ruido. Simplemente, las señales de alto nivel, que por su propio nivel enmascaran al ruido, no se modifican, y en cambio las de bajo nivel, que caerían por debajo del “piso” de ruido, son amplificadas, incrementando su nivel convenientemente por encima del ruido. La señal así tratada se graba en la cinta. Al reproducir la grabación, interviene un expansor que restituye el rango dinámico primitivo de la señal, para lo cual deja intactas las señales de alto nivel y atenúa las de bajo nivel. Como el ruido es un componente de bajo nivel, resulta atenuado, lo cual incrementa la relación señal/ruido del sistema. El compresor actúa como un codificador, y el expansor como un decodificador.
Compresor
Grabador Reproductor
Expansor
(a)
100 mV
Saturación
1 mV 0,1 mV 0,01 mV
Ruido 0,001 mV (b)
Figura 23.24. (a) Diagrama de bloques de un sistema de reducción de ruido complementario (b) Ejemplo de su operación.
Para ilustrar esta operación, consideremos una señal que varía entre 0,01 mV y 100 mV (Figura 23.24), es decir cuyo rango dinámico es de
228
Acústica y Sistemas de Sonido
20 log 10
100 mV 0,01 mV
= 20 log 10 10.000 = 80 dB .
Supongamos que la saturación del sistema está precisamente en 100 mV, y que su ruido es de 0,1 mV, lo cual significa que su relación señal/ruido es S/R
= 20 log 10
100 mV 0,1 mV
= 20 log 10 1.000 = 60 dB .
Evidentemente, las porciones de la señal que se encuentren entre 0,01 mV y 0,1 mV se perderán si no se utiliza alguna estrategia de reducción de ruido. Para ello, comprimimos aplicando una ganancia 1 a las señales intensas y 100 a las señales débiles. Ahora, toda la señal variará entre 100 × 0,01 mV = 1 mV y 1 × 100 mV = 100 mV. Durante el proceso de grabación y reproducción se agrega un ruido de 0,1 mV, que estará muy por debajo del valor mínimo de la señal (que ahora es 1 mV en lugar de 0,01 mV). Para reponer el rango dinámico original, las señales intensas se mantienen, mientras que las débiles se atenúan en 100 veces. En otras palabras, el nivel máximo continuará siendo 100 mV, y el mínimo pasará a valer 1 mV / 100 = 0,01 mV, que es su valor primitivo. Pero dado que el ruido es una señal pequeña, también se reducirá 100 veces, llegando a un valor de 0,1 mV / 100 = 0,001 mV. Como resultado del sistema de compresión y posterior expansión complementaria se obtiene una relación señal/ruido S/R
= 20 log 10
100 mV 0,001 mV
= 20 log 10 100.000 = 100 dB ,
valor mucho más alto que el original de 60 dB, lo cual muestra la eficacia del sistema de reducción. Dentro de los reductores de ruido complementarios, los más célebres son el sistema Dolby, en sus diversas variantes, y el dbx. El primero ha tenido difusión masiva en los sistemas de grabación profesionales y de cassette compacto, y el segundo en los sistemas profesionales de grabación multicanal (multipista) analógicos. En la Figura 23.25 se muestra el diagrama de bloques simplificado de la sección compresora (codificador) del sistema Dolby B. El objetivo de esta sección es comprimir solamente las señales de alta frecuencia, bajo la hipótesis de que el ruido de cinta es un ruido de alta frecuencia. Dado que este dispositivo trabaja en función del contenido de alta frecuencia de la señal, es importante eliminar el ruido de frecuencias ultrasónicas que ésta pudiera contener. Ese objetivo lo cumple el filtro pasabajos de entrada. El preamplificador que sigue eleva el nivel de la señal, reduciendo así el efecto del ruido eléctrico generado en el propio circuito. Luego la señal se envía simultáneamente a una de las entradas de un sumador, y a un filtro pasaaltos controlado por una cadena lateral. Cuando la señal tiene poco contenido de alta frecuencia, la cadena lateral tiene un nivel bajo, lo cual implica que la frecuencia de corte del filtro es baja (cerca de 1 kHz), y entonces el filtro deja pasar todas las componentes de alta frecuencia de la señal. Éstas se sumarán, amplificadas, a la señal directa, por lo cual el nivel de las altas frecuencias se verá incrementado.
Registro Magnético
229
Pasabajos
Σ Pasaaltos controlado Detector de nivel
Figura 23.25. Diagrama de bloques simplificado de la sección de compresión (codificador) de un sistema Dolby B.
Cuando, en cambio, la señal tenga un alto contenido de alta frecuencia, la cadena lateral recibirá un nivel alto. Esto implica que la frecuencia de corte del filtro pasaaltos aumentará, dejando pasar sólo las frecuencias muy altas (de hecho, sólo las frecuencias fuera del espectro audible, que ya habían sido eliminadas por el pasabajos). Entonces la señal de salida del sumador será prácticamente la señal directa sin alteración. En resumen, las altas frecuencias de bajo nivel resultan amplificadas, y en cambio las de alto nivel atraviesan el sistema sin modificaciones. Las bajas frecuencias (por debajo de 1 kHz), no se modifican en ningún caso. La sección expansora (decodificador) del sistema Dolby B se ilustra en la Figura 23.26. La diferencia estriba en que la señal que va al filtro pasaaltos no es la de entrada sino la de salida, previamente invertida. Cuando la señal original tenga un gran contenido de alta frecuencia, y por lo tanto el codificador no haya actuado, la salida de este expansor contendrá también abundante alta frecuencia, la cual se reinyecta (invertida) a la entrada del filtro pasaaltos controlado. Debido a su alto nivel, el filtro se cierra (aumenta su límite inferior de frecuencia), y por lo tanto prácticamente no deja pasar ninguna señal al sumador. La salida del decodificador sigue siendo igual a su entrada.
Pasabajos
Σ Pasaaltos controlado Detector de nivel −1
Figura 23.26. Diagrama de bloques simplificado de la sección expansora (decodificador) del sistema Dolby B.
230
Acústica y Sistemas de Sonido
Cuando, en cambio, la señal original sea débil (y por lo tanto su nivel haya sido incrementado por el compresor), tendremos a la salida de este expansor un menor nivel. Esta señal, invertida, se reinyectará a la entrada del pasaaltos. Debido a su nivel moderado, el filtro se abre (baja su límite inferior de frecuencia) dejando pasar sus componentes de alta frecuencia. Dado que estaba invertida, se restará ahora de la señal directa, reduciendo la salida de alta frecuencia hasta su nivel previo a la compresión. El sistema Dolby B logra un incremento de más de 10 dB para las señales mayores de 5 kHz de bajo nivel (− −40 dB respecto al nivel de grabación estándar). Las señales de alto nivel (0 dB), cualquiera sea su frecuencia, permanecen casi inalteradas (ver Figura 23.27). Esto significa que en alta frecuencia la mejora de la relación señal/ruido supera los 10 dB. Aún cuando estos resultados puedan parecer sólo una mejora modesta, permiten alcanzar relaciones señal/ruido cercanas a los 70 dB, lo cual se considera ya como alta fidelidad para equipos de consumo masivo. La incorporación del sistema Dolby B condujo a la difusión masiva del cassette compacto, compitiendo con el disco de vinilo hasta la aparición y posterior popularización del disco compacto. El sistema Dolby C, aplicado en equipos de grabación de cassette más sofisticados, equivale esencialmente a un doble sistema Dolby B, por lo cual consiguen mejoras de hasta 20 dB en la relación señal/ruido a 5 kHz. El Dolby A, para uso profesional, subdivide la señal en 4 bandas de frecuencia, optimizando la compresión y la descompresión en cada una de ellas.
dB 0 dB
0
-10 dB
- 10
-20 dB
- 20
-30 dB
- 30
-40 dB
- 40 20
50
100
500
1000
5000 10000 Hz
Figura 23.27. Curvas que muestran el comportamiento de la sección de compresión del sistema Dolby B. Los niveles de grabación altos (0 dB) permanecen prácticamente inalterados, mientras que los niveles bajos (− −40 dB) experimentan refuerzos de más de 10 dB en alta frecuencia, particularmente arriba de 5 kHz.
El otro sistema de reducción de ruido que ha alcanzado gran popularidad es el denominado dbx. A diferencia del sistema Dolby, se trata de un compresor/expansor de banda ancha, es decir que la compresión se realiza en todas las frecuencias de audio y no solamente en las altas. Este sistema comprime el nivel de la señal en dB (relativo al
Registro Magnético
231
nivel estándar de grabación) a la mitad (Figura 23.28). Esto implica que los niveles mayores que el estándar se reducen y los menores se incrementan. Se diferencia de un compresor tradicional en que no tiene umbral, y por lo tanto siempre comprime (salvo el nivel estándar). Nivel de salida [dB]
expansión compresión
0 -30 -60 -60
- 30
0
Nivel de entrada [dB]
Figura 23.28. Curvas complementarias de compresión y expansión de un reductor de ruido dbx.
La sección expansora, por su parte, expande el nivel en dB de la señal que recibe en un factor 2, de manera que las señales que estén por encima del nivel estándar serán amplificadas y las que estén por debajo serán atenuadas, restituyendo la señal a su dinámica original. Como ejemplo de operación, consideremos una señal que varía su nivel entre −60 dB y +10 dB. Como resultado de la compresión, la señal codificada variará entre −30 dB y +5 dB. Esta señal es registrada en la cinta, agregándose un ruido de, por ejemplo, -50 dB. Si no se utilizara un sistema de reducción de ruido, las partes más débiles de la señal quedarían inmersas en el ruido de cinta. Al utilizar dbx, las señales más débiles tienen ahora un nivel de −30 dB, es decir que están muy por encima del ruido de cinta. Al decodificar la señal mediante la sección expansora, la señal de −30 dB es atenuada hasta su valor original de −60 dB. El ruido, por su parte, de −50 dB será atenuado hasta −100 dB, con lo cual el nivel de ruido resulta muy bajo (en la práctica no se obtienen niveles tan bajos debido al propio ruido del decodificador, y al hecho de que la expansión no puede mantenerse lineal en un rango de niveles tan amplio). 23.12.2. Uso parcial de reductores de ruido complementarios Es importante hacer algunas observaciones sobre el uso parcial de los sistemas complementarios, como podría ser grabar sin Dolby y reproducir con él, o viceversa. Dado que los sistemas complementarios son, precisamente, complementarios, sólo puede esperarse que brinden resultados satisfactorios si se los utiliza tal como fueron concebidos. Por ese motivo, la utilización parcial puede tener peores consecuencias sobre la señal que si no se utilizara ningún sistema reductor de ruido. Analicemos ahora algunos ejemplos. El primer caso se da al reproducir sin Dolby una grabación hecha con Dolby. Las señales débiles tendrán, en general, un exceso de agudos, sin que por ello se reduzca el ruido durante la reproducción. Las señales intensas no experimentarán modificaciones importantes. La “solución” que a veces se propo-
232
Acústica y Sistemas de Sonido
ne de bajar el control de agudos, puede funcionar para el caso de señales pobres en agudos, pero no para señales con gran contenido de altas frecuencias, que perderán buena parte de su brillo. El caso recíproco, grabar sin Dolby y reproducir con Dolby, en la esperanza de reducir el ruido, implica que las señales pobres en altas frecuencias terminarán perdiendo el escaso brillo que tenían. Es cierto que el ruido se reduce, pero con él también la fidelidad de lo grabado. Cuando la señal es rica en agudos, la presencia del decodificador Dolby es irrelevante, ya que no produce ningún cambio. El caso del dbx difiere en que su efecto no varía con la frecuencia. Si se utiliza sólo el codificador dbx, es decir se comprime la señal, el rango dinámico se reducirá, con consecuencias similares a las discutidas en el caso de los compresores. Si se utiliza, en cambio, sólo el decodificador, las señales débiles terminarán por volverse inaudibles. 23.12.3. Reductores de ruido no complementarios Los reductores de ruido no complementarios se apoyan en el mismo principio de las compuertas, estudiado oportunamente. Cuando existe una señal importante, se supone que en general ésta enmascara al ruido, haciéndolo casi imperceptible. Cuando no hay señal, se reduce la ganancia del sistema de reproducción, reduciéndose por consiguiente el ruido agregado. La mayor dificultad consiste en discriminar de un modo confiable cuándo hay y cuando no hay señal. En la figura 23.29 se muestra el diagrama de bloques de un reductor de ruido no complementario, el DNR (dynamic noise reduction system) de National Semiconductor.
Pasabajos controlado 800 Hz a 20 kHz
Pasaaltos 6,6 kHz
Detector de nivel
Figura 23.29. Diagrama de bloques simplificado del DNR, un reductor de ruido no complementario.
El bloque central del sistema es un pasabajos controlado por tensión. Cuando en su entrada de control (cadena lateral) se aplica una tensión pequeña, el filtro se cierra, dejando pasar solamente las frecuencias menores de 800 Hz. Si dicha tensión de control comienza a aumentar, el filtro se va abriendo paulatinamente (aumenta su frecuencia de corte) hasta que finalmente deja pasar toda la señal de audio. La señal de control del filtro se obtiene del nivel de las componentes de alta frecuencia de la señal. Así, si la señal tiene poco contenido de alta frecuencia, el filtro se cierra, impidiendo el paso del ruido. Si, en cambio, tiene gran contenido de alta frecuencia, el filtro se abre permitiendo el paso de la señal, que ahora está en condiciones de enmascarar al ruido. Podría pensarse que en el primer caso se está adulterando la señal, al quitarle sus componentes de alta frecuencia. Sucede que dichas componentes son comparables al ruido, por lo cual no se obtendría ningún beneficio conservándolas.
Registro digital
233
24.
Capítulo 24
Registro digital 24.1. Introducción Una de las primeras ventajas del audio digital es la de proveer una forma de codificar la información incorruptible mientras el canal de transmisión (es decir cualquier dispositivo a través del cual pasa la información) no sea excesivamente ruidoso. Esta característica es particularmente interesante a la hora de almacenar dicha información, ya que en general los medios de almacenamiento o registro agregan ruido y distorsionan la señal, lo cual para una señal analógica es particularmente destructivo (aún para distorsiones o niveles de ruido moderados). Existen en la actualidad diversos medios o soportes físicos para almacenar audio digital, algunos de los cuales se detallan en la Tabla 24.1. Tabla 24.1. Medios disponibles para el almacenamiento de señales de audio digital, con sus características y aplicaciones. Medio
Características y aplicaciones
Almacenamiento temporario (volátil) de señales. Se utiliza en los procesadores de efectos digitales. Almacenamiento permanente y definitivo de señales. Se utiliza en los bancos de sonidos de los sintetizadoMemoria ROM res. Almacenamiento permanente, grabable y borrable, de Diskettes sonidos para samplers y fragmentos cortos Almacenamiento permanente grabable y borrable de Discos rígidos tomas completas para su procesamiento y masterizado Almacenamiento permanente grabable y borrable de Cinta magnética (DAT) tomas completas para su procesamiento y masterizado Almacenamiento de música de alta calidad sonora Disco óptico de sólo lectura (CD) para el consumo Duplicación o copiado de audio digital almacenado en Disco óptico de una sola escritura otros medios (disco rígido, cinta, disco óptico) Disco óptico de lectura y escritu- Almacenamiento permanente y editable del sonido. Permite su procesamiento ra Almacenamiento definitivo de señales. Puede utilizarse Tarjetas ROM para bancos de sonidos o de efectos Memoria RAM
234
Acústica y Sistemas de Sonido
24.2. Clasificación de los sistemas de grabación digital Existen varias clasificaciones. En primer lugar pueden clasificarse según el tipo de principio o fenómeno físico involucrado. Desde este punto de vista tenemos sistemas electrónicos (memorias RAM y ROM, cartuchos o tarjetas), magnéticos (cintas, diskettes, discos rígidos) y ópticos (discos compactos, minidisc). Actualmente, los sistemas electrónicos se utilizan como medio de transición y no definitivo, salvo aplicaciones para el consumo como juguetes o aparatos que “hablan”. Los sistemas magnéticos (DAT) no son de difusión masiva para el consumo, pero sí para la producción y edición de música grabada. Los medios ópticos, particularmente los discos compactos (CD), han alcanzado una amplia difusión como soporte para el consumo. En segundo lugar podemos dividir los sistemas en temporarios (memorias RAM), editables (cintas y discos magnéticos) y definitivos (memorias ROM, discos ópticos de sólo lectura). Los medios temporarios se utilizan como complemento de sistemas como los procesadores de efectos que requieren almacenar intervalos cortos de tiempo. Los medios editables son de preferencia en los estudios de grabación, ya que permiten guardar grandes cantidades de información, posibilitando su procesamiento hasta llegar al master final (es decir la versión definitiva lista para su duplicación industrial). Los medios definitivos son los preferentemente utilizados para la circulación comercial del producto terminado. Por último, los sistemas pueden también clasificarse en móviles (cintas, discos de diversas naturalezas) y estáticos (memorias electrónicas, tarjetas). En la actualidad, los sistemas estáticos se usan para almacenamiento temporario o de cantidades moderadas de información definitiva, generalmente intercambiable (por ejemplo bancos de sonidos de sintetizadores, muestras para samplers, etc.). Es posible vaticinar que a mediano plazo los sistemas estáticos reemplazarán a los móviles, conforme siga evolucionando la miniaturización. Otro posible desarrollo es a través de la mecatrónica, es decir la miniaturización de mecanismos por medio de tecnologías derivadas de la microelectrónica.
24.3. Principios de la grabación digital La primera idea en grabación digital es la de registrar en orden sucesivo los datos binarios correspondientes a cada muestra. En audio digital de alta calidad cada muestra de sonido estereofónico requiere 32 bits de información, ya que por cada canal se utilizan 16 bits (lo cual permite lograr una máxima relación señal/ruido de 96 dB). En el caso de las memorias electrónicas, estos datos se descomponen en 4 datos de 8 bits, denominados bytes (dado que las memorias están organizadas por bytes, es decir, a cada dirección le corresponde un byte), y se almacenan en un orden preestablecido, por ejemplo primero el byte menos significativo y después el más significativo, y primero el canal derecho y después el izquierdo. En el caso de otros medios, como el magnético o el óptico, dado que el almacenamiento está organizado por bits individuales sucesivos, es necesario grabar las 32 señales binarias sucesivamente. Para ello se utiliza una transformación que convierte los bits en paralelo (es decir simultáneos) en bits en serie (es decir sucesivos). Esta transformación se denomina modulación de código de pulsos, PCM (en inglés, pulse code modulation). Para ello, a cada bit simplemente se le asigna una posición sucesiva en el
Registro digital
235
tiempo, y se lo representa con una tensión que puede tomar dos valores posibles: un valor alto (por ejemplo 5 V) para representar un 1, y un valor bajo (0 V) para representar un 0. En la Figura 24.1 se muestra un ejemplo de PCM para datos de 8 bits.
01100101
01100110
01100111
v 5V
0 1 1 0 0 1 0 1 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 1
0V
t byte 1
byte 2
byte 3
Figura 24.1. Un ejemplo de modulación de código de pulso (PCM) de 8 bits. Una tensión baja representa un 0 binario y una tensión alta representa un 1 binario.
24.3.1. Sincronismo Un problema del almacenamiento digital en medios móviles es la necesidad de una adecuada técnica o estrategia de sincronismo entre la grabación y la reproducción. En efecto, consideremos un ejemplo simplificado en el cual grabamos la información digital a razón de 1.000 bits por segundo (en el caso real será necesario grabar 2 × 16 × 44.100 = 1.411.200 bits por segundo). Supongamos que en la reproducción cometemos un error de + 0,1 % en la frecuencia, es decir que en lugar de leer 1.000 bits por segundo leemos 1.001 bits por segundo. Entonces cuando al cabo de un segundo creamos estar leyendo el bit número 1.001 en realidad estaremos leyendo el bit número 1.000, lo cual implica un corrimiento de un bit. Este tipo de corrimiento es absolutamente destructivo para la señal, ya que los números leídos estarán completamente cambiados. El resultado puede ser cualquier cosa desde una distorsión hasta ruido blanco. Un análisis del problema revela que éste aparece porque el error en tiempo es acumulativo. Si dejamos pasar 1 s, el error será de 1 ms, que corresponde a un corrimiento de 1 bit; si dejamos transcurrir 10 s, el error será de 10 ms, lo que implica un corrimiento de 10 bits. Pero si dejamos transcurrir sólo 0,1 s, el error será de sólo 0,1 ms, lo cual no es suficiente para que se produzca un corrimiento. Esta situación es similar a la de un reloj que adelanta 1 s por día. En un día adelanta 1 s, pero si lo dejamos funcionando 1 año, adelantará 365 s, es decir más de 7 min. Esto sugiere una posible solución al problema, que equivale sencillamente a “poner en hora” el reloj interno del reproductor, es decir, periódicamente reiniciar la contabilización de los bits. Para implementar esta idea es habitual incluir un código de sincronismo que es reconocido por el reproductor, y que se repite cada cierta cantidad de bits. Se trata de una combinación de bits única, que nunca pueda producirse dentro de la señal. En el momento en que dicha combinación de bits aparece, el procesador interno del sistema reinicializa el reloj, que comienza a contar nuevamente hasta que
236
Acústica y Sistemas de Sonido
aparece un nuevo código de sincronismo. Dicha combinación de bits aparecerá con suficiente frecuencia para evitar un corrimiento significativo. 24.3.2. Detección y corrección de errores Otro problema característico del almacenamiento de grandes cantidades de información digital es el de la presencia, de tanto en tanto, de algunos errores, es decir bits cambiados, por ejemplo un bit que debió valer 1 y sin embargo quedó grabado (o se lee) como 0. Existen dos tipos de errores: los errores aleatorios (random errors), es decir errores que abarcan un solo bit equivocado, y los errores de salva (burst errors), es decir errores en un gran número de bits consecutivos (físicamente próximos), por ejemplo una raspadura de un disco compacto, o una deficiencia o imperfección en una cinta magnética. Para ser confiable, un sistema de almacenamiento digital debe utilizar técnicas de detección y corrección de errores, tanto los aleatorios como los de salva. La detección de errores consiste en reconocer la presencia de un error, mientras que la corrección de errores permite restituir el valor correcto. En general, la detección y la corrección de errores se basan en la redundancia, o información repetida. El caso más simple es el de los errores aislados, vale decir, errores de un bit en una palabra de varios bits. Por ejemplo, si queremos representar 4 niveles diferentes, la forma más económica consiste en utilizar 2 bits: 00
01
10
11 .
Pero si cambia un bit, no hay forma de reconocer que se produjo un error. Si agregamos un bit de paridad, es decir un bit cuyo valor se elige de manera que en total haya un número par de 1’s, tendremos 000
101
110
011 .
Ahora, al cambiar un bit se tiene la certeza de que hay un error, pero no se sabe dónde está (inclusive podría ser en el propio bit de paridad). Para lograr un código capaz de autocorregir errores de un bit (aún entre los bits agregados) es necesario agregar tres bits a los dos originales: 00000
01101
10110
11011 .
Con este código, cualquier cambio en un solo bit es reparable. Por ejemplo, el valor 10010 corresponde al tercer código con el segundo 1 transformado en 0. No puede corresponder a ninguno de los otros tres porque para ello deberían haber cambiado dos o más bits. Existen técnicas más avanzadas que permiten corregir errores en varios bits consecutivos, aunque requieren mayor redundancia. En el caso del disco compacto, por ejemplo, es posible corregir gran cantidad y variedad de errores, al costo de utilizar tres veces más bits que lo estrictamente necesario para representar digitalmente la información de audio. El resultado es que pueden corregirse errores de salva de hasta 4000 bits consecutivos (que corresponden a unas 42 muestras estereofónicas, es decir alrededor de 1 ms). Cuando se pierde mayor cantidad de bits ya no será posible restaurar los valores perdidos en forma exacta, pero al menos se los puede sustituir por valores aproximados obtenidos por interpolación. Esta técnica consiste en obtener los valores intermedios faltantes promediando los valores disponibles más próximos. Por ejemplo,
Registro digital
237
si en un instante dado la señal es de 1 mV y 0,2 ms después es de 1,2 mV, entonces el valor intermedio, es decir a los 0,1 ms, será aproximadamente el promedio, es decir 1 mV
+ 1,2 mV 2
= 1,1 mV .
De esta forma es posible corregir de modo casi imperceptible una salva de hasta 12.300 bits consecutivos errados, equivalente, por ejemplo, a una raspadura de 7,5 mm en un disco compacto. 24.3.3. Ancho de banda Una consideración importante para el registro de señales de cualquier tipo es el ancho de banda requerido. En el caso del audio analógico, el ancho de banda es de 20 kHz, que coincide con el ancho de banda de la propia señal. En el caso del audio digital, el ancho de banda es mucho mayor. Para calcularlo, tengamos en cuenta que en una grabación estereofónica digital de buena calidad se requieren 2 datos (uno por cada canal) de 16 bits por muestra (en los primeros sistemas de cinta magnética se utilizaban 13 bits). Dado que a su vez debe haber 44.100 muestras por segundo, resulta que el número de bits/s es 2 × 16 × 44.100 = 1.411.200 bits/s . El cálculo anterior se refiere exclusivamente a los bits de audio, pero según hemos visto se agregan bits de corrección de errores, de sincronismo, y otros que veremos en las secciones que siguen, lo cual incrementa el ancho de banda hasta en un factor de 3.
24.4. El disco compacto (compact disc, CD) Estudiaremos ahora con mayor detenimiento el formato digital de mayor popularidad actualmente para el almacenamiento definitivo de señales de audio: el disco compacto (compact disc). Este formato utiliza tecnología óptica basada en el láser. El soporte consiste en un disco de policarbonato transparente de 120 mm de diámetro y 1,2 mm de espesor (Figura 24.2). El disco se coloca en el reproductor introduciendo el orificio central en el eje de tracción, operación que en la mayoría de los reproductores se lleva a cabo automáticamente. La lectura se realiza por medio de un diodo láser, el cual emite un haz de luz que es reflejado en mayor o menor grado, indicando la presencia de un 1 ó un 0. El diodo no entra en contacto con la superficie del disco por lo cual no existe desgaste ni en el elemento captor ni en la superficie del disco, permitiendo una alta durabilidad. Contrariamente a lo que sucedía en los discos analógicos de vinilo, la lectura se realiza desde adentro hacia afuera, y la velocidad de giro no es constante, sino que se va reduciendo. Otra diferencia es que la velocidad de giro difiere de un disco compacto a otro. Esto es debido a que la velocidad se utiliza como variable de ajuste para que el área disponible se llene casi totalmente, sin importar la duración del material grabado (que puede llegar a un máximo de 74’ 33”). Para un disco compacto dado, lo que se mantiene constante es la velocidad lineal (constant linear velocity, CLV), y no la ve-
238
Acústica y Sistemas de Sonido
locidad de rotación. Es una situación semejante a la de una cinta magnética, en la cual por ser la velocidad lineal constante, la velocidad de rotación del carrete va variando desde un mínimo cuando el carrete está lleno hasta un máximo cuando está vacío.
Área grabada
58 mm 25 mm
7,5 mm 60 mm
Figura 24.2. Dimensiones de un disco compacto. Las circunferencias punteadas delimitan el área grabada. Las circunferencias próximas al orificio proporcionan un cambio de nivel para separar el área grabada del lector.
La velocidad lineal en los discos compactos más cortos es mayor (cerca de 1,4 m/s, es decir 55,1 ”/s) y en los más largos es menor (alrededor de 1,2 m/s, es decir 42,7 ”/s). La relación entre la velocidad lineal v en m/s y la de rotación ω en rpm puede obtenerse del siguiente modo. Para un radio dado r, cada vuelta tendrá una longitud L = 2πr, por lo cual la cantidad de vueltas por segundo será v/L, y la cantidad de vueltas (o revoluciones) por minuto, 60 veces mayor. Entonces ω = 60
v L
=
60 v . 2πr
Si tomamos un disco promedio, en el cual la velocidad lineal sea de 1,3 m/s, la velocidad de rotación al comienzo del disco (es decir en su vuelta interna, de radio 25 mm) será igual a
Registro digital
239
ω =
60 ⋅ 1,3 2 ⋅ 3,14 ⋅ 0,025
= 497 rpm ,
mientras que al terminar (en su vuelta externa, de radio 58 mm), será ω =
60 ⋅ 1,3 2 ⋅ 3,14 ⋅ 0,058
= 214 rpm .
Se observa que las velocidades de giro son mucho más altas que para el tradicional disco de vinilo (33 rpm ó 45 rpm). Veamos ahora cómo se codifica la información digital en un disco compacto. Se utiliza una estructura de fosas de forma ovoidal (ver Figura 24.3a) estampadas sobre la superficie superior del disco. Dicha superficie es luego metalizada con aluminio, con el propósito de obtener un acabado reflectante, y posteriormente recubierta por una laca protectora, sobre la cual se imprimen las leyendas que identifican al disco (Figura 24.3b). La exploración del disco por medio del láser se efectúa desde la cara inferior, es decir la cara sin leyendas. La profundidad de las fosas está ajustada a un valor de 0,11 µm a 0,13 µm, seleccionado de modo que la onda luminosa reflejada sobre una fosa se desfase con respecto a la onda reflejada fuera de ella. Esto hace que cuando se
1,6 µm 0,5 µm
(a) Leyenda Laca protectora fosa
fosa
0,13 µm Película reflectante
Policarbonato transparente
(b) Figura 24.3. Estructura de fosas de un disco compacto. (a) Disco visto desde abajo. (b) Corte transversal de una pequeña porción del disco a lo largo de una hilera de fosas. (Diagramas fuera de escala.)
240
Acústica y Sistemas de Sonido
proyecta un haz de luz justo sobre el borde de una fosa, dado que parte de la luz se refleja dentro y parte fuera de la fosa, existirá una interferencia destructiva (Figura 24.4). En consecuencia, cada vez que el fotosensor pase frente al borde de una fosa, éste recibirá luz atenuada, y en cambio cada vez que esté frente al interior o frente al exterior de una fosa recibirá luz intensa. Convencionalmente se interpreta cada borde de una fosa como un 1 y el resto como 0. Esto obligará a utilizar un código en el cual no pueda haber dos 1’s seguidos (ver modulación 8 a 14). 0
1
0
fosa
fosa
− Sin Sin interferencia interferencia
+
Interferencia destructiva
Figura 24.4. Mecanismo de lectura de la información digital contenida en un disco compacto.
En lo que sigue, estudiaremos más detenidamente los procesos mencionados en la sección 24.3, aplicados al caso particular del disco compacto. 24.4.1. Código Reed - Solomon Después de obtenida la información digital por medio del conversor analógico/digital, es preciso recodificarla, agregando la necesaria redundancia, a fin de posibilitar la detección y corrección de errores. El código que se utiliza se denomina crossinterleaved Reed-Solomon Code, CIRC (código de intercalación cruzada de ReedSolomon). Hemos visto anteriormente que con suficiente redundancia resulta relativamente sencillo corregir errores aislados, vale decir, errores de un bit en una palabra de varios bits. Aunque sería posible, en teoría, generalizar esto desarrollando códigos tan redundantes que permitieran corregir errores dobles, y luego errores triples, cuádruples, etc., existe un enfoque más ingenioso que es, precisamente, el código CIRC. La idea básica consiste en tomar un grupo de varias muestras sucesivas, denominado cuadro (frame) (en el caso del CD, 6 muestras estereofónicas ≡ 6 × 2 × 16 = 192 bits), y entremezclar sus bits de una forma conocida, de manera que los bits que originalmente formaban parte de un mismo byte ahora estén distribuidos en varios bytes, y viceversa, cada byte contenga bits provenientes de diferentes bytes originales. Cuando a causa de una salva de errores se pierda totalmente un byte, en realidad se estará perdiendo un bit de cada byte original, lo cual puede corregirse con técnicas de corrección de errores de un bit. El código CIRC contiene, por consiguiente, los bits originales entremezclados más los bits adicionales para la autocorrección de errores. El resultado
Registro digital
241
de esta codificación es que el cuadro, que en PCM requería 192 bits, estará ahora representado por 256 bits (una relación 4:3). Como la forma en que se reordenan o entremezclan los bits es conocida, durante la reproducción será posible realizar el reordenamiento inverso de modo de recuperar la información PCM original, cuyos errores serán ahora aislados, y por lo tanto reparables. 24.4.2. Subcódigo (subcode) Una característica muy interesante de la codificación digital es la posibilidad de agregar información suplementaria no relacionada con los datos de la señal de audio sino con aspectos administrativos, como por ejemplo una tabla de contenido (TOC), la posición del inicio de cada pieza de música y su duración, información sobre Copyright e identificación internacional de la grabación (ISRC), así como indicaciones referidas a las vueltas inicial y final, que permiten informar al reproductor sobre dichas posiciones dentro del disco. Esta información se agrega mediante un byte denominado subcódigo por cada cuadro, pero dado que un solo byte permite almacenar poca información, se provee un ciclo de 98 cuadros consecutivos. Como la duración de un cuadro es 6 44100
= 0,136 ms
resulta que la información se completa al cabo de 98 × 0,136 ms = 13,3 ms. La información contenida en los subcódigos puede ir cambiando a lo largo del tiempo, actualizándose cada 13,3 ms. 24.4.3. Modulación 8 a 14 La señal de audio codificada por CIRC (más el subcódigo) podría contener varios 1’s consecutivos, y según vimos, dado que los 1’s corresponden en el disco a los bordes de las fosas, es preciso que no haya 1’s consecutivos. En realidad, también es necesario que las fosas sean lo bastante largas como para que no se produzcan errores durante el estampado del disco ni ambigüedades debidas a la presencia de bordes muy próximos. Esto lleva a que una fosa deba contener como mínimo dos 0’s y esté separada de la fosa vecina también por dos 0’s. Pero si hay demasiados 0’s seguidos, se corre el riesgo de que el servomecanismo que controla la velocidad de giro del disco se desestabilice, perdiéndose el sincronismo. Esta situación se evita restringiendo los 0’s consecutivos a no más de diez. Esto implica que la señal registrada deberá tener 1’s separados entre sí como mínimo por dos 0’s y como máximo por diez 0’s, lo cual se denomina regla 2 a 10. El sistema contiene un bloque, denominado modulador 8 a 14, que se encarga de convertir grupos de 8 bits (bytes) en grupos de 14 bits (palabras) que satisfacen la condición anterior. Dado que algunas de esas palabras de 14 bits terminan con un 1 y otras comienzan con un 1, la yuxtaposición de dichas palabras violaría la separación mínima de dos 0’s. Por este motivo se agregan otros 3 bits de ajuste al final de cada palabra de 14 bits, cuyos valores se adoptan de manera de mejorar la estabilidad del control de velocidad. Una ventaja adicional de esta modulación 8 a 14 es que provee un recurso suplementario de detección de errores. En efecto, existen 16384 combinaciones posibles con 14 bits, de las cuales sólo hay 256 válidas. Ello hace muy improbable que ante un
242
Acústica y Sistemas de Sonido
error se obtenga otra combinación válida, por lo cual los errores serán, en su mayoría, detectables. 24.4.4. Sincronización Por último, se utiliza la siguiente palabra de sincronismo formada por 24 bits, con una distribución de 0’s y 1’s que satisface la regla 2 a 10: 10000000001000000000010 . Esta palabra se ha elegido de tal manera que no pueda aparecer en ninguna otra situación, por lo que cuando el reproductor se encuentra con ella, la reconoce como tal y procede a ajustar el sincronismo. Dado que cada cuadro dura 0,136 ms, el sincronismo se actualiza cada 0,136 ms. 24.4.5. Resumen del código La tecnología del disco compacto cuenta con sofisticados recursos de corrección de errores, que hacen que aún frente a las pequeñas alteraciones o el desgaste que pueda experimentar el soporte (principalmente debido a descuidos en su manipulación) el efecto sobre la señal finalmente reproducida sea despreciable. Ello se logra agregando bits redundantes, que llevan que un cuadro de 192 bits se transforme en uno de 588 bits. Dicha redundancia permite recursos de corrección de errores sumamente confiables, que permiten la pérdida de porciones considerables de información sin afectar en forma audible la señal reproducida. En caso en que la pérdida sea mayor que cierto límite, es posible la corrección aproximada por interpolación. Superado otro límite mayor aún, el sistema silencia en forma suave la salida, de modo que no se produzcan clics u otros ruidos molestos que eran característicos de los discos tradicionales. 24.4.6. Especificaciones de los reproductores de discos compactos La primera especificación es el tipo de conversión digital/analógica empleada. Sólo comentaremos superficialmente dos muy importantes: la conversión tipo PCM y la sigma-delta (o delta-sigma). La conversión PCM utiliza directamente el formato en que el decodificador del sistema de corrección de errores entrega la información (información que coincide, salvo errores insalvables, con la información original). Este tipo de conversión PCM se utiliza cada vez menos, por lo complicado de los filtros de suavizado requeridos. Esta complicación trae aparejados efectos colaterales indeseables, como por ejemplo distorsiones de fase. Cuando se utiliza, se aplica sobremuestreo, es decir se intercalan muestras obtenidas por cálculo entre dos muestras provenientes del disco. La conversión sigma-delta también recurre a un sobremuestreo considerable, por ejemplo por 64, es decir que se insertan 63 muestras interpoladas entre cada par de muestras originales. A partir de esto, se calcula una versión codificada en sigma-delta, cuya descripción técnica nos llevaría fuera de los objetivos de este texto. Las ventajas de este tipo de codificación es que utiliza sólo 1 bit (se troca resolución por frecuencia de muestreo), y que el decodificador es extremadamente simple, requiriendo sólo un filtro pasabajos sencillo. Con esto se eliminan problemas como las distorsiones de fase y el ruido de cuantización. Una especificación complementaria de la anterior es la tasa de sobremuestreo, así como la resolución en bits del conversor digital/analógico. No debe confundirse la
Registro digital
243
resolución en bits, que normalmente es 16 ó más, con el hecho de que la representación utilice sólo 1 bit. La diferencia se aclara si tenemos en cuenta qué representa ese bit. Si el bit implica un salto igual al máximo valor pico a pico de la señal, la resolución es, efectivamente, de 1 bit (situación que obviamente no se da en audio digital por la enor16 me distorsión que acarrearía). En cambio, si ese bit implica un salto de 1/2 de dicho valor pico a pico, entonces la resolución es de 16 bits. Aún cuando la información registrada en los discos compactos tenga una resolución de sólo 16 bits, el conversor digital/analógico utilizado en los reproductores de mayor jerarquía puede llegar a 20 bits, lo cual combinado con el sobremuestreo proporciona ventajas en cuanto a ruido y distorsión. Las siguientes especificaciones son las tradicionales en todo tipo de equipamiento: (a) Respuesta en frecuencia: A pesar de que por norma los discos compactos se encuentran limitados en banda a 20 kHz, en algunos casos de conversión sigma-delta la respuesta en alta frecuencia de la sección del conversor digital-analógico puede llegar hasta los 22 kHz. Dejando de lado estos casos, la respuesta en frecuencia estándar de estos equipos va desde 10 Hz hasta 20 kHz, con variaciones de ± 0,5 dB. (b) Relación señal/ruido: En general es del orden de 90 a 95 dB, ascendiendo a más de 100 dB para los equipos con conversores de mayor resolución. (c) Rango dinámico: Aun cuando el rango dinámico es una propiedad de las señales y no de los equipos de audio, su especificación se refiere al rango dinámico máximo de la señal producida. En general es menor que la relación señal/ruido, pero en el caso de algunos reproductores de alta jerarquía puede ser mayor, debido a que en ausencia de señal el equipo silencia su salida de audio al nivel de su propio ruido eléctrico, que es menor que el de cuantización o digitalización. (d) Distorsión: Se especifica la distorsión total armónica, en general menor del 0,02%. Los mejores reproductores pueden alcanzar cifras menores aún, como 0,002%. (e) Separación de canales: Normalmente es mayor de 80 dB. (f) Wow y Flutter: En general es menor del 0,001 %, debido a que la velocidad de giro es servocontrolada a partir de la propia información digital del disco. (g) Conexiones: puede haber salidas analógicas y digitales. En ambos casos por lo general hay disponibles conectores balanceados y no balanceados de los tipos XLR y RCA, respectivamente. En el caso de las conexiones digitales se utiliza la interfaz AES/EBU, un protocolo de comunicación digital en dos canales (conector XLR). Las conexiones digitales se pueden efectuar también por fibra óptica, según norma EIAJ. Finalmente, se especifican las impedancias y los niveles de las salidas analógicas, la alimentación requerida, etc.
24.5. Cinta de audio digital (digital audio tape, DAT) La cinta magnética fue el primer medio utilizado para almacenar audio digital en cantidad suficiente para las duraciones habituales en música. La mayor dificultad en la grabación magnética está en el gran ancho de banda necesario, lo cual implica una velocidad de la cinta muy alta, según vimos en el capítulo anterior. En efecto, habíamos visto en 24.3.3 que se requiere almacenar 1.411.200 bits de audio por segundo, cifra a la cual hay que agregar los bits de corrección de errores, de subcódigo, y de sincronismo, además de los bits de la modulación 8 a 14. Esto implica
244
Acústica y Sistemas de Sonido
4.321.800 bits/s. Si suponemos un entrehierro de 1 µm, y admitimos que por cada bit se requiere al menos una longitud igual al entrehierro, resultaría que se necesita una velocidad de cinta v = 4.321.800 bits/s × 1 µm/bit
= 4,32 m/s .
Esta velocidad es inaceptable por dos razones: 1) el mecanismo de transporte de la cinta no puede tener una velocidad tan alta y a la vez mantener precisiones del orden del µm, y 2) la cantidad de cinta requerida para una duración dada de material grabado sería demasiado grande (por ejemplo, 7.800 m de cinta para una grabación de 30’, contra los 85,7 m de un cassette analógico). Una situación como ésta ya se había presentado al intentar realizar los primeros registros magnéticos de señales analógicas de video, ya que estas señales requieren también anchos de banda muy grandes. Por este motivo, no resulta extraño que las primeras grabaciones de audio digital se hayan realizado utilizando grabadores de cinta de video (video tape recorder, VTR). La solución al problema del ancho de banda en los grabadores de video (que aún hoy se sigue utilizando en los grabadores hogareños en formato VHS) consiste en utilizar un cabezal móvil en lugar de uno fijo. Este cabezal se encuentra montado sobre un tambor rotativo, que forma cierto ángulo con respecto a la cinta, y que gira a alta velocidad (Figura 24.5a). Se tiene así la denominada exploración helicoidal de la cinta, que consiste en que la pista sobre la cual se graba no es paralela a la cinta sino que forma un ángulo con ésta. Después de que una pista llega al borde de la cinta, comienza otra nueva pista (Figura 24.6). La misma idea se utiliza en la mayoría de los grabadores digitales de audio (una notable excepción es el cassette compacto digital, es decir el DCC). Entre los diversos formatos, el más difundido para grabación en dos canales (estereofónica) es el DAT, muy utilizado en los estudios como soporte para el master final del proceso de mezcla. En la Figura 24.5b se muestra el mecanismo de transporte de la cinta de un DAT. Vemos que es un sistema bastante más complejo que el del cassette analógico tradicional, ya que debe cumplir la función de inclinar la cinta para que pueda tomar contacto con el tambor giratorio sin someterla a tensiones ni permitir que se arrugue. La zona de contacto abarca un ángulo de 90º alrededor del tambor. En el caso del DAT, la velocidad de la cinta es sorprendentemente pequeña: 8,15 mm/s, lo cual es posible porque lo que importa en este caso es la velocidad de los cabezales y no la de la cinta. Dado que el tambor gira a 2000 rpm (es decir 33,33 vueltas/s) y tiene un diámetro de 30 mm, la velocidad lineal de los cabezales resulta ser v = π × 30 × 33,33 = 3141 mm/s = 3,141 m/s . Este valor debe ser corregido para tener en cuanta que la cinta también se mueve. La velocidad nominal de desplazamiento del cabezal respecto a la cinta es vnom = 3,133 m/s , que es mucho más alta que la que sería posible aplicar a la cinta. Con este procedimiento se consigue, por lo tanto, resolver el problema del ancho de banda. El tambor contiene dos cabezales de grabación a 180º entre sí, por lo cual en cada vuelta se graban dos pistas (no confundir estas pistas con canales de audio; aquí las
Registro digital
245
pistas corresponden a segmentos temporales del total de la información). Esto implica que las pistas se encuentran espaciadas 122,25 µm en la dirección longitudinal, pero como las pistas están muy poco inclinadas con respecto a la cinta (sólo 6º 22’ 59,5”), resulta que la separación entre pistas es de sólo 13,591 µm (ver Figura 24.6). Las pistas resultan, por lo tanto, muy angostas.
Tambor rotativo
Cinta
(a)
Cabezal
Cabezal
Cinta Tambor rotativo 90º
Cabrestante
(b) Figura 24.5. (a) Tambor rotativo para la exploración helicoidal de una cinta de video o de audio digital. Las líneas de puntos indican las trayectorias de las pistas. (b) Sistema de transporte de la cinta DAT (fuera de escala).
246
Acústica y Sistemas de Sonido
23,501 mm 13,591 µm
2,613 mm
3,81 mm
3,133 µm/s 6º 22’ 59,5” 8,15 mm/s
122,25 µm
Figura 24.6. Distribución de pistas en una cinta con formato DAT (fuera de escala lineal y angular).
Para evitar que el cabezal de lectura capte información de pistas vecinas a la que está leyendo, se utiliza el artificio de inclinar su entrehierro en un ángulo denominado azimut con respecto a la pista (de modo que no sea perpendicular a ella). Dado que los azimuts de ambos cabezales se adoptan opuestos (en general ± 20º), la pista grabada por un cabezal no podrá ser leída por el otro (ya que el azimut implica una gran reducción de las altas frecuencias; ver capítulo 23). Al igual que en el CD, se utiliza el código de corrección de errores de ReedSolomon y se agregan subcódigos con información administrativa. Además se agrega información que permite el seguimiento automático de la pista (automatic track following, ATF). En el formato DAT se utiliza modulación 8 a 10 en lugar de 8 a 14. 24.5.1. DAT multicanal Existen diversos sistemas de grabación multipista que utilizan cintas magnéticas, por ejemplo el ADAT (Alesis), el RD-8 (Fostex), el DA-88 (Tascam) y el PCM-800 (Sony), entre otros. Por lo general utilizan cintas de mayor tamaño que el DAT estereofónico; por ejemplo el formato SVHS (Super Video Home System), original de la tecnología de video o el formato DTRS (Digital Tape Recording System) para cinta Hi-8 mm, también original del video. No abundaremos en detalles acerca de la estructura de estos formatos, tamaño e inclinación de las pistas, etc. Este tipo de sistemas permite en general sincronizar (con dispositivos auxiliares opcionales) más de una máquina, lo cual permite incrementar el número de pistas a una cantidad tan grande como 128 pistas simultáneas. 24.5.2. Especificaciones de los sistemas DAT Las especificaciones de los sistemas de grabación y reproducción de cassettes DAT no difieren en lo esencial de las de los reproductores de discos compactos. Una diferencia es que se pueden seleccionar en general tres frecuencias de muestreo: 32 kHz, 44,1 kHz y 48 kHz, con la posibilidad de variar la velocidad en un estrecho margen especificado alrededor de estas frecuencias. La frecuencia de 32 kHz está prevista para compatibilidad con las transmisiones de radio digitales, la de 44,1 kHz para compatibilidad con los discos compactos, y la de 48 kHz para lograr una mejor respuesta de fase, al no requerir filtros antialias tan abruptos. Un detalle interesante se refiere a la especificación del nivel de referencia estándar de grabación. A diferencia de los grabadores analógicos, en los que el nivel es de 0
Registro digital
247
dB, pudiéndose según el tipo de cinta exceder en mayor o menor grado dicho nivel, en los DAT el nivel de 0 dB corresponde en realidad al máximo nivel representable con los 16 bits de resolución. Por consiguiente, el nivel de referencia se ubica en un valor menor, por ejemplo −15 dB con respecto a dicho máximo. En muchos casos existe la posibilidad de controlar en forma remota la operación de estos equipos, en cuyo caso se especifican los detalles respectivos.
24.6. Cassette compacto digital (DCC) El cassette compacto digital (digital compact cassette, DCC), introducido por Philips en 1991, es un formato digital en cinta magnética que difiere del DAT en que tiene cabezales estáticos en lugar de rotativos. Para lograr vencer este desafío tecnológico fue necesario utilizar tres conceptos nuevos: 1) La utilización de un cabezal de grabación múltiple de película fina, obtenido mediante la tecnología de los circuitos integrados (chips), 2) El empleo de una técnica avanzada de compresión de datos denominada PASC (Precision Adaptive Sub-band Coding) , y 3) La utilización de un cabezal de reproducción magnetorresistivo. Al comentar el formato DAT, se vio que el ancho de una pista generada por el cabezal rotativo era realmente pequeño (13,591 µm). Esto era necesario para acomodar mayor cantidad de información sobre un mismo espacio de cinta. En el caso del DCC, se utiliza un cabezal de grabación múltiple, que crea 9 pistas digitales paralelas a lo largo de la dirección de movimiento, 8 para la señal digital de audio y 1 para los subcódigos (información complementaria). Aunque esto reduce en un factor 8 el ancho de banda necesario para cada pista de audio, no alcanza para hacer lugar a la gran cantidad de información requerida (es decir 2 × 16 × 44.100 = 1.411.200 bits de audio PCM por segundo, sin contar la redundancia propia del código corrector de errores), y allí es donde se hace necesario incorporar el concepto de compresión de datos. 24.6.1. Compresión de datos - PASC La compresión de datos consiste en aprovechar ciertas características de la señal a codificar de modo que se requiera una menor cantidad de símbolos para representarla. En computación, por ejemplo, se sabe que los archivos frecuentemente contienen ráfagas de varios bytes seguidos idénticos. Entonces, si en lugar de almacenarlos a todos se almacena sólo el valor del primer byte y luego la cantidad de bytes iguales a aquél que lo siguen, se obtendrá un primer ejemplo de compresión de datos. En el caso de las señales de audio no es común que se repitan datos (salvo quizás en los pasajes de silencio, en los cuales las muestras deberían ser todas 0), de modo que ese tipo de algoritmo de compresión no sería aplicable en este caso. Sin embargo se da otro hecho muy interesante, y es que debido al fenómeno de enmascaramiento la señal de audio suele contener más frecuencias que las que en efecto puede llegar a escuchar el oído humano. La codificación PASC (codificación de precisión adaptable por subbandas, del inglés “Precision Adaptive Sub-band Coding”) se propone descartar dicha información inaudible, y aprovechar el espacio ganado para incorporar otra información más perti-
248
Acústica y Sistemas de Sonido
nente. Para ello se divide primero todo el rango de frecuencias audibles en 32 subbandas de igual extensión, para lo cual se utiliza un banco de filtros digitales de reconstrucción perfecta, vale decir que por medio de un banco de filtros complementario se obtiene una reproducción exacta de la señal original. A continuación, se toma cada subbanda y se determina si, en función del nivel de las componentes sonoras en las subbandas vecinas, la señal presente en la misma se percibirá o no. Para ello se recurre a las curvas de enmascaramiento (ver capítulo 2). Así, por ejemplo, si en la subbanda 19 hay un tono débil, dependiendo de qué haya en las subbandas 18 y 20 (y otras más alejadas), dicho tono podrá o no percibirse. Si en alguna de dichas subbandas hay un tono de gran amplitud, el tono de la subbanda 19 no se percibirá, y por lo tanto puede eliminarse del código permitiendo ahorrar espacio. La codificación PASC posee otra propiedad interesante, y es el hecho de que su precisión es adaptable. Esto significa que la precisión con que se representan las muestras dentro de cada subbanda (es decir el número de bits) se va adaptando o ajustando según los niveles de la señal y del umbral que en ese momento hay en la subbanda. Para comprender mejor este concepto veamos unos ejemplos. Supongamos que en cierta subbanda el umbral absoluto (en ausencia de otros sonidos enmascarantes) es de 20 dB, lo cual significa que cualquier ruido de menos de 20 dB dentro de esa subbanda será inaudible. Si ahora aparece en la subbanda una señal de 70 dB, dado que puede tolerarse sin inconvenientes un ruido de hasta 20 dB, resulta que se puede admitir una relación señal/ruido tan baja como 70 dB − 20 dB = 50 dB , Una señal con esta relación señal/ruido puede representarse perfectamente con 9 bits, ya que, como se recordará del capítulo 15, la relación señal/ruido de una señal digitalizada aumenta 6 dB por cada bit, de donde S / R 9 bits
= 9 × 6 = 54 dB ,
que es mayor que el mínimo de 50 dB. Cualquier bit adicional proporcionará información que no puede escucharse debido a que cae por debajo del umbral. Ahora, si como consecuencia de la aparición de sonidos en otras bandas vecinas el umbral se incrementa a 40 dB, la nueva relación señal/ruido admisible es 70 dB − 40 dB = 30 dB , que puede representarse con sólo 6 bits, ya que S / R 6 bits
= 6 × 6 = 36 dB .
Si en estas nuevas condiciones (umbral de 40 dB) la señal se reduce a sólo 60 dB, un cálculo similar muestra que son suficientes sólo 4 bits para su correcta representación. El ejemplo anterior muestra que la precisión requerida en cada banda puede ir variando a lo largo del tiempo a medida que varía la relación entre el nivel de la señal y el umbral. Sin embargo, esta variación implica también que va variando el peso que se le asigna a un bit, por lo tanto hace falta acompañar los 4, 6 ó 9 bits de la representación anterior con algunos bits adicionales que permitan representar dicho peso. En aparien-
Registro digital
249
cia, esto contrarresta el ahorro de bits, ya que si se utilizan menos bits para representar una misma señal (porque el umbral ha aumentado), cada bit debe tener mayor peso y por lo tanto se requieren más bits para representar ese peso. Para solucionar este inconveniente se recurre al hecho de que el umbral no varía tan rápido como la señal, lo cual permite actualizar el valor del peso recién cada 12 muestras. Esta forma de representación se conoce como representación con coma flotante (floating point), y permite abarcar un mayor rango dinámico con menor cantidad de bits. La cifra que representa a la muestra, con una longitud de entre 0 y 15 bits, se denomina mantisa, y la que representa al peso (6 bits), factor de escala (o exponente). El resultado de combinar la representación de coma flotante con el análisis de enmascaramiento es que para cada subbanda se requiere apenas la cuarta parte de los bits necesarios si no hubiera compresión. A esta altura cabe preguntarse cómo es que todo esto permite ahorrar bits en la representación total; porque si bien cada subbanda requiere, en promedio, la cuarta parte de los bits que requeriría sin tener en cuenta el enmascaramiento, de hecho tenemos... ¡32 bandas! Parecería que la cantidad total de bits es 32/4 = 8 veces mayor. Sin embargo, hay otro hecho que permite contrarrestar esto, y es que como cada banda tiene un ancho de banda 32 veces menor, requiere 32 veces menos muestras por segundo para satisfacer los requisitos del teorema de muestreo. Resumiendo, la codificación PASC consigue una reducción en un factor 4 de la cantidad de bits requeridos para almacenar información de audio digital basándose en tres elementos: 1) Dividir en subbandas que requieren menor frecuencia de muestreo, 2) Aprovechar el hecho de que la precisión requerida para representar una muestra dentro de una subbanda se reduce cuando el umbral dentro de la subbanda aumenta por enmascaramiento, y 3) Utilizar una representación de coma flotante que permite un mayor rango dinámico con menor cantidad de bits. 24.6.2. Corrección de errores, datos auxiliares y modulación La información previamente codificada por el procesador PASC, es sometida posteriormente a una recodificacación CIRC (Cross-interleaved Reed-Solomon Code) similar a la del disco compacto y el DAT. Dicha información es complementada con una serie de datos auxiliares, equivalentes a los subcódigos, que permiten incluir información sobre las piezas grabadas, autores, intérpretes, e inclusive el texto de la música cantada a visualizar en un visor (display) en sincronismo con la música. Finalmente, se utiliza una modulación 8 a 10, similar a la que se utiliza en las cintas DAT, cuya finalidad fue explicada al discutir la modulación 8 a 14 de los discos compactos. La información se graba en 9 pistas de 0,185 mm, siendo la más externa destinada a los datos auxiliares, y las 8 internas a la información principal (señal de audio con los códigos PASC y CIRC). Los datos se organizan en cuadros (frames), cada uno de los cuales contiene 12288 bits, agrupándose 1520 en cada una de las 8 pistas principales y 128 en la pista auxiliar. Esos 1520 bits están constituidos por 1024 bits de datos PASC y 496 bits redundantes del código de corrección de errores. Entre dos cuadros sucesivos existe un espacio vacío, llamado espacio intercuadro (inter-frame gap, IFG) cuya finalidad es compensar pequeñas variaciones de velocidad durante la grabación (ver Figura 24.7).
250
Acústica y Sistemas de Sonido
Cada cuadro mide aproximadamente 1 mm, y contiene información correspondiente a 21,33 ms de programa. La velocidad de almacenamiento de información PASC del sistema DCC es de 384000 bits/s, y la de información total considerando los códigos de corrección de errores, la modulación y los subcódigos, de 780000 bits/s. Esto es alrededor de 5 veces menos que la cifra correspondiente a un disco compacto.
0,107 mm
Aux 0
Lado A
1,745 mm 7 7
≈1 mm
3,78 mm
Lado B 0
Aux
Cuadros
Figura 24.7. Estructura de cuadros de una cinta DCC (fuera de escala). Los cuadros de arriba corresponden al sentido de movimiento hacia la izquierda, y los de abajo hacia la derecha (ver flechas). No se indican las pistas para el caso de cassettes compactos analógicos.
24.6.3. Cabezales de grabación y reproducción El cabezal de grabación de un sistema DCC utiliza una tecnología propia de los circuitos integrados (chips) denominada integración de película fina, que ya se había empleado en los grabadores analógicos multipista. Esta tecnología permite obtener la parte eléctrica de los cabezales, que luego es complementada mediante delgadas láminas ferromagnéticas que cumplen la función de concentradores de flujo, es decir entrehierros. De esta manera se consiguen entrehierros lo suficientemente pequeños como para la alta velocidad de transferencia de información requerida, que asciende a 2016 bits/mm por pista. El cabezal de reproducción utiliza como transductor un elemento magnetorresistivo, formado por un material que varía su resistencia eléctrica en función del campo magnético que lo atraviesa. Este es un concepto totalmente diferente del utilizado en los cabezales reproductores tradicionales de bobina. En este caso se hace circular una corriente constante por el elemento magnetorresistivo, y al variar el campo magnético (debido a la información previamente grabada en la cinta) varía su resistencia y por consiguiente su tensión. El conjunto de cabezales incluye también un cabezal de reproducción analógico que permite reproducir cassettes compactos tradicionales estereofónicos (pero no grabarlos). Este conjunto contiene el cabezal digital en una mitad y el analógico en la otra. Dado que la cinta tiene dos lados (como en el cassette tradicional), pero el cassette no
Registro digital
251
se extrae para cambiar de lado, el cabezal completo gira en forma automática al llegar al final de la cinta. 24.6.4. Especificaciones de los grabadores de DCC Las especificaciones son similares a las de los grabadores de DAT, destacándose que el rango dinámico, debido a la codificación con coma flotante, puede alcanzar fácilmente los 105 dB en los equipos de mayor calidad. 24.6.5. Aplicaciones del sistema DCC De acuerdo a lo analizado anteriormente, el sistema DCC es capaz de reproducir una señal eléctricamente −y también acústicamente− diferente de la señal original, pero de una manera lo suficientemente ingeniosa como para que auditivamente no sea posible distinguir la diferencia. Sin embargo, hay diferencias, que podrían ponerse en evidencia si uno intentara aplicar procesamientos sofisticados a la señal grabada en el formato DCC. Consideremos el ejemplo de un tono de 400 Hz y 80 dB de nivel de presión sonora, y otro de 1000 Hz y 30 dB sonando simultáneamente. De acuerdo con la Figura 2.10 (capítulo 2), se requieren 36 dB para que un tono de 1000 Hz comience a ser audible en presencia de otro de 400 Hz y 80 dB, por lo cual la codificación PASC desechará el tono de 1000 Hz dedicando todo el espacio disponible a almacenar el de 400 Hz con máxima precisión. El resultado es que la señal reproducida contendrá sólo este último, lo cual auditivamente será indistinguible del original. Si después de la grabación quisiéramos recuperar el tono de 1000 Hz por medio de un ecualizador, ya no podríamos, porque ha sido removido irreversiblemente. En un sistema basado en la codificación PCM en lugar de la PASC, como el disco compacto o el DAT, el tono más débil habría quedado grabado y podría recuperarse con el ecualizador. Resulta entonces que los sistemas DCC de buena calidad pueden utilizarse con ventaja para grabar señales de audio definitivas, dado que proveen grabaciones que no se diferencian auditivamente de la señal original pero tienen un rango dinámico algo mayor que los sistemas PCM. No son, en cambio, recomendables para señales que requerirán procesamiento posterior.
24.7. Minidisc (MD) El minidisc es otro medio que utiliza compresión de datos ATRAC (similar a la del DCC), siendo el objetivo en este caso disponer de la misma cantidad de audio que en un CD en un área menor. Una diferencia con el CD normal es que es un soporte regrabable. Para ello se utiliza una tecnología óptico-magnética, u óptico-termomagnética. La escritura se realiza calentando una delgada película magnética hasta desmagnetizarla, y aplicando un campo magnético apropiado. Al enfriarse, la película queda magnetizada según el campo aplicado. La lectura utiliza el denominado efecto Kerr, por el cual un campo magnético introduce una rotación en la polarización del haz láser. Este cambio de polarización se convierte en un cambio de intensidad que es detectado en forma análoga a la del CD.
252
Acústica y Sistemas de Sonido
25.
Capítulo 25
Consolas de mezcla 25.1. Introducción En los capítulos anteriores habíamos examinado una serie de dispositivos que cumplían funciones puntuales de procesamiento de señal dentro de un sistema de sonido. En un sistema práctico, es frecuente que intervengan varios de estos dispositivos a la vez. Por ejemplo, podría haber fuentes de señal tales como micrófonos, sintetizadores o reproductores de discos compactos; procesadores, tales como compresores, ecualizadores y reverberadores; sistemas de monitoreo o de refuerzo sonoro, formados por amplificadores y altavoces; y, por último, equipos de grabación tales como un grabador multipista analógico o un DAT. El último dispositivo que estudiaremos es la consola de mezcla, también llamada mesa de mezcla o mezcladora. Este equipo, que puede ser desde una sencilla mezcladora de 4 canales hasta una compleja consola digital de 48 ó 56 canales, tiene por finalidad mezclar o combinar las señales provenientes de algunos de los bloques anteriores y crear nuevas señales que servirán como señales de entrada para otros bloques (Figura 25.1). Micrófono Efecto
Sintetizador
Consola
Ecualizador
Amplificador Altavoz
Reproductor de CD Grabador
Figura 25.1. Ejemplo esquemático que ilustra el papel que juega la consola de mezcla como ente centralizador y administrador de las señales de un sistema de sonido.
Consolas de mezcla
253
25.2. Funciones específicas de una consola La función principal de una consola de mezcla es proporcionar la suma de diversas señales eléctricas, cada una de ellas atenuada o amplificada con respecto a su nivel original en un factor ajustable por el operador. Dicha suma es el análogo de la superposición o suma acústica que tendría lugar si las fuentes sonoras originales radiaran sonido simultáneamente. Hay varias razones por las que en general es preferible realizar la suma de señales eléctrica y no acústicamente: 1) El ajuste eléctrico de los niveles de las diversas señales es mucho más simple, ya que se realiza por medio de potenciómetros deslizantes. Un ajuste acústico implicaría una gran ductilidad de los músicos para alcanzar un cuidadoso balance dinámico entre las diversas partes, lo cual puede ser una exigencia muy grande (especialmente en la música pop; no así en la música clásica o erudita). 2) El ajuste acústico involucraría la toma estereofónica con un par de micrófonos distantes, los cuales captarían menos señal pero igual o más ruido ambiente, empeorando la relación señal/ruido. En este sentido conviene tener en cuenta que hoy en día es mucho más fácil combatir el ruido eléctrico que el ruido acústico. 3) El ajuste eléctrico puede realizarse sobre señales provenientes de una grabación multicanal, siendo posible realizar ajustes posteriores a la grabación. Si el balance dinámico se hiciera acústicamente y el resultado se grabara en estéreo, ya no sería posible modificar o corregir dicho balance. 4) Si alguna de las fuentes sonoras es un sintetizador u otro instrumento electrónico, es preferible procesar directamente la señal eléctrica que éste genera. Si se la transformara primero en sonido (por medio de un sistema de monitoreo) para luego volver a la señal eléctrica mediante un micrófono, se estaría empeorando la relación señal/ruido. 5) La mezcla eléctrica permite la posibilidad de grabar en play back, es decir agregar a posteriori otro instrumento (o voz) sobre una base constituida por varios instrumentos grabados con antelación. Las grandes consolas suelen tener un número considerable de canales de entrada (por ejemplo 24), algunos de los cuales son monofónicos y otros estereofónicos, y una cantidad menor de canales de salida (por ejemplo 6). Cada canal de salida es la superposición de algunos canales de entrada con los correspondientes ajustes de nivel. Los canales de salida se suelen denominar grupos, o también submasters. En general existe un canal de salida estereofónico sobre el cual pueden mezclarse todas las señales, incluidas las de los submasters. Se denomina master, o mezcla principal. Las señales de entrada pueden ser de bajo nivel (entradas de micrófono) o de nivel de línea. Para el primer caso, los canales de entrada tienen preamplificadores incorporados. La selección del tipo de entrada suele hacerse por medio de pulsadores. Las señales de salida son de nivel de línea, aptas para excitar un amplificador, ecualizador, etc. Otra función de las consolas es la de posibilitar la incorporación de efectos a las señales (ver capítulos 16 al 22). Según se comentó oportunamente, algunos efectos se conectan en serie, es decir que toda la señal pasa por ellos. Las consolas proveen para ello conexiones denominadas conexiones de inserción (inserts) en cada canal de entrada. Otros efectos se conectan en paralelo, de manera que una parte de la señal sea procesada y otra parte no. Para esto se proporcionan los envíos auxiliares (send) y los retornos auxiliares (return).
254
Acústica y Sistemas de Sonido
Por último, la gran mayoría de las consolas permite una ecualización (en general sencilla, es decir de dos o tres bandas) en cada canal de entrada, y a veces también en la salida (en este caso suele haber 7 ó más bandas). Además de las funciones anteriores, existen otras de carácter administrativo, que facilitan el trabajo del operador en cuanto a ajustes de nivel, localización de errores, flexibilidad de conexionado, versatilidad, etc. Estas funciones se realizan por medio de los siguientes elementos, entre otros: 1) Vúmetros, es decir indicadores de nivel analógicos (mediante instrumentos de aguja móvil) o cuasianalógicos, mediante barras de LEDs (diodos emisores de luz) o LCD (display de cristal líquido). En general se provee un solo vúmetro estereofónico, conmutable por medio de botones entre varias fuentes (entradas individuales, salida). En las consolas más completas puede haber un vúmetro por cada canal, además de uno para cada salida. 2) Salidas de monitoreo para la sala de control, que conectadas a un amplificador (precedido por un ecualizador de ser necesario) permiten excitar los monitores (altavoces de mediana potencia para uso en escenario o sala de control). 3) Pulsadores de sordina (mute), que permiten silenciar uno o más canales a elección del operador. 4) Pulsadores de solo, que permiten escuchar, también a elección, un canal por vez (o más de uno, si se oprimen varios pulsadores). En la Figura 25.2 se muestra esquemáticamente el panel de control y el panel de conexiones de una consola de 8 canales de entrada y 4 canales de salida.
Entradas de micrófono
Salidas de grupo y de master
Entradas de línea Conexiones de inserción
Envíos y retornos auxiliares de micrófono
Ajustes de nivel
Vúmetros
Ecualizadores Ajustes de retornos auxiliares
Ajustes de envíos auxiliares
Otros ajustes Ajustes de paneo
Ajuste de paneo de grupos Faders de salida
Faders de entrada Canales de entrada
Canales de salida
Figura 25.2. Aspecto esquemático de una consola de 8 canales de entrada y 4 canales de salida (2 grupos y un master estereofónico).
Consolas de mezcla
255
25.3. Estructura de una consola de mezcla Las funciones principales de una consola se basan en unos pocos conceptos básicos que ya hemos descripto detalladamente en capítulos anteriores: la amplificación, atenuación, filtrado y superposición de señales eléctricas de audio. Sin embargo, la complejidad de su topología (es decir la estructura interna de conexiones), así como la gran cantidad de variantes que se presentan en las consolas disponibles comercialmente dificultan su comprensión. Por este motivo es conveniente comenzar describiendo algunos diagramas de bloques sencillos, a los cuales iremos agregando sucesivamente más elementos. El primer ejemplo (Figura 25.3) corresponde a la función fundamental de las consolas: la mezcla. En este ejemplo se trata de una consola de 4 canales de entrada y 2 canales de salida (derecho e izquierdo). Cada canal de entrada posee una entrada de
Línea
Ajuste de nivel
Mic.
Der
Mezclador
Σ Paneo
Preamplificador
Fader de canal
Der Fader principal
Izq
Σ Figura 25.3. Estructura básica de una consola mezcladora de cuatro canales de entrada y salida estereofónica. Cada canal tiene un preamplificador con ajuste de nivel que lleva el nivel de la señal de entrada al nivel de línea. Luego hay un fader de canal, que define la proporción en que dicho canal se agregará a la mezcla. Luego hay un control de paneo, que reparte la señal hacia ambos canales estereofónicos, luego de lo cual la señal se mezcla en los mezcladores principales. Los faders principales actúan como ajustes globales de volumen.
Izq
256
Acústica y Sistemas de Sonido
línea y una entrada de micrófono. En general se utilizan conectores diferentes, por ejemplo TRS para la entrada de línea y XLR para la de micrófono, en ambos casos con conexión balanceada para reducir el ruido. En algunas consolas pueden coexistir ambas señales. En otras, se puede seleccionar mediante un pulsador cuál de las dos entradas está activa. La entrada de línea va directamente a un ajuste de nivel (trim), mientras que la entrada de micrófono pasa primero por un preamplificador, debido a que la señal de los micrófonos es en general de muy bajo nivel. El propósito del ajuste de nivel es dar uniformidad al nivel medio de las diversas señales de entrada. Este ajuste provee normalmente una ganancia de hasta 60 dB para la entrada de micrófono y hasta 40 dB para la entrada de línea. Luego del ajuste de nivel aparece en cada canal un potenciómetro deslizante denominado fader (pronunciado féider; en castellano, atenuador), con el cual se ajusta la proporción en que se mezclará dicho canal con los otros. Normalmente el fader provee una ganancia entre −∞ dB y 10 dB, que corresponden a una ganancia numérica entre 0 y 3,16. La ganancia 0 dB corresponde a una ganancia numérica 1 (es decir sin cambio de nivel). Es importante destacar la diferencia entre el ajuste del nivel de entrada y el fader. El ajuste de nivel permite trabajar con un nivel de señal apropiado para el resto del circuito, esto es, ni demasiado pequeño como para tener una relación señal/ruido pobre, ni tan alto como para que alguna parte del circuito entre en saturación. Veamos con un ejemplo que sucedería si sólo se utilizaran los faders para obtener el nivel apropiado. Supongamos que al canal 1 ingresa una señal de línea de 245 mV (= 0,245 V) y al canal 2 una de 7,75 V, y supongamos que se requiere mezclarlas de manera que ambas tengan igual nivel. La señal del canal 1 es demasiado baja (de hecho está en el límite inferior de lo que se admite como nivel de línea; ver Tabla 9.2), por lo cual sería necesario llevar el fader a su posición máxima de 10 dB. Esto implica multiplicar por 3,16, obteniéndose una señal de 0,245 V × 3,16 = 0,775 V . Si pretendemos que la señal del canal 2 tenga este nivel deberemos atenuarla 10 veces, ya que 7,75 = 10 . 0,775 En otras palabras, deberá atenuársela en 20 dB, con lo cual se reduce la relación señal/ruido. Evidentemente hubiera sido preferible aplicar ganancia a la señal más débil por medio del ajuste de nivel, ya que cuanto mayor sea una señal, más inmune resulta frente al ruido. Continuando con el recorrido de la señal, se llega al ajuste de paneo (pan pot = panoramic potentiometer = potenciómetro panorámico). Este ajuste desdobla la señal en dos partes: una va hacia el canal derecho y la otra hacia el canal izquierdo. En el extremo izquierdo de su recorrido, toda la señal va hacia el canal izquierdo, y en el extremo derecho, va toda hacia el canal derecho. Cuando el ajuste se encuentra en la posición central, la señal va en partes iguales a ambos canales. La finalidad de este control es ubicar virtualmente en el espacio la fuente que corresponde a cada canal. Así, por ejemplo, con el potenciómetro en el extremo izquierdo la fuente parecerá estar total-
Consolas de mezcla
257
mente hacia la izquierda, mientras que en la posición central dicha fuente parecerá estar al frente. En la práctica, sin embargo, para lograr efectos espaciales de gran realismo el paneo debe complementarse con el agregado de un retardo en el canal más débil (ver efecto Haas, capítulo 2). Las señales del canal derecho del ajuste de paneo se dirigen hacia el mezclador derecho y las del canal izquierdo hacia el mezclador izquierdo. Un mezclador es simplemente un sumador de señales, que suma todas las señales en igual proporción. Si se desea que una señal aparezca en la mezcla final con mayor nivel que otra, el correspondiente ajuste deberá efectuarse mediante los faders de los respectivos canales de entrada. Finalmente, la salida de cada mezclador pasa por un fader principal, que permite a su vez ajustar el nivel en forma independiente en cada canal de salida. Si los canales de salida designados como derecho e izquierdo realmente se utilizan para obtener sonido estereofónico, ambos faders principales deberían ajustarse en forma pareja para no distorsionar la imagen estereofónica que se asigna a cada señal mediante el paneo correspondiente. El conjunto de señales que llegan a un sumador se denomina línea ómnibus, o simplemente bus. En el ejemplo de la Figura 25.3 cada bus está integrado por 4 líneas simples, provenientes de los canales de entrada. En los diagramas de bloques de las consolas que se proporcionan en los respectivos manuales del usuario es común utilizar una única línea para representar un bus, evitando así complicar el diagrama. Para hacer las cosas más claras, es conveniente representar los buses con líneas más gruesas, y así se ha hecho en la Figura 25.4, aunque en general no se tiene en cuenta esta convención. Izq Der Línea
Ajuste de nivel
Izq Paneo
Mic.
Mezclador Preamplificador
Fader de canal
Der
Σ
Izq Fader principal
Σ
Figura 25.4. Diagrama de bloques de la consola de la figura anterior en el cual los buses, formados por 4 líneas, se han representado con líneas de trazo grueso.
Der
258
Acústica y Sistemas de Sonido
25.3.1. Ecualizadores El siguiente elemento a agregar a la consola de las Figuras 25.3 y 25.4 es un ecualizador. La versión más rudimentaria consiste en un control de tonos de graves y agudos, pero la mayoría de las consolas poseen al menos tres bandas: graves, medios y agudos. La banda central suele ser semiparamétrica, permitiendo ajustar la frecuencia central entre dos extremos, o paramétrica, permitiendo también ajustar el ancho de banda o el factor de calidad Q. En algunas consolas más complejas se proporcionan dos bandas centrales paramétricas, y en otras las cuatro bandas son paramétricas. Finalmente, existen consolas en donde la sección de ecualización es un completo ecualizador gráfico por octavas. El ecualizador se inserta entre el ajuste de nivel y el fader de canal. En la Figura 25.5 se ha modificado la consola de la Figura 25.4 para incluir la sección ecualizadora. Las frecuencias de las diferentes bandas no están normalizadas (excepto en los casos en que se incluyen ecualizadores gráficos), aunque es frecuente encontrar ciertos juegos de frecuencias. Por ejemplo, 100 Hz para los graves, 1 kHz para los medios y 10 kHz para los agudos, o bien 80 Hz para los graves, 2,5 kHz para los medios y 12 kHz para los agudos. En el caso de los medios paramétricos o semiparamétricos, el rango de frecuencias suele estar comprendido entre 100 Hz y 10 kHz. En los medios paramétricos, el valor de Q puede llegar a variar entre 0,5 y 10 ó más, aunque en general conviene restringir el ajuste a un máximo de 3 para evitar los campanilleos y los sonidos sibilantes que acompañan a los filtros de ancho de banda muy estrecho (o Q muy alto). Además del ecualizador, las consolas suelen tener filtros pasaaltos de baja frecuencia (40 a 100 Hz), que se insertan opcionalmente antes del ecualizador, mediante un selector, para eliminar ruidos de muy baja frecuencia (zumbidos, ruidos de motores, pisadas, etc.) en señales sin contenido en baja frecuencia (por ejemplo una flauta). También puede haber un pasabajos, de frecuencia de corte elevada, para reducir ruidos de alta frecuencia en señales que no contienen tales frecuencias (un bombo a pedal, por ejemplo). Línea
Ajuste de nivel
Fader de canal Izq
Mic. Preamplificador
Izq Der
Paneo Ecualizador
Der
Mezclador
Σ
Izq Fader principal
Σ
Figura 25.5. Diagrama de bloques de una consola de cuatro canales de entrada y salida estéreo con ecualizadores de canal de tres bandas.
Der
Consolas de mezcla
259
25.3.2. Conexiones de inserción (inserts) Una de las características que dan poder y versatilidad a las consolas es la posibilidad de agregar procesamiento, por medio de equipos externos, a las señales que reciben. Las conexiones de inserción (Figura 25.6) proveen el medio para intercalar efectos y otros procesadores en serie. Se utilizan cables de inserción en Y, terminados en un extremo en un conector de tipo plug TRS y en el otro en dos conectores plug TS (Figura 25.7). Al introducir el plug TRS en el conector de inserción de la consola, se interrumpe la conexión interna entre la salida del ajuste de nivel y la entrada del ecualizador, y dichos puntos se derivan hacia afuera por medio de los conectores TS, dirigiéndose respectivamente a la entrada y la salida del procesador externo. Estas conexiones de inserción permiten, por ejemplo, utilizar compresores o compuertas en canales específicos, así como de-essers, antipop, etc. También pueden canalizarse a través de ellas algunos efectos, como el vibrato.
Conexión de inserción Izq Der Línea
Ajuste de nivel
Fader de canal Izq Paneo
Mic. Preamplificador
Ecualizador
Der
Mezclador
Σ
Izq Fader principal
Σ
Figura 25.6. Diagrama de bloques de la consola de las figuras anteriores, a la cual se le han agregado conexiones de inserción para intercalar procesadores y /o efectos en serie. Las llaves conmutadoras representan en realidad contactos dentro del conector de la consola, que se separan al introducir un plug TRS.
Der
260
Acústica y Sistemas de Sonido
Las conexiones de inserción vistas hasta aquí estaban ubicadas prácticamente a la entrada, apenas después del ajuste de nivel. Es posible incorporar este tipo de conexiones en otros puntos del trayecto de la señal, inclusive después de la mezcla (lo cual podría ser útil para agregar un compresor-limitador que afecte a la totalidad de la señal de salida). T
R
S
T
S
Conexión de inserción T
S
A la entrada del procesador (envío) De la salida del procesador (retorno)
Figura 25.7. Cable de inserción en Y, utilizado para incorporar procesadores o efectos en serie por medio de la conexión de inserción (insert) de una consola. Los conectores son de tipo TRS y TS, es decir plug de 1/4” estéreo y mono respectivamente.
25.3.3. Conexiones auxiliares Habíamos visto en el capítulo 16 que los efectos en paralelo requieren que una parte de la señal pase por el procesador, y otra parte pase directamente, sumándose luego ambas. Una posibilidad sería agregar en cada canal, antes de su salida al bus, un sumador. Esto obligaría, sin embargo, a agregar tantos sumadores como canales de entrada, lo cual encarecería la consola e incrementaría el ruido. Por otra parte, a diferencia de los efectos en serie, los efectos en paralelo suelen aplicarse a varias señales a la vez, es decir son efectos globales (por ejemplo, la reverberación), por lo cual las consolas poseen conexiones auxiliares que involucran a varios canales de entrada o a todos ellos. Las conexiones auxiliares se dividen en conexiones de envío (send) y de retorno (return). Un envío auxiliar es una salida obtenida sumando, en un mezclador auxiliar, las señales procedentes de los canales de entrada. Dichas señales pasan primero por sendos ajustes de ganancia que permiten mezclarlas en proporciones diferentes a las usadas para la mezcla principal (Figura 25.8). Un retorno auxiliar es una entrada, normalmente estereofónica, que después de un ajuste de ganancia ingresa al bus principal. 25.3.4. Envíos auxiliares Con respecto a los envíos auxiliares, hay dos posibilidades: 1) que las señales a mezclar se tomen antes del fader de canal, y 2) que se tomen después. En el primer caso se tiene el auxiliar pre fader, y en el otro el auxiliar post fader. Desde el punto de vista conceptual, no hay diferencias importantes, ya que con cualquiera de los dos procedimientos podría obtenerse el mismo resultado final. Es en el aspecto práctico donde difieren ambas conexiones. Así, dado que el auxiliar pre fader toma las señales antes de los respectivos faders, no es afectado por los ajustes realizados en los canales con miras a la mezcla principal. Esto permite obtener una mezcla ad hoc que puede utilizarse, por ejemplo, en los monitores de los músicos. Por diversas razones, la mejor mezcla principal desde el punto de vista del oyente no necesariamente es la mejor o la más funcional para los intérpretes. Por ejemplo, puede suceder que en un pasaje vocal a
Consolas de mezcla
261
Conexión de inserción Aux. I D Pre Post Línea
Fader de canal
Nivel
Mic.
Izq Pan
Preamplificador
Ecualizador
Der Aux. Post Fader
Aux. Pre Fader de canal
Mezclador principal
Σ
I Fader principal
Σ
D
Mezclador auxiliar Retorno auxiliar
D Ganancia
Nivel auxiliar (pre)
I
Σ
D Retorno auxiliar
Ganancia I
Envío auxiliar (pre)
Σ
Envío auxiliar (post)
Nivel auxiliar (post)
Figura 25.8. Diagrama de bloques de la consola de la figura anterior a la cual se le han agregado envíos y retornos auxiliares.
262
Acústica y Sistemas de Sonido
varias voces con mucha percusión los cantantes tengan dificultades para mantener la afinación si la percusión sobresale. En ese caso, bastará reducir el nivel de la percusión en el monitor, sin que ello repercuta en la mezcla final a grabar. El auxiliar post fader se utiliza específicamente para los efectos en paralelo. La señal enviada hacia el procesador de efectos (a través del bus auxiliar y su mezclador) queda en este caso afectada por el fader, de modo que la señal procesada (señal “húmeda”) aumentará o disminuirá junto con la señal sin procesar (señal “seca”). Tomemos como ejemplo un reverberador digital. Al subir el fader de algún canal en 10 dB, no sólo sube 10 dB el nivel de la señal sino también el nivel de la reverberación. Si utilizamos, en cambio, un auxiliar pre fader como envío hacia el reverberador, un aumento de 10 dB en la señal no se verá acompañado por un aumento similar en la señal procesada, y la señal final resultará demasiado seca. En muchas consolas los envíos auxiliares pueden conmutarse entre post fader y pre fader. Esto permite mayor versatilidad, dado que deja al operador la elección entre una y otra posibilidad. 25.3.5. Retornos auxiliares Normalmente, los retornos auxiliares reciben la señal que vuelve de un procesador de efectos, y la vuelcan al bus principal. Dado que muchos efectos tienen salida estereofónica (aún cuando tengan entrada monofónica), los retornos auxiliares son, por lo general, estéreo (Figura 25.8). Para ajustar apropiadamente la relación entre el efecto y el sonido directo se provee un control de ganancia estéreo (es decir cuyo ajuste es el mismo para ambos canales). 25.3.6. Grupos o submasters Las consolas grandes suelen tener varias salidas denominadas grupos (a veces, también subgrupos o submasters). Conceptualmente, en un grupo se mezclan las señales presentes en el correspondiente bus de grupo, las cuales provienen de los canales de entrada y de los retornos auxiliares, obteniéndose así mezclas parciales (Figura 25.9). En realidad, cuando hay varios grupos, en cada canal de entrada existen selectores de direccionamiento (routing) que permiten determinar hacia qué grupo o grupos (no son excluyentes) se dirigirá la señal de dicho canal. Dichos selectores se encuentran después del ajuste de paneo del canal, y seleccionan pares de grupos, por ejemplo 1-2, 3-4, de manera que las mezclas parciales resulten estereofónicas. Del mismo modo, cada retorno auxiliar posee selectores de direccionamiento con idéntica función. Después de la mezcla correspondiente a un grupo puede encontrarse una conexión de inserción similar a las que había a la entrada. El objetivo de la misma es permitir agregar un efecto o procesamiento en serie a todo el grupo, es decir simultáneamente a todas las señales que intervienen en él. De allí la señal del grupo pasa a un fader de grupo (que es un control de volumen global del grupo), de donde se obtiene la salida del grupo. Esta salida puede utilizarse para grabar una pista en un grabador multipista, o puede agregarse a la mezcla principal, pasando previamente por un ajuste de paneo de grupo. Este paneo se provee para mayor versatilidad, pero a veces conviene llevarlo a uno u otro extremo. Supongamos, por ejemplo, que con el selector de direccionamiento enviamos varias señales de entrada a los grupos 1 y 2, cada una con un adecuado paneo. Entonces, si se desea llevar dichos grupos a la mezcla principal preservando la imagen estereofónica, convendrá llevar el grupo 1 enteramente al canal izquierdo y el 2 al derecho.
Consolas de mezcla
263
Grupos Auxil. I D 1 2 3 4 Pre Post Inserción de canal Fader de canal
Lín.
Nivel
Mic.
Izq Pan
Preampl.
Ecualizador
Der 1-2
3-4 Aux. Post Fader CANAL 1 (los otros 3 son iguales)
Aux. Pre Fader
Σ
I
Σ
D
GRUPO 1 (los otros 3 son iguales)
Inserción de grupo Fader de grupo
Salida de grupo 1
Izq Pan
Retorno auxiliar
Mezcla principal
Der
I Ganancia
I-D
D
Grupo 1
Σ
Mezclador auxiliar
Σ
Pre
Σ
Post
1-2
RETORNO 1 (el otro es igual)
3-4
Figura 25.9. Diagrama de bloques de una consola de 4 canales de entrada, 4 grupos de salida, una salida principal estéreo y 2 conexiones auxiliares, una pre fader y la otra post fader. Por razones de claridad se muestra sólo un canal, un grupo y un retorno auxiliar.
264
Acústica y Sistemas de Sonido
25.3.7. Fuente fantasma La mayoría de las consolas actuales proveen una fuente fantasma de 48 V en sus entradas balanceadas XLR de micrófono, para polarizar los micrófonos capacitivos. Esta fuente en general puede conectarse o desconectarse globalmente mediante un interruptor, aunque en las consolas más completas la conexión es independiente en cada canal. Si bien los micrófonos dinámicos no requieren alimentación, es posible utilizarlos sin peligro con la fuente fantasma conectada siempre que sean balanceados. Si no lo son (aunque posean una ficha XLR), pueden destruirse fácilmente. 25.3.8. Monitoreo El monitoreo consiste en la propalación de la señal resultante de una mezcla para su escucha, ya sea por el operador o por los músicos. Existen dos tipos de monitoreos: el monitoreo para el operador, que debe sonar exactamente como la mezcla principal (o submezclas, según el caso), y el monitoreo para el intérprete, que difiere del anterior en que normalmente enfatiza algunas partes que facilitan su ejecución o interpretación. En este último caso se toman las señales de los envíos auxiliares pre fader. El monitoreo para el operador se proporciona normalmente en dos formas: una salida para la sala de control, que mediante un amplificador externo de mediana potencia excita los altavoces monitores, y una salida amplificada para auriculares. Se provee un control de volumen para estas señales. En general es posible seleccionar qué mezcla está accesible en la salida para sala de control (por ejemplo, la mezcla principal o un grupo determinado). 25.3.9. Selectores de SORDINA (mute) Además de los controles ya discutidos, existen otros selectores que cumplen funciones administrativas dentro del trabajo de mezcla. El primero es el selector de sordina (mute), que se utiliza para silenciar la señal seleccionada sin alterar las restantes. Este silenciamiento se consigue simplemente desconectando dicha señal del bus principal y del que contiene las señales de monitoreo. Puede aplicarse la sordina a más de un canal. La sordina puede utilizarse en varias situaciones. Por ejemplo, para detectar entre un grupo de músicos cuál está desafinando, o para eliminar un canal que contiene indicaciones para los músicos (como avisos de entradas), o una señal de metrónomo, o simplemente una guía grabada por el operador o el ingeniero de sonido describiendo brevemente el título de las piezas, autores, etc. 25.3.10. Selectores de SOLO Otro control habitual en las consolas es el solo, que permite silenciar todos los canales excepto aquellos en que se haya presionado el correspondiente botón selector. En cierto sentido cumple la función inversa de la sordina, debiendo advertirse que la selección de solo prevalece sobre la de sordina en el mismo canal. Esta función se logra desconectando, por medio de un relé (llave comandada eléctricamente por una señal de control), la señal de monitoreo en la sala de control y reemplazándola por una mezcla de un bus de solos, que contiene todas las señales de los canales seleccionados como solo. Hay dos tipos de solo: el solo pre fader (pre fader listen, PFL, o también cue), que toma la señal del canal antes de pasar por el fader, y el solo post fader (solo in place, SIP), que toma la señal tal como va a ser volcada al bus principal para su mez-
Consolas de mezcla
265
cla. El solo pre fader se utiliza como guía durante el ajuste de nivel de la señal de entrada del canal. El solo post fader, para aislar un determinado canal tal como aparecerá en la mezcla. Es posible seleccionar más de un solo, permitiendo así comparar niveles relativos o ubicaciones en el espacio de dos o más fuentes sonoras virtuales. 25.3.11. Vúmetros A efectos de realizar los ajustes de nivel requeridos, las consolas tienen un instrumento de medición denominado vúmetro. El nombre proviene de las siglas de Volume Units, es decir unidades de volumen (utilizada históricamente para medir el volumen sonoro entregado). Es una escala logarítmica que coincide con el nivel de potencia en dBm. Hoy en día se utilizan más las referencias de tensión, como el dBu (que sólo coincide con el dBm cuando la carga es una resistencia de 600 Ω ). En realidad existen tres escalas para los vúmetros en uso por los diversos fabricantes de consolas, que consisten en llamar 0 VU a los niveles −10 dBV, +4 dBu, y a 0 dBu respectivamente. En todos los casos deberá verificarse en el manual del usuario cuál es la referencia utilizada.
25.4. Presentación de los canales de entrada Los canales de entrada poseen una presentación bastante característica, en la cual se integran varios de los elementos que hemos descripto hasta ahora. Aunque existen muchas variantes según el fabricante y el modelo, el aspecto general es el que se muestra en la Figura 25.10. Como puede apreciarse, el ordenamiento vertical de los controles, ajustes y selectores sigue aproximadamente la sucesión de bloques por los cuales va pasando la señal. Así, en la parte superior encontramos el potenciómetro de ajuste de nivel de la señal de entrada. Luego se encuentra un botón de selección con el cual puede optarse por intercalar o no un filtro pasaaltos de baja frecuencia (en el ejemplo, de 50 Hz) para eliminar o reducir componentes de muy baja frecuencia o inclusive subsónicas, que pese a ser inaudibles pueden restar rango dinámico a la señal. Debajo de la sección anterior se tiene la sección ecualizadora. En este ejemplo se muestra un ecualizador paramétrico en el cual la frecuencia de corte de los graves es de 100 Hz, la frecuencia de corte de los agudos de 10 kHz y la frecuencia de los medios es ajustable, así como su factor de calidad Q. Más abajo aparece la sección de control de nivel de las salidas auxiliares, que en este ejemplo son 4. Junto a cada ajuste de nivel hay un botón que permite conmutar entre conexiones post fader (la normal) y pre fader. No siempre se tiene esta disposición. A veces algunos auxiliares son pre fader y otros post fader, otras veces algunos son conmutables y otros no, y en otros casos se pueden conmutar por grupos (por ejemplo, los auxiliares 1 y 2 son post fader y los 3 y 4 se conmutan juntos entre pre y post fader). Otra variante en el caso de los auxiliares es que exista algún botón de selección que permite que un mismo potenciómetro de ajuste pueda, optativamente, referirse por ejemplo al auxiliar 4 ó al 5. Este tipo de presentaciones obedece nada más que a compromisos de diseño, en donde se procura minimizar el número de componentes (y en consecuencia abaratar el producto) preservando la máxima versatilidad posible. Luego nos encontramos con la sección de paneo, con algunos selectores de direccionamiento. Estos selectores permiten dirigir la señal paneada a los canales izquierdo y derecho de la mezcla principal, a los grupos de salida (o submezclas) 1 y 2, o a los
266
Acústica y Sistemas de Sonido
Nivel
PA 50 Hz
Agudos
100 Hz f
Medios Q Graves
10 kHz
Aux 1
Pre
Aux 2
Pre
Aux 3
Pre
Aux 4
Pre
PAN I-D
Solo
1-2
Sord.
grupos 3 y 4, no excluyentemente. También se encuentran aquí los botones de solo y sordina. Esta última directamente elimina de la mezcla la señal proveniente del canal correspondiente. El selector de solo, en cambio, afecta principalmente al bus de solos y a la señal de monitoreo para la sala de control, de modo que no afecta la mezcla principal. En algunos casos puede afectar la salida de los grupos. Finalmente, se tiene el fader de canal, es decir un potenciómetro deslizante que permite ajustar el nivel de la señal correspondiente a dicho canal a los efectos de la mezcla principal o de las mezclas de los grupos. El fader está graduado en dB referidos a ganancia 1, es decir que una ganancia de tensión de 2, por ejemplo, corresponderá a 20 log 10
2 1
= 6 dB .
Muchas fabricantes prefieren graduar los faders de sus consolas de 0 a 10, sin que tal escala represente ningún tipo de medida estándar. La misma observación vale para el resto de los controles o ajustes de ganancia (excepto en los ecualizadores, en los que se ha impuesto la graduación en dB).
3-4
25.5. Sección de salida + 10 +5 0 -5 - 10 - 20 - 30 - 40 - 50 - ∞
Figura 25.10. Ejemplo de canal de entrada de una consola con 4 grupos y 4 salidas auxiliares seleccionables como pre o post fader.
También la sección de salida tiene una presentación característica en las consolas, aunque existen más variantes que en los canales de entrada. Esta sección incluye los faders de los grupos, el fader principal, los ajustes de nivel de los envíos y retornos auxiliares, los vúmetros, el ajuste de volumen del monitoreo de la sala de control, y una serie de selectores de direccionamiento vinculados con los grupos, los retornos auxiliares y el monitoreo. En la Figura 25.11 se muestra un ejemplo. En la parte superior de esta sección suelen encontrarse los vúmetros. En general existe por lo menos un vúmetro por cada grupo, y un par estéreo para la mezcla principal, aunque en
Consolas de mezcla
267
las consolas más económicas se suele utilizar un solo par estéreo asignable a diversas salidas por medio de botones selectores (similares a los de direccionamiento del paneo). En la parte inferior, paralelamente a los faders de los canales de entrada, se encuentran ubicados los faders de los grupos y de la mezcla principal. Los ajustes de nivel y los botones de direccionamiento se ubican normalmente en la zona central de la sección de salida, existiendo aquí casi tantas variantes posibles como modelos de consolas. Esto suele ser fuente de confusión para el usuario, especialmente cuando se trata de adquirir una nueva unidad. Siempre es recomendable examinar con detenimiento el diagrama de bloques interno y relacionarlo con las perillas de
+10 +5 0 -2 -4 -7 - 10 - 20 - 30
+10 +5 0 -2 -4 -7 - 10 - 20 - 30
+10 +5 0 -2 -4 -7 - 10 - 20 - 30
+10 +5 0 -2 -4 -7 - 10 - 20 - 30
+10 +5 0 -2 -4 -7 - 10 - 20 - 30
Envíos auxiliares 2
1
3
+10 +5 0 -2 -4 -7 - 10 - 20 - 30
Auriculares 4
Retornos auxiliares Solo I-D 1-2 3-4
I-D 1-2 3-4
I-D 1-2 3-4
I-D 1-2 3-4
PAN
PAN
PAN
PAN
Solo PFL/SIP
Grupo 1
Grupo 2
Grupo 3
Grupo 4
I
D
+10
+10
+10
+10
+10
+10
+5
+5
+5
+5
+5
+5
0
0
0
0
0
0
-5
-5
-5
-5
-5
-5
- 10
- 10
- 10
- 10
- 10
- 10
- 20
- 20
- 20
- 20
- 20
- 20
- 30 - 40 - 50 - ∞
- 30 - 40 - 50 - ∞
- 30 - 40 - 50 - ∞
- 30 - 40 - 50 - ∞
- 30 - 40 - 50 - ∞
- 30 - 40 - 50 - ∞
Figura 25.11. Aspecto de la sección de salida de una consola con 4 grupos de salida y una salida principal.
268
Acústica y Sistemas de Sonido
ajuste y los selectores disponibles en el panel de control. Además es útil imaginar varias situaciones complejas de mezcla y verificar si la consola ofrece posibilidades suficientes para llevarlas a cabo. En el ejemplo de la Figura 25.11 cada grupo posee un ajuste de paneo, que determina en qué proporción se mezcla cada uno de ellos en cada canal de la salida principal. Además, cada retorno auxiliar tiene selectores que permiten ingresar la correspondiente señal estereofónica al bus principal y/o a pares de buses de grupo. También se ubica en esta parte de la consola la conexión de auriculares, que va acompañada de un control de volumen que afecta a ambos canales por igual. Finalmente, se ha incluido un selector que establece si el modo del solo es PFL (pre fader) o SIP (post fader). También se ha incorporado un control de volumen propio para el solo, lo cual permite no alterar el nivel de monitoreo general cada vez que se desea escuchar un canal individual.
25.6. Conexiones para grabador de cinta Muchas consolas tienen conexiones de entrada y de salida para grabadores de cinta, de cassette o de DAT. En general se trata de conexiones para grabadores estereofónicos y no multipista. Las entradas (tape in), provenientes de las salidas de reproducción (play) del grabador, en algunos casos actúan como canales de entrada suplementarios, y en otros casos simplemente como entradas para el sistema de monitoreo de la sala de control. Las salidas para grabador (tape out) por lo general repiten las salidas principales, lo cual posibilita registrar en DAT el resultado de una mezcla completa. Cuando se desea grabar en multipista se recurre a los envíos de inserción de los canales, intercalando si es necesario algunos procesadores, como ecualizadores externos, compresores o compuertas. También pueden grabarse las submezclas de los grupos aprovechando las salidas de grupo. Algunas consolas poseen salidas directas post fader de los canales de entrada, que permiten grabar en multipista las señales después de pasar por los filtros, el ecualizador y el fader de canal. Si bien esto da mayor flexibilidad, a veces puede ser más conveniente grabar y reproducir por medio de la conexión de inserción, ya que de ese modo no hace falta un reconexionado, pudiendo enviarse las salidas del grabador multipista a través del retorno de inserción, procediéndose con la mezcla del material grabado exactamente como si fueran las señales originales en vivo.
25.7. Estructura de ganancia En una consola de mezcla existe una cantidad comparativamente grande de amplificadores y atenuadores en el camino de la señal, desde la entrada de línea o de micrófono hasta la mezcla principal. La descripción de las distintas etapas de ganancia se denomina estructura de ganancia de la consola. A pesar de que la misma ganancia final puede obtenerse de varios modos diferentes, razones de orden práctico y consideraciones sobre el rango dinámico y la relación señal a ruido hacen preferible respetar algunas normas de fijación de los diversos ajustes. La estructura de ganancia se representa como un diagrama en el cual se muestran los rangos de ganancia de cada una de las etapas sucesivas (Figura 25.12). En el caso
Consolas de mezcla
269
del ecualizador, aunque por claridad del dibujo las bandas están representadas en sucesión, en realidad la señal correspondiente a cada banda es afectada sólo por la sección ecualizadora respectiva. Si seguimos el recorrido de una señal de entrada, veremos que la ganancia total puede llegar a ser tan alta como 40 dB + 12 dB + 10 dB + 10 dB = 72 dB . Este valor no es conveniente, ya que puede conducir fácilmente a la saturación de una o más etapas de la consola. Por ejemplo, una señal de línea −10 dBu (245 mV), amplificada con esta ganancia implicaría una salida de 62 dBu, es decir ¡975 V! Evidentemente, mucho antes se llega a la saturación y por lo tanto a la distorsión. La razón de la alta ganancia en el ajuste de nivel de entrada (máximo de 40 dB) es para dar mayor flexibilidad en relación con el nivel de entrada, permitiendo manejar señales de nivel intermedio, como la que generan algunos instrumentos electroacústicos. +40 dB
+12 dB
+12 dB
+12 dB
+10 dB
+10 dB 0 dB
0 dB -10 dB Ajuste de nivel
-12 dB
-12 dB
-12 dB
Graves
Medios
Agudos
Ecualizador
-4 dB (centro)
-∞ dB
-∞ dB
-∞ dB
Fader de canal
Paneo
Fader principal
Figura 25.12. Estructura de ganancia para las entradas de línea de la consola de la figura 25.9. Las entradas de micrófono tienen ganancias adicionales por medio del preamplificador de entrada.
La norma general para los ajustes de ganancia es procurar mantener el nivel de la señal cercano a 0 dBu en todos los puntos del circuito. Niveles mucho menores comprometen la relación señal/ruido, ya que los ajustes de ganancia afectan a la señal y al ruido generado antes del ajuste, pero no al ruido generado después (recordemos que, en mayor o menor medida, todos los componentes de un circuito generan ruido). Niveles mucho mayores, por otra parte, son susceptibles de producir saturación, especialmente en la etapas de mezcla (principal, de grupo o auxiliar).
25.8. Margen de sobrecarga (headroom) Un parámetro de gran importancia en la mayoría de los equipos de audio profesional, y muy especialmente en las consolas, es el margen de sobrecarga (headroom).
270
Acústica y Sistemas de Sonido
Se define como el exceso de nivel que puede manejar la salida respecto al nivel medio nominal de la señal antes de llegar a la saturación (recorte). Por ejemplo, si el nivel nominal de señal para determinado equipo es de 4 dBu (1,23 V) y éste puede funcionar sin saturarse con señales de hasta 24 dBu (12,3 V), entonces su margen de sobrecarga MS (en inglés, HR) será MS = 24 dBu − 4 dBu = 20 dB . En las consolas la mayor dificultad aparece en los mezcladores, ya que reciben multitud de señales (provenientes de los canales de entrada, de los grupos y de los retornos auxiliares) que se suman elevando el nivel de la salida. Supongamos, por ejemplo, una consola de 24 canales, con 4 grupos y 6 retornos auxiliares, y que cada uno de ellos vuelca sobre el bus principal una señal cuyo nivel se ha ajustado a su valor nominal de 4 dBu. Eso significa que existen sobre el bus principal 34 señales de valor eficaz 1,23 V. Esto implica que a la salida del sumador habrá 1,23 V debidos a cada una de estas señales. Una característica importante de los niveles es que no se suman directamente, sino que hay que expresarlos primero en términos de potencia. Si la resistencia de carga es, por ejemplo, de 10 KΩ Ω , entonces la potencia entregada por cada señal es 1,23 2 = 0,15 mW . Pot 1 señal = 10000 Entonces la potencia de las 34 fuentes es = 34 × 0,15 mW = 5,1 mW ,
Pot 34 señales
de donde la tensión eficaz equivalente resulta ser (ver sección 7.6) V34 señales
=
10.000 × 0,0051 = 7,15 V ,
que corresponde a un nivel de tensión en dBu de N dBu
= 20 log 10
7,15 0,775
= 19,3 dBu .
En este caso se necesitará, por lo menos, un margen de sobrecarga MS = 19,3 dBu − 4 dBu = 15,3 dB , por lo cual una consola como la anterior (MS = 20 dB) puede utilizarse satisfactoriamente para esta mezcla. Se puede demostrar que cada vez que se duplica la cantidad de señales de una mezcla el nivel de tensión de salida aumenta 3 dB, lo cual implica que en las consolas con gran número de canales se requiere un margen de sobrecarga muy grande. En los casos en que el margen de sobrecarga no alcance para cubrir las necesidades de una mezcla determinada, se hace necesario reducir (mediante el ajuste de nivel)
Consolas de mezcla
271
el nivel de señal de las entradas. Dado que esta reducción afecta sólo a la señal y no al ruido generado por el resto del circuito, se desmejora la relación señal / ruido. Esto es todavía más problemático cuando hay un gran número de canales, ya que el nivel de ruido también aumenta 3 dB cada vez que se duplica el número de canales efectivamente utilizados. Por esta razón es recomendable llevar al mínimo (− −∞) el fader de todo canal que no se esté utilizando. En general conviene que las entradas tengan el máximo nivel que resulte compatible con el margen de sobrecarga disponible. Cuando se utilizan todos los canales, dicho nivel está cerca del nivel nominal. Cuando se utilizan sólo unos pocos canales, es posible trabajar con niveles algo mayores que el nominal, mejorándose así la relación señal/ruido.
25.9. Especificaciones de las consolas Hemos insistido en los capítulos anteriores sobre la necesidad de prestar gran atención a las especificaciones de los diversos componentes de un sistema de sonido. En el caso de las consolas dicha atención debe redoblarse, porque es muy sencillo proporcionar datos falaces, o que se presten a interpretaciones equivocadas sobre la capacidad real de las mismas (lo cual sucede con demasiada frecuencia). Hay algunas especificaciones obvias, como el número de canales de entrada, la cantidad de conexiones auxiliares y de grupos. Inclusive el diagrama de bloques del conexionado interno, que no es en sí una especificación, nos puede informar sobre la aptitud desde el punto de vista de la conectividad de determinado modelo para el tipo de trabajo que se va a realizar con la consola. Otras especificaciones que en principio parecerían similares a las correspondientes a otros equipos (distorsión, ruido, separación de canales) ofrecen, en cambio, algunas dificultades. En estos casos es sumamente importante que la especificación se brinde adjuntando las condiciones bajo las cuales se mide o determina. Hay que tener en cuenta que muchas consolas disponibles comercialmente carecen por completo de esta información, y por lo tanto o bien están proporcionando datos intencionalmente engañosos, o bien las mediciones no se han realizado con un mínimo de seriedad que garantice que los valores sean confiables. 25.9.1. Distorsión La primera especificación es la distorsión. En general se da la distorsión total armónica, THD, y en algunos casos la distorsión por intermodulación, IMD. Los datos mínimos requeridos son los siguientes: 1) La frecuencia de la señal senoidal de prueba. Normalmente es 1 kHz, pero sería deseable también disponer de los valores de distorsión a otras frecuencias, por ejemplo 100 Hz y 10 kHz. 2) El punto donde se inyecta la señal. En general es la entrada de línea de un canal, pero podría ser un retorno auxiliar o una conexión de inserción. 3) La ubicación de los faders. Normalmente en su punto nominal (0 dB), aunque a veces se estipula que se ubican en “posiciones típicas”, lo cual es ambiguo. 4) El nivel de entrada y salida. Debería ser un valor elevado (especialmente a la salida), como 15 ó 20 dBu. En muchos casos se indica la distorsión para una salida de
272
Acústica y Sistemas de Sonido
nivel nominal, por ejemplo 4 dBu. Esto no es demasiado útil, ya que la distorsión es un problema para niveles altos, y no bajos. 5) Si se incluye el ruido en la medición o si se tomaron recaudos para medir solamente (y en forma precisa) los armónicos generados por la distorsión no lineal. Esta información está relacionada con la forma más común de medir la distorsión total armónica, que consiste en filtrar la componente fundamental y medir el resto. El problema es que si la distorsión es muy baja, el ruido puede modificar el resultado, a menos que se utilice un analizador de espectro para medir los armónicos individuales. 25.9.2. Ruido La segunda especificación, de importancia fundamental en una consola, es el ruido. Al igual que en otros equipos, puede especificarse en una multitud de formas: como nivel de tensión del ruido a la salida en dBu, como relación señal/ruido, como nivel referido al nivel nominal, como ruido equivalente a la entrada en dBu o dBm, etc. Dado que una consola tiene diversas salidas, la especificación puede variar según a qué salida se refiera. Las condiciones de medición que es necesario conocer son, como mínimo, las siguientes: 1) Salida sobre la cual se mide el ruido (puede ser una salida principal, de grupo, una salida directa de canal (post fader), un envío auxiliar, un envío de inserción, etc.). 2) Posición de los faders de canal y de la salida que corresponda. Aquí es importante resaltar que el ruido cuando todos los faders de canal están al mínimo es siempre menor que cuando están todos en la posición nominal, o, peor aún en su punto máximo. Por esa razón, hay que cuidarse de las especificaciones que carecen de este dato, así como de aquellas que dan el ruido con todos los faders al mínimo o bien con todos menos uno al mínimo. 3) Posición de los controles del ecualizador (deberían ser las posiciones centrales, ya que en caso contrario podría estar acentuándose el ruido en determinada banda, o bien reduciéndoselo). 4) Banda de frecuencias del filtro utilizado para medir el ruido. Normalmente, debería cubrir el rango de 20 Hz a 20 kHz. 5) En caso en que se suministre la relación señal/ruido, el nivel de señal utilizado (normalmente 4 dBu). 6) Cuando se indique el ruido equivalente de entrada (lo cual es habitual en las entradas de micrófono), la resistencia equivalente de la fuente de señal (típicamente, 150 Ω ). La razón es que las resistencias tienen ruido propio, denominado ruido térmico, y es necesario poder discriminar qué parte del ruido se debe a la resistencia y qué parte al circuito de entrada. Por ejemplo, una resistencia de 150 Ω produce un ruido propio de 0,22 µV, equivalente a un nivel de tensión de −131 dBu. Si el preamplificador a su vez tiene un ruido de igual valor, al conectársele un micrófono de 150 Ω el ruido se incrementará hasta −128 dBu. Vemos que si sólo se especificara el ruido del preamplificador, la especificación sería 3 dB mejor que lo que realmente es posible obtener en la práctica (dado que los micrófonos siempre tienen resistencia). NOTA: Esta discusión deja de lado el ruido acústico y el ruido eléctrico no térmico del micrófono. 25.9.3. Margen de sobrecarga La siguiente especificación es el margen de sobrecarga (headroom). A veces no se lo especifica como tal sino que se da el máximo nivel de tensión de salida (indicán-
Consolas de mezcla
273
dose aparte el nivel nominal de señal). Este dato se proporciona con respecto a las diversas salidas de la consola. Es importante que se detalle la resistencia de carga con la cual se realiza la medición, siendo típicamente de 10 KΩ Ω . En general el mayor margen de sobrecarga lo tienen las salidas principales. Una especificación típica podría ser de 27 dBu de nivel máximo en la salida principal. En este caso, si suponemos un nivel nominal de 4 dBu, el margen de sobrecarga resulta de 23 dB. 25.9.4. Separación de canales Otra especificación de las consolas es la separación de canales (crosstalk) o diafonía, definida como la diferencia de nivel entre las señales de dos canales de salida ante una señal de entrada dirigida enteramente a uno de ellos. En la práctica, se suele determinar aplicando señal a un canal de entrada “cerrado” (es decir cuyo fader está al mínimo) y midiendo la señal a la salida con los otros canales “abiertos” (faders en 0 dB, es decir ganancia 1). De esta manera se asegura que la señal que se “filtra” del canal excitado hacia los otros canales llegue a la salida por múltiples caminos, obteniéndose así el peor caso. Otra posibilidad sería “abrir” uno solo de los canales restantes, en cuyo caso se obtendría un valor más engañosamente promisorio, ya que la señal que se “filtra” tendría sólo una vía hacia la salida. Para que la especificación de separación de canales no resulte ambigua es necesaria la siguiente información complementaria: 1) La frecuencia del tono senoidal aplicado. Normalmente se utiliza 1 kHz, pero dado que la separación de canales depende de la frecuencia, sería interesante también tener información relativa a otras frecuencias. 2) La banda de frecuencia en la cual se hizo la medición. Normalmente, dicha banda es la de 20 Hz a 20 kHz, lo cual no ofrece dificultades cuando la separación de canales no es muy alta. En las consolas con gran separación de canales, el ruido eléctrico puede ser comparable a la señal que se filtra de un canal a otro, y entonces es necesario restringir la medición a una banda angosta alrededor de la frecuencia de excitación. 3) Un detalle de las posiciones de los controles y ajustes involucrados. Por ejemplo, podría ocurrir que la medición se efectúe con todos los faders de canal al mínimo excepto uno físicamente distante del canal excitado. Dado que el pasaje de señal parásita de un canal al otro depende de fenómenos de acoplamiento magnético (efecto transformador) y electrostático (efecto capacitivo), a mayor separación física, menor interacción. Esto significa que el valor medido parecerá mejor que si el canal abierto fuera adyacente al excitado. Cabe señalar que, lamentablemente, existen dos convenciones opuestas para la separación de canales. Una la expresa con un número positivo de dB, por ejemplo 83 dB, y la otra con un número negativo de igual valor absoluto, por ejemplo −83 dB. En el primer caso se está restando el nivel de la señal directa menos el nivel de la señal filtrada, y en el otro, a la inversa. Esta aclaración permite comparar dos consolas de diferentes marcas, aunque una declare una separación de canales de −75 dB y la otra de 81 dB. 25.9.5. Respuesta en frecuencia La respuesta en frecuencia se define del mismo modo que para otros equipos. Dentro de las condiciones de medición es importante indicar: 1) En qué posición se ubican los controles de los ecualizadores. Normalmente, deberían estar planos (0 dB).
274
Acústica y Sistemas de Sonido
2) Si se han intercalado o no los filtros pasaaltos y pasabajos. 3) El nivel de señal para el cual se ha realizado la medición. Esto es importante, ya que para señales de alta frecuencia y alto nivel aparece una distorsión debida a que el amplificador mezclador tiene un límite en cuanto a la velocidad con que puede variar su salida (dicho límite se denomina slew rate). Esto implica que para señales de gran nivel la frecuencia superior de corte se reduce. 4) El tipo de entrada (por ejemplo entrada de línea, entrada de micrófono, retorno auxiliar, etc.) y de salida (envío auxiliar, salida principal, etc.) para los cuales vale el dato suministrado. Sin intercalar los filtros, la respuesta en frecuencia debería cubrir de la manera más plana posible (es decir, con fluctuaciones de ganancia menores de 1 dB) el rango entre 20 Hz y 20 kHz. Muchas consolas extienden la respuesta en alta frecuencia hasta 50 kHz o aun 100 kHz. Una de las razones que se argumentan para ello, es que de esa manera se logra una menor variación de fase en la región más alta del espectro audible, es decir entre 16 kHz y 20 kHz (debido a que cerca de la frecuencia de corte la fase varía considerablemente). Sin embargo, la longitud de onda de un sonido de 16 kHz es de sólo 2 cm, por lo tanto un error de fase tan alto como un cuarto del periodo (como el que se tiene generalmente en la frecuencia de corte) causaría un error de localización de apenas 0,5 cm, ¡mucho menor que los movimientos habituales de la cabeza! Otra razón esgrimida en favor de una respuesta en frecuencia muy amplia es que de esa forma se reproducen mejor los transitorios muy bruscos, como un golpe de la percusión. Sin embargo, el propio oído no es capaz de reaccionar ante dichos transitorios, por lo cual es irrelevante, desde el punto de vista auditivo, si se los reproduce o no con extrema fidelidad. Hay una tercera razón, más atendible que las anteriores, y es que en general las señales que maneja una consola no van a ser escuchadas directamente, sino después de atravesar diversos procesadores, algunos de los cuales podrían utilizar ciertas características de alta frecuencia de la señal que podrían estar ausentes si la respuesta se limita a 20 kHz. La principal desventaja de una respuesta frecuencial excesiva es que podrían agregarse a los buses de mezcla señales espurias o ruidos que a pesar de estar fuera del rango audible, incrementarían innecesariamente el nivel general de la mezcla, consumiendo parte del margen de sobrecarga que podría aprovecharse para obtener una mejor relación señal/ruido. 25.9.6. Impedancias de entrada y salida Es importante conocer las impedancias de entrada y salida porque ellas condicionan fuertemente el tipo de dispositivos que pueden conectarse a la consola. En general las impedancias de entrada de línea están en el orden de 10 kΩ Ω , mientras que las de salida se aproximan a los 100 Ω . Las entradas de micrófono son del orden de 1 kΩ Ω , de manera de no cargar excesivamente al micrófono, pero al mismo tiempo no incrementar el ruido. 25.9.7. Indicadores Se suelen detallar los diversos señalizadores luminosos, como por ejemplo LEDs indicadores de solo y sordina, de sobrecarga (recorte o saturación), de encendido, de conexión de la fuente fantasma, de tipo de envío auxiliar, etc.
Consolas de mezcla
275
25.9.8. Otras especificaciones Las restantes especificaciones son de carácter administrativo, como por ejemplo las dimensiones, peso, tipo de montaje (rack, mesa), condiciones ambientales de operación y almacenamiento (rango de temperatura y humedad), tipo de alimentación y consumo de energía eléctrica, etc. Estos datos no aportan nada nuevo desde el punto de vista funcional, aunque pueden constituir importantes elementos de decisión a la hora de adquirir una consola.
25.10. Conexionado El correcto conexionado y cableado de los equipos de sonido es muy importante, ya que es lo que garantizará que la captación de ruidos por efecto antena resulte lo menor posible. 25.10.1. Blindaje Todo cable se comporta como una antena capaz de emitir y captar ondas electromagnéticas de diversas frecuencias. Si bien las ondas captadas son en general de bajo nivel, hay que tener en cuenta que las señales útiles que transporta un cable pueden tener un nivel tanto o más bajo, por lo cual se hace necesario tomar medidas para reducir lo más posible tanto la energía radiada como la captada. Un recurso relativamente simple para ello es utilizar cables blindados. Dichos cables contienen una funda metálica (blindaje) alrededor del o los conductores que llevan la señal propiamente dicha. La acción del blindaje se basa en dos principios físicos: 1) Dentro de un espacio rodeado por una cubierta metálica (llamada jaula de Faraday en honor a Michael Faraday, físico inglés que descubrió este hecho) no hay campos eléctricos provenientes del exterior. 2) Las corrientes inducidas en un conductor (en este caso el blindaje) tienden a canalizarse predominantemente por los circuitos de menor impedancia a los que esté conectado. Conectando el blindaje a masa, se consigue que toda corriente inducida por ruido vaya a masa. El blindaje puede ser mediante un mallado, que deja ciertos intersticios por los cuales podrían ingresar radiofrecuencias, o por medio de una funda eléctricamente hermética que se logra arrollando una cinta metálica alrededor de los conductores principales. Es importante que el blindaje no sólo esté presente en el cable, sino también en los conectores. Por este motivo son preferibles los conectores con cubierta metálica, que aseguran el blindaje en todo el trayecto de señal. Los conectores XLR poseen siempre ese tipo de cubierta, y esa es una de las razones para su amplia aceptación para conexión de micrófonos. 25.10.2. Conexiones balanceadas Ya habíamos visto en el capítulo 8 el principio sobre el que se basan las conexiones balanceadas. Sintéticamente, dado que no es posible eliminar del todo las tensiones y corrientes de ruido captados por un cable, se reparte la señal en dos mitades, una positiva y la otra negativa respecto al blindaje, y se envía cada una por un conductor. Entonces, al estar los dos conductores físicamente muy próximos, captan casi el mismo
276
Acústica y Sistemas de Sonido
ruido, y dado que la consola tiene un amplificador diferencial a su entrada que resta las señales en los dos conductores, el ruido tiende a cancelarse. Este tipo de conexión se implementa tanto con conectores XLR como TRS, y se utiliza para las señales de micrófono y las de línea. 25.10.3. Panel de conexiones (patch bay) El panel de conexiones (patch bay) de una consola está formado por la totalidad de las entradas y salidas, es decir, entradas de línea y de micrófono, envíos y retornos auxiliares y de inserción, salidas, salidas principales, de grupo y directas, etc. Suele estar en la parte frontal de la consola, antes de los ajustes de nivel de entrada de los canales (Figura 25.2), o bien directamente sobre la parte posterior del gabinete, o bien repartido entre ambas partes. En muchos casos es conveniente o aun necesario suplementar este panel con uno externo, montado en un rack (armazón metálico modular de ancho estándar de 19”, es decir 48,26 cm, sobre el cual se atornillan los diferentes procesadores, efectos, etc.). Al frente de este panel externo hay multitud de tomas identificadas con letreros, que ponen a disposición del operador una copia bien organizada de las conexiones de la consola y de los procesadores que se utilizan más frecuentemente. Esto facilita mucho el conexionado, además de permitir el uso de cables cortos, reduciendo la posible captación de ruidos por efecto antena. Las conexiones permanentes entre el resto de los equipos y el panel de conexiones externo se realizan por la parte posterior del mismo. Hay que destacar que cada operador organiza sus paneles de conexión de acuerdo a su conveniencia y según los equipos que posea. Una distribución pensada cuidadosamente permite ahorrar mucho tiempo y evitar errores. 25.10.4. Puesta a tierra Una cuestión importante en un sistema de sonido es la puesta a tierra. La puesta a tierra cumple básicamente dos objetivos: 1) aumentar las condiciones de seguridad con que se trabaja, y 2) reducir lo más posible las interferencias y los ruidos. Antes de proseguir, es conveniente distinguir tres conceptos diferentes de “tierra” que a veces se confunden. El primero es la tierra física que constituye el suelo. Este material, debido a la humedad y al gran contenido de sales, es un buen conductor de la electricidad, y debido a su gran sección, tiene muy baja resistencia. En las usinas eléctricas, uno de los dos conductores provenientes de los generadores (Figura 25.13), denominado neutro, se conecta efectivamente a tierra por medio de grandes barras o caños metálicos. El otro,
Vivo Neutro
Vivo Neutro Tierra
Figura 25.13. Concepto de tierra en una instalación de distribución de energía eléctrica. A la izquierda, la usina; a la derecha, el usuario.
Consolas de mezcla
277
denominado vivo, se envía directamente a la distribución. El vivo y el neutro llegan a los terminales de los tomacorrientes, donde se enchufan los artefactos. La conexión a tierra consiste en agregar un tercer conductor conectado a tierra por medio de una jabalina, que es normalmente un caño galvanizado enterrado hasta uno o dos metros bajo tierra. Idealmente, no debería haber tensión entre el neutro y la conexión a tierra, pero debido a la resistencia de los cables, existen pequeñas caídas de tensión en el cable de neutro que hacen que entre el neutro y la tierra aparezca una pequeña tensión. El segundo concepto es el de masa, que consiste en un cable conectado al chasis y a las partes metálicas del gabinete y de un artefacto. Como norma general, la masa debe conectarse a tierra, ya que de esa forma se evitan riesgos de shock eléctrico. En efecto, el shock eléctrico se produce cuando por alguna razón existe una fuga del vivo hacia el chasis de un equipo. Al tocar partes metálicas del gabinete, se cierra un circuito entre el vivo y la tierra a través del cuerpo, que actúa como conductor eléctrico (Figura 25.14). Si se conecta la masa a tierra, en caso de haber fugas las corrientes circularán directamente a tierra sin pasar por el cuerpo, debido a que dicha conexión tiene una resistencia mucho menor que el cuerpo. Es importante tener en cuenta que una fuga puede producirse por múltiples razones: acumulación de polvo, humedad, desgaste de la cubierta aislante de un cable, aflojamiento de alguna parte del equipo y consecuente contacto con un punto con tensión, objetos metálicos que penetran a través de las ranuras de ventilación, etc. Aún cuando en un equipo nuevo sea poco probable este tipo de fallas, el uso continuo puede conducir a que se produzcan.
Fuga Línea 220 V
Vivo Neutro
Artefacto Resistencia del cuerpo
Conexión a tierra en la usina
Conexión a tierra a través del calzado
Figura 25.14. Circulación de corriente a través del cuerpo a causa de un artefacto sin conexión a tierra.
El tercer concepto es el de masa circuital o referencia de tensión, es decir un punto del circuito al cual se le asigna convencionalmente un valor de tensión de 0 V, y respecto al cual se miden todas las otras tensiones del circuito. En general, corresponde a las pistas más gruesas de los circuitos impresos, y en el caso de las señales no balanceadas, corresponde al blindaje de los cables correspondientes. En este sentido, se trata de una masa local para la circuitería electrónica, en contraposición con la masa global de un artefacto completo.
278
Acústica y Sistemas de Sonido
No sólo son estas tierras diferentes, sino que también lo son, en general, sus tensiones. En algunos equipos la masa global y la masa circuital están eléctricamente aisladas, pero dado que dichas masas son accesibles exteriormente (a través del terminal de conexión a tierra y del terminal común de los conectores de señal), es posible unirlas externamente. Otros equipos tienen la masa global y la masa circuital unidas internamente. En condiciones ideales, las tres tierras deberían unirse, ya que teóricamente de esa forma se reduce el ruido de modo común captado por el propio blindaje de los cables blindados. Sin embargo, cuando hay varios equipos interconectados, es preciso proceder con cautela para evitar los denominados bucles de tierra. Para comprender este concepto, consideremos el ejemplo de la Figura 25.15. Se trata de dos equipos conectados a través de un cable con blindaje para señal balanceada. Ambos tienen conexión a tierra, y ambos tienen su masa circuital conectada a la masa global (chasis). Resulta que a través del blindaje se cierra un bucle o lazo cerrado con la tierra, como se ve en la Figura 25.15. Dicho bucle se comporta como una antena de cuadro (similar a las de televisión), captando con gran efectividad los ruidos de baja frecuencia provenientes de ondas electromagnéticas presentes en la zona. La razón física para ello es que opera como
Equipo 1
Equipo 2 Blindaje
Masa
Masa circuital
bucle de tierra
Tierra
Figura 25.15. Ejemplo de cómo se crea un bucle de tierra cuando se interconectan dos equipos con conexión a tierra.
una gran espira atravesada por campos magnéticos variables, particularmente de la frecuencia de la línea de alimentación (50 Hz ó 60 Hz) y sus armónicos, induciéndose tensiones y por lo tanto corrientes que a su vez introducen ruido en el circuito de la señal. Hay varias formas de eliminar los bucles de tierra. La idea general es no permitir que las tres tierras se conecten entre sí en más de un punto. En la Figura 25.16 se muestra una primera solución: el blindaje telescópico, que consiste en conectar el blindaje a masa en un solo extremo. Esta conexión sólo es posible cuando la señal es balanceada, por dos razones: 1) no puede interrumpirse el retorno de corriente, y 2) se generarían bucles de tierra en el camino de la señal, lo cual sería muchísimo más grave. Otra solución es la conexión de las masas circuitales en estrella (Figura 25.16). Esta solución, que puede aplicarse con equipos cuya masa circuital está desvinculada de la masa global (chasis), consiste en conectar todas las masas circuitales entre sí, y luego conectar el conjunto así formado a un solo chasis. Finalmente, por razones de seguridad se conectarán todos los chasis a tierra, incluido el que se conecte a las masas circuitales.
Consolas de mezcla
279
Equipo 1
Equipo 2 Blindaje
Masa
Masa circuital Tierra
Figura 25.16. Modificación del conexionado de la figura anterior para eliminar el bucle de tierra. Obsérvese que el blindaje está conectado de un solo lado. Esta conexión utiliza el denominado blindaje telescópico.
Equipo 1
Equipo 2 Blindaje
Masa
Masa circuital Tierra
Figura 25.17. Conexión de las masas en estrella para evitar el bucle de tierra.
25.10.5. Cajas directas Las cajas directas resuelven el problema de la desadaptación de impedancia entre determinados dispositivos y la entrada de micrófono de una consola. El ejemplo típico es el captor (pick up) de una guitarra eléctrica. Normalmente éste proporciona una señal de nivel un poco mayor que un micrófono profesional típico, no balanceada y con una alta impedancia interna, mientras que las entradas de micrófono son balanceadas y de baja impedancia (del orden de 1 kΩ Ω ). Si se conecta directamente el captor a esta entrada, existirán serios problemas de ruido, además de una caída y degradación considerable de la señal. Esto no sucede al intercalar una caja directa. Las cajas directas contienen un transformador de alta calidad que aumenta la impedancia vista del lado de la fuente, reduciendo en menor medida la tensión.
25.11. Conclusión La consola de mezcla es, conceptualmente, un sistema sencillo, ya que se limita a amplificar y sumar señales. Sin embargo, la gran diversidad de posibilidades y la alta
280
Acústica y Sistemas de Sonido
conectividad que exhibe la transforman en un artefacto de considerable complejidad, que obliga a un conocimiento detallado de todas sus características si se desea sacarle el máximo provecho. Por otra parte, dado que todas las señales presentes en un sistema de sonido tarde o temprano pasan por la consola, sus especificaciones influyen de manera determinante sobre el producto final: la mezcla. Por ese motivo, debe prestarse especial atención a estas especificaciones, que en muchos aspectos deben superar a las de otros componentes del sistema. Por ejemplo, si el ruido de un procesador en serie es de −75 dBu, el de una consola de 24 canales debe ser 14 dB menor (es decir −89 dBu) para no degradar la mezcla final más que lo que lo hacen los procesadores (suponiendo que los 24 canales van a ser tratados por procesadores similares). Estas consideraciones muestran por qué es tan difícil proyectar una consola de gran cantidad de canales compatible con las exigencias actuales en cuanto a ruido y distorsión, y también por qué es frecuente encontrar especificaciones de consolas sumamente incompletas que, intencionalmente o no, pasan por alto deficiencias insalvables a la hora de realizar trabajos de mezcla de gran complejidad. Finalmente, tanto para sonido en vivo (refuerzo sonoro) como en estudio (grabación, transmisión de radio o televisión), debe cuidarse la interconexión de todos los componentes del sistema, ya que es demasiado sencillo cometer errores que degraden considerablemente el rendimiento global del sistema.
ab