Uno de los principales problemas con los que se encuentran quienes comienzan a experimentar con grabaciones de audio caseras, tiene un nombre muy concreto: latencia. Para muchos de los que se topan con este obstáculo, a veces puede antojarse completamente insalvable, siendo una de las principales causas de frustración entre los recién llegados al home recording. Por la sencilla razón de que, a pesar de tener una noción más o menos clara de cómo y por qué ocurre esa latencia, en realidad uno no acaba de comprender de qué es fruto y cuál sería la forma adecuada de evitarla.
 
Imaginemos un escenario cada vez más habitual: Javi, guitarrista aficionado desde hace años, militante en una banda de versiones y esa otra formación de temas originales que está comenzando a pensar seriamente en grabar un EP, siempre ha tenido interés por el audio profesional. Él es quien intenta poner sentido a la pequeña PA con la que ensayan, y el que lleva un tiempo trasteando con un DAW y animando al resto de compañeros a grabar “en condiciones”. Empezando por recoger demos de forma un poco más profesional que la grabadora Tascam que colocan en un rincón de la sala, sin tener ninguno demasiada idea, y que graba estupendamente, pero suena todo a garaje guarro, guarro.
 
Para ello, Javi se ha liado la manta a la cabeza y se ha hecho con una interfaz de audio con previos integrados para poder grabar en casa. Algo sencillo, que le permite grabar un par de instrumentos a la vez, una batería básica con el portátil en el mismo local de ensayo, etc. Ni corto ni perezoso, más bien completamente emocionado, comienza las primeras grabaciones en casa. No tiene problemas con su guitarra, que graba poniendo un micro al ampli sin preocuparse mucho por la monitorización. ¿Suerte de principiante? Puede ser, porque cuando intenta grabar una voz, escuchándose por cascos (para que el audio de los altavoces no se cuele por el micro en el que está grabando, regla básica anti-feedback si no tienes sala de grabación aislada), la tarea resulta imposible: lo que escucha por cascos es su voz, sí, pero con retardo que hace imposible cantar sin volverse loco. ¿Te resulta familiar?
 
Todo tiene latencia
Lo cierto es que ese es solo un tipo de latencia. Bajo ese nombre designamos sencillamente a un retardo entre el recorrido que hace una señal y el momento en que la escuchamos. Latencia es también el tiempo que tarda el sonido en llegar a nuestro oído desde que pulsamos una tecla del piano, ésta mueve el martillo, el martillo golpea la cuerda, y el sonido se genera y viaja. También lo es el delay con el que la voz de un cantante, reflejada en las paredes de una habitación, llega a nuestros oídos con respecto al sonido directo (lo que, en esencia, entenderemos como reverb).
 
La cuestión es que nuestro cerebro está acostumbrado a este tipo de retardos. Entre 3 y 10 ms de retardo  pasan, sencillamente, prácticamente desapercibidos. Hasta los 20 o 30 ms, más o menos, no empezaremos a considerar que son dos señales distintas, aunque con delays menores ya empezamos a percibir que algo raro está pasando.
 
Cuando la latencia sí es un problema
En el caso de nuestro ejemplo digital, el problema radica precisamente en que ese retardo es notablemente superior a unos pocos milisegundos, debido al proceso de conversión analógico-digital y digital-analógico. Imagina que cuando tocas la guitarra, al pulsar una cuerda, nuestras pastillas necesitaran un momento para procesar la vibración en señal eléctrica, de forma que el sonido tardara tres o cuatro veces más de lo normal en salir del amplificador. Resulta evidente que nuestra sensación tocando sería completamente diferente, y aunque uno pudiera adaptarse al retardo, el feeling y la ejecución se resentirían. Para hacer la prueba, usa algún pedal de delay que tengas con control dry/wet o con salida directa (como el clásico DD3): configura su salida como 100% wet (solo efecto) o conecta un jack al output y al direct output (DD3), para que el pedal divida el sonido en señal sin efecto y solo efecto, y conecta solo ésta última a tu ampli. Divertido, ¿verdad?
 
O también puedes hacer como Javi: envía una señal a tu DAW a través de un interfaz, y monitoriza la señal que sale del ordenador – por cascos, por ejemplo -, y te encontrarás con ese retardo que es el que más habitualmente llamamos latencia (roundtrip latency, en inglés). El problema aquí radica en que, al enviar sonido a tu DAW, tu interfaz tiene que convertir la señal analógica (electricidad) en una digital (unos y ceros), que es la que entra en el DAW, donde se procesa más o menos para después volver a convertirse de digital a analógica de forma que la reciban tus monitores de estudio y llegue a tus oídos como ondas sonora.
 
Esta ida y vuelta (de ahí lo de “roundtrip”, en inglés) con sus respectivas conversiones es lo que genera esa latencia de suficientes milisegundos como para que nuestro cerebro lo capte a la perfección y nos vuelva completamente locos cuando intentamos grabar algo sufriéndola. Sin embargo, los más enterados nos dirán: ¿y qué me dices del buffer? Y llegamos así a una de las palabras mágicas de la latencia...
 
A vueltas con el buffer
Si tienes más o menos controlado tu DAW, sabrás que una de las opciones que puedes configurar es el tamaño del buffer. Pero, ¿qué es el buffer? Se trata, de forma resumida, en un área de memoria usada para almacenar temporalmente información necesaria para un proceso determinado. Este tamaño de buffer indica el tiempo, en samples, que el DAW empleará en su input y su output para realizar los procesos necesarios. Para convertirlo a milisegundos, basta con dividir el número de samples entre la frecuencia de muestreo, de forma que 1024 samples a una frecuencia de 44.1 kHz nos daría una latencia de 23,22 ms. Esto es, 23 ms en la entrada, y 23 ms en la salida, para un total de nada menos que 46 ms. ¡Toma latencia!
 
Habrás comprobado ya, seguramente, que cuando eliges un tamaño de buffer grandecito es cuando tu DAW te permite trabajar con plugins más holgadamente. Y que si lo reduces y sobrecargas tu sesión, más tarde o más temprano aparece es fatídico mensajito avisando de que tu CPU no da para más. Sin embargo, con tamaños grandes de buffer, la latencia hace una grabación casi imposible. Primera herramienta para combatir la latencia, pues: reducir el tamaño de buffer.  Ten en cuenta, por ejemplo, que 64 samples equivaldrían a 1,45 ms, lo que resultaría en menos de 3 ms en total, alto totalmente imperceptible por el oído...
 
Ah, pero, ¿por qué, a veces, dependiendo de nuestro equipo, incluso con un buffer pequeño seguimos obteniendo una latencia intolerable? El problema radica en que el buffer del DAW no es el único en entrar en juego. Existe también el buffer del USB (o Firewire) al que conectas tu interfaz. Sobre éste no tenemos ningún control, y los fabricantes suelen curarse en salud y darle bastante holgura, para que sea realmente difícil saturarlo. Unos 6 ms de entrada y de salida es una cifra bastante estándar hablando de USB. Con lo que, por lo general, tenemos otros 12 ms que sumar a lo que reclame como propio nuestro DAW. Añade, además, el buffer propio del interfaz o conversor para la conversión A/D D/A (que dependerá de la calidad del aparato), y la suma en milisegundos probablemente esté disparándose más allá de esos poquitos que un buffer de 64 o 32 samples prometía.
 
¿Qué hacer?
La solución a la latencia no es necesariamente sencilla. Lo primero es, como decíamos antes, reducir ese buffer siempre que puedas. Esto es, configura tu sesión para que pueda ser lo menor posible, porque ten en cuenta que cuanto más procesos necesites (número de pistas, de plugins, ¿estás usando un modelador de amplis?), más alto deberá ser antes de “ahogarse”.
 
La mejor opción, no obstante, es encontrar una forma de monitorización que no pase por el DAW. Es decir, usar los auxiliares de una mesa de mezclas para enviar al cantante su voz antes de que entre al ordenador, o emplear el control que tienen muchos interfaces de sobremesa para elegir qué porcentaje de lo que escuchamos en cascos es pre-conversión y cuánto viene de la computadora. Muchos interfaces, no obstante, incluyen hoy en día procesadores DSP exclusivos para conseguir monitorizaciones de baja latencia, con un panel de control propio tipo mezcladora. Y éstos es una buena solución cuando necesitamos forzosamente monitorizar durante la grabación una señal con algún proceso añadido (una voz con su reverb, por ejemplo).