Audio en red: distribución a tiempo real de la señal de audio digital a través de redes Ethernet. En la actualidad, el audio en red es una asignatura obligatoria en el campo del sonido directo y queremos acercarte este sistema esencial de distribución de audio digital.
Para ello entrevistamos a uno de nuestros profes más polivalentes en el Máster en Sonido Directo y reputado técnico con dilatada experiencia en diferentes campos del sonido.
Hoy hablamos «largo y tendido» acerca del audio en red con Suso Ramallo.
Trade: buenos días Suso. Brevemente y para arrancar, cuéntanos qué contenidos académicos estás impartiendo en el Máster en Sonido Directo?
Suso Ramallo: buenos días. Generalmente suelo dar potencia y electrónica, depende del año, de las fechas… y durante las últimas promociones también imparto redes de audio digital.
También doy clases de Smaart Live, el programa de análisis, y soy el chico para todo, si falla un profesor por agenda y tengo disponibilidad tomo el testigo (risas).
Qué es el audio en red
Trade: vamos ya al tema que nos ocupa hoy. ¿Cómo podrías explicar qué es el audio en red a una persona que no tenga grandes conocimientos técnicos en el campo del sonido?
Suso Ramallo: el audio en red es simplemente la consecuencia lógica del audio digital. El audio digital no son nada más que datos; y los datos son datos. Si podemos enviar vídeos de gatitos por Internet, que son datos, también podemos enviar audio.
Dependiendo del ancho de banda disponible para enviar datos podemos enviar más o menos canales. Pero claro, eso es pensar desde el punto de vista puramente digital o puramente informático.
Un poco de historia acerca del audio en red
Trade: pongámonos en contexto, ¿cómo empieza esto del audio en red?
Suso Ramallo: en realidad todo empezó con la primera transmisión digital en el 86, con el primer estándar AES3, en multicanal, llamado AES/EBU. Era multicanal porque se mandaban dos canales en un solo cable.
En el 91 ya se avanzó con algo parecido al AES/EBU que era el protocolo MADI y entonces fue el primer estándar que podía enviar 56 canales.
Eran protocolos basados en un flujo de datos dividido en cuadros, en frames, donde mandabas un flujo de datos que iba dividido con una cabecera y que lo que mandabas era igual que el AES/EBU. Un flujo continuo de paquetes de datos de audio. Eso avanzó al mismo tiempo que avanzaba la informática y las redes.
Estamos hablando del año 91 y las redes que se utilizaban eran de velocidad de 10 Mbit, que era bastante lento, iban sobre cable coaxial, se montaban en anillo… era otra época. Había otros protocolos, como el IP, que no se utilizaban.
Por ejemplo, yo empecé administrando redes hace muchos años y eran bajo Novell que era lo que tenían las empresas en la época y era otro mundo, era un poco rudimentario.
Con el advenimiento de Internet en el año 96 empezó a extenderse mucho el IP (Internet Protocol) más el TCP (Transmission Control Protocol). Y digamos que las primeras redes dijeron ¿por qué no utilizamos estos sistemas?
Por esa época, a finales de los 90, la gente de CobraNet sacó su protocolo que estaba basado en MAC address (Media Access Control Address) lo que llamamos un layer 2 capa 2, porque en las capas de protocolo sobre Ethernet y todo esto podemos hablar de 1, 2 3 y 4.
El 1 sería simplemente la conexión física de cables y los transpondedores. La 2 utilizaría las direcciones individuales de cada elemento pero no es un protocolo con el que podamos hacer muchas cosas. Y ya cuando pasaron a la capa 3, en realidad dices, bueno, si nosotros mandamos vídeos de gatitos, vamos a enviar audio.
Como tenemos redes de 100 Mbit ahora –hablamos del 2.005– si los divido puedo enviar 48, 56, 64 canales.
Porque, por ejemplo, 64 canales ocupan 74 Mbit, con lo cual aún nos quedarían 26 Mbit para control, para el vídeo de gatitos, para lo que nosotros queramos, ¿de acuerdo? Entonces ahí se pegó el salto al sistema en paquetes que serían las capas 3 y 4. En la capa 3 tendríamos direcciones IP.
La dirección IP, para que te hagas una idea mejor utilizo un símil: layer 1 sería como si tengo una calle, cojo un balón, lo suelto en la calle y va al otro lado de la calle. Layer 2 sería que además reconoce las puertas. Le digo «vete al número 2». Y layer 3, basada en IPs, sería «vete a la puerta 2, al piso 3º izquierda». Y también le podemos indicar en el 3º izquierda con la IP en qué puerto nos va a entrar la comunicación.
Entonces, en el 2.005-2.006 empezó Dante, los primeros de ellos, que ya eran capa 3 y hoy en día, digamos, que casi todos los protocolos de comunicación de audio en red que hay son capa 3 salvo algunos muy especializados. Los grandes contendientes hoy en día podríamos decir que son Dante, que es un protocolo propietario, y Ravenna, que es otro.
Curiosamente Ravenna intentó nacer como la némesis del Dante. De hecho Rávena es la ciudad italiana en la que murió Dante. Y ahora mismo están «resucitando» algunas otras compañías, supongo que para no pagar royalties, como AVB, por ejemplo, que es un protocolo de audio y vídeo de transmisión de datos.
Pero digamos, esos protocolos capa 3 y 4 son los más extendidos por la facilidad que hay para distribuir el audio.
Hemos pasado de «conecto este micro a este canal de la mesa» a «conecto este micro a este cajetín» y después yo lo distribuyo como quiero, porque capa 3, con un simple switch de Ethernet convencional, «spliteo» en tantas bocas como tenga el switch toda la información.
¿Por qué? Porque no dejan de ser datos como cualquier otro, como cuando te envío un correo electrónico pero con mayor cantidad. Entonces, todo lo que puedes hacer, como enviar un correo electrónico, pues también lo puedes hacer de la misma manera con el audio.
Evolución del audio en red en el campo del sonido directo
Trade: en sonido directo, ¿cómo se utiliza el audio en red y para qué? ¿cuál es el flujo que sigue y cuándo pasa el audio a ser audio en red?
Suso Ramallo: hoy en día estamos en un cambio radical en ese aspecto.
Empezamos en la centuria, el siglo XXI, con mesas digitales que ya estaban desplazando a las analógicas y que iban conexionadas como mesas analógicas, con mangueras convencionales, cables 1 a 1 y cajetines en el escenario.
¿Qué ocurrió? Que claro, evidentemente en esa época los fabricantes dijeron «si mandamos datos, ¿por qué vamos a seguir usando este tipo de cables?».
Entonces, en 2.004–2.005, estaba CobraNet pero era un protocolo con demasiada latencia, demasiado retardo, que para aplicaciones en tiempo real no es gran cosa, pero unos franceses empezaron con el EtherSound.
Yo, en el 2.005 ya empecé a usar EtherSound con una mesa digital, que me parecía magia porque era muy novedoso y me decía «j*der, esto de que mandes todos los canales por un solo cable…».
Yo lo veía en modo audio, toda mi vida 48 pares o lo que sea, enviando 1 a 1. Y ahora enviar todo en unos paquetes por un solo cable me parecía magia, hasta que lo vi como datos.
Y claro, yo tengo formación informática, con lo cual me di cuenta que lo estaba viendo mal. Son datos, son solo datos. Lo único que son muchos y lo que intentamos hacer es que sean en tiempo más o menos real.
Porque evidentemente cualquier transmisión va a tener un retardo. No existe latencia cero en digital. Pero que sea un mínimo retardo que no influya para aplicaciones en tiempo real, como un concierto.
Entonces, en el 2.005 empezaron las mesas a tener esa posibilidad. Yamaha por ejemplo sacaba tarjetas para sus M5, M7… para poder aceptar ese protocolo primero con EtherSound, y después empezó con Dante.
De repente empezaron a salir soluciones. Al principio había grandes cajetines, después empezaron a aparecer pequeños cajetines, con lo cual, ¿qué es lo que está ocurriendo hoy en día con la convergencia?
Que empiezas a tener no solamente un cajetín que digitaliza la señal y te la envía por Ethernet, empiezas a tener una red completa con grandes cajetines, pequeños cajetines… antes donde tirabas un cajetín en el escenario para conectar la batería ahora puedes tirar un pequeño cajetín de 16 y lo tiras con un solo cable de Ethernet.
Evidentemente los cables son infinitamente más baratos e infinitamente menos pesados y engorrosos. Con lo cual eso ya de entrada, a nivel de las empresas, provoca una disfunción.
Cuando hay un elemento que es 10 veces más barato que el anterior, ya no hay vuelta de hoja, cambia la manera de trabajar radicalmente.
Flujo de señal de audio digital en un concierto
Trade: en un concierto, ¿el audio se convierte a digital en el propio escenario?
Suso Ramallo: sí, la idea ahora mismo es convertirlo a digital al lado del micro, tener pequeños cables de 5 metros o algo así y pasarlo a digital.
Los cables van a los conversores, que es lo que yo llamaba anteriormente cajetines. Los cajetines digitales tienen entradas analógicas y eso lo pasan a un protocolo de red.
Un cajetín es un conversor A/D con posibilidades de control.
Yo desde la mesa puedo darle más o menos ganancia o ponerle un filtro paso alto. De hecho, hoy en día el AES (Audio Engineering Society) está haciendo propuestas como el AES70, que es una propuesta de un protocolo universal de control.
Supongo que muchos fabricantes preferirían vender mesas con sus cajetines pero el AES ya ha sacado esto.
De la misma manera que el AES67 es un protocolo de comunicación de envío de datos de audio donde se están adhiriendo diferentes fabricantes. Por ejemplo, Dante es compatible con AES67. De momento solo 8 canales a 48 KHz.
Ravenna es completamente compatible con AES67 y todos los nuevos contendientes están haciéndose compatibles con ese estándar para que puedan entenderse entre ellos sin necesidad de nada más, simplemente con el propio hardware que ya tienen, porque la única diferencia que hay entre ellos es cómo va estructurado el paquete que me viene.
Por ejemplo en Dante, su sistema de datos es el estándar de Ethernet convencional, su reloj es el que utilizan todas las redes normales, su sistema de paquetes es el que utilizan todas las redes normales, todo es normal.
Cuando te llegue un paquete de, por ejemplo, Ravenna, pues lo vas a ver así. A diferencia de otros antiguos donde tendrías que hacer una conversión de formato y te hacen falta una maquinaria especial para convertir MADI a AES50.
Entre esos dos, aunque sean también protocolos que van por tramas, son distintos, entonces tienes que reconvertirlos, incluso trabajan a diferentes frecuencias de muestreo con lo cual los conversores tienen que tener hasta conversores de frecuencia de muestreo dentro del propio conversor. Y si son 64 canales pues 64 conversores.
Pero claro, estamos llegando ahora mismo a eso. Yo pongo un cajetín al lado de la fuente, quiero un cable corto y después lo paso como datos.
Todo llega con una conexión tipo estrella a un switch y en el switch es donde reparto. Y en el ordenador es donde digo «pues del cajetín donde está la batería voy a coger los 8 primeros, del otro voy a coger los 8 de allí…», con lo cual todo lo que antes era un patcheo físico, conecto aquí y conecto allá, ahora es completamente lógico. Lo hago de manera lógica con un ordenador.
Trade: de un cajetín cerca de la fuente vamos al switch, y desde el switch ¿a dónde enviamos?
Suso Ramallo: puedo repartir a la mesa de monitores, a mesa de P.A., si hay una mesa que va a grabar el concierto envío también a esa mesa…
Hoy en día estamos encontrando que las etapas de potencia tienen ya entradas Dante, con lo cual ni mandan el cable analógico; salgo del switch con un cable hacia la etapa de potencia y le digo «estos canales son los que vas a alimentar».
Etapas de potencia o cajas activas que tienen amplificadores, tienen una red entre ellos y aparecen como elementos de una red.
Trade: cuando sale de la mesa y va al ampli, ¿la señal de audio sale en digital y es en el amplificador donde se convierte?
Suso Ramallo: sí, digamos que la conversión es al final, en el propio driver del amplificador, ya que convierte de digital a analógico para que vaya a donde tenga que ir.
Y eso puede ocurrir tanto con amplificadores con sistemas de cajas pasivas, amplificadores y procesadores de altavoz o ya en cajas activas que directamente el audio entre ellas y lo voy mandando por una red.
Entonces cada caja es un elemento de la red, con las posibilidades que tienes con esto. Puedo acceder a cada caja y cambiar su configuración desde la mesa o desde un ordenador. Hoy en día lo que ha ocurrido es que ha convergido el sonido con la informática.
De hecho, una mesa digital es un ordenador con una serie de controles a medida para el audio. Tienes encoders, que los mueves y los bajas, que le dicen al programa pues haz esto o haz lo otro… pero son ordenadores. Los conectamos como ordenadores en la red y de la misma manera también tenemos ordenadores para hacer todos los procesos.
Hoy en día un técnico de sonido tiene que tener un cierto conocimiento de administración de redes.
Ventajas del audio en red
Trade: podrías resumir las ventajas del audio en red, entiendo que tenemos una reducción de costes…
Suso Ramallo: sí, una manguera analógica convencional de 60 metros de 48 pares, si es de calidad (un cable por ejemplo Mogami), con cajetines… estamos hablando de entre €2.500 y €3.000 y 80 Kg de peso. Y ahora estamos hablando de que eso mismo lo enviamos por una bobina con un cable RJ-45 de €2 el metro.
Trade: tenemos entonces ahorro de costes, también ahorro de trabajo y esfuerzo, del peso…
Suso Ramallo: claro, porque recogerlo, llevarlo y almacenarlo no tiene nada que ver.
Porque cualquier cable preparado para directo de categoría 5e ó 6e es en realidad como un cable de micro de anchura. Es decir, recoger un cable de micro no es lo mismo que recoger una manguera de 25 mm de anchura y un peso importante.
A la hora de trabajar la facilidad es infinita. El mantenimiento es muchísimo mejor porque tú puedes tener un sistema redundante por un costo ínfimo.
Una manguera de 100 m de categoría 5e, podemos estar hablando de €200 euros o menos y si es redundante me gasto otro tanto. Es decir, tengo un sistema redundante y si se me estropea el cable, la pérdida de dinero va a ser muy pequeña. Los conectores son ultra baratos.
Ahora hay soluciones profesionales como conectores enfundados de Neutrik que ha sacado EtherCom. Esto está cambiando todo porque ha bajado el coste y sobre todo la seguridad de conexión.
Dices, bueno, es que solo lo conecto con un conector y puede fallar y se va todo al traste y en el otro me puede fallar solo un par o dos.
Pues sí, pero tú haces un sistema redundante en nada, que es poner doble cable y normalmente los sistemas redundantes son dos redes. Hacemos una red con doble switch, una primaria y una secundaria.
Si falla una, están las dos mandando audio continuamente y entra la otra a producir. Siempre tienes la seguridad de que si falla un cable tienes otro.
Y si tienes problemas tiras otro cable. Yo siempre llevo varios carretes y normalmente cuando montamos festivales tiramos un montón de ellos. Ya tiramos incluso mangueras donde tienes 6 categorías dentro de la propia manguera.
Ahora mismo todas las mesas de mezclas vienen así. Puede ser de un protocolo o puede ser de otro, pero los cables que se van a utilizar son básicamente los mismos.
Aprender audio digital en red
Trade: al hilo de lo que decías, ¿qué conocimientos necesitas para saber de audio en red?
Para un estudiante que está empezando y quiere aprender más de audio en red, ¿qué le sugerirías? ¿en qué áreas debe poner foco para desenvolverse con soltura a la hora de trabajar con audio en red?
Suso Ramallo: hoy en día hay mucha suerte porque, mal que bien, la mayoría de los chavales del 2.019 están en contacto directo con la informática continuamente.
Yo cuando era chaval, la informática la veíamos de refilón porque los ordenadores costaban como coches y nadie tenía pero ahora mismo todo el mundo está en contacto, desde su teléfono móvil hasta su ordenador de casa.
Evidentemente, también estamos en un momento en el que mucha gente tiene ordenadores pero no sabe lo que pasa dentro de ellos. Pero sí tenemos mucha gente que sí sabe.
Lo que tiene que saber el estudiante es cómo funciona una red. Tener unos conocimientos básicos de redes para saber cómo puede resolver los problemas que surjan.
Porque si tú vienes de la «escuela antigua» de conecto esto y lo envío para allí, cuando tienes un patcheo lógico te revienta la cabeza. Cuando tú vas micro 1 a entrada 1, y va cada uno con su cable, eso lo entiende el «old school» y es un patcheo físico que ves.
En el patcheo lógico que tenemos ahora yo tengo matrices y puedo coger y enviar de aquí a aquí pero lo hago de manera lógica con un ordenador. Al mismo tiempo, cuando conecto la red, tengo que tener un cierto conocimiento de, por ejemplo, todos los protocolos en IP, de paquetes TCP y de paquetes UDP (User Datagram Protocol).
De hecho normalmente utilizamos el UDP más que el TCP, porque el primero no necesita estar diciéndole al sistema que envía «he llegado», a diferencia del TCP que es un poco más lento y tienes bastante más tráfico en la red.
Pero se utilizan los dos. Unos normalmente para control y otros para enviar datos. El asunto es que tienes que saber un poco de eso. Tienes que saber comandos básicos, hacer un ping…
Porque, ¿qué le pasa a la mayoría de técnicos? Oye, no me funciona esto… Y dices, bueno, pero no te funciona ¿por qué motivo? Bueno, es que no sé, es que no está… vamos a ver si está conectado. Probablemente esté conectado, pero probablemente no está configurado.
El ping es para enviar un paquete y que te lo devuelva. No es la conexión la que te configura el sistema.
Tú lo puedes conectar todo pero si estás en distintas redes no te ves. Entonces tienes que saber comandos y decir ¿está conectado? Hago un ping, si me rebota el paquete sé que está conectado pero a lo mejor no está configurado.
Conectar no significa configurar. Conectar simplemente es conectar físicamente. Otra cosa es configurar una red.
Esto le cuesta mucho sobre todo a la gente que viene de antes porque el concepto configurar y conectar pensaban que era lo mismo y ya no es lo mismo.
Ocurre que yo tiro los cables pero si tengo distintos equipos y alguien los ha configurado de otra manera tengo que reconfigurarlos para que se vean entre sí y funcione.
De hecho, la mayoría de los fabricantes se basan en que si no tienes la menor idea lo mejor es que no hagas nada y lo dejes todo por defecto, que no le pongas IPs ni nada porque el sistema, con los modos automáticos que hay en ordenadores y demás, se va a un nexo común donde todos se van a ver. Aunque no sea la manera idónea pero va a ser la manera de que le funcione a alguien que no tenga ni la menor idea.
¿Qué es lo que ocurre? Una cosa es que no tengo ni idea y lo tengo todo por defecto y por casualidad se va a conectar todo. Pero si empiezo a saber, ya puedo administrar redes y entonces dar prioridades a determinadas cosas, a otras no y hacerme un sistema que no va a diferir absolutamente nada de lo que harías por ejemplo en un sistema de servidor de una empresa, con muchos ordenadores.
Piensa que cada mesa, cada cajetín, cada etapa de potencia… es un ordenador. Y vas a meter todo en tu red.
Trade: entonces si quieres trabajar con audio en red, más allá de saber de sonido, tienes que saber de informática, de redes, configuración y administración de redes…
Suso Ramallo: en el 2.019, si no sabes de informática y de audio digital, no vales para técnico de sonido directamente.
Formatos de audio en red
Trade: en el audio digital en red ¿podemos hablar de formatos o solamente de protocolos de comunicación?
Suso Ramallo: hay formatos. Básicamente, en realidad ahora mismo los formatos que hay son todos PCM (Pulse Code Modulation). Es un sistema que viene desde el CD, que es el sistema más antiguo.
Hubo intentos de utilizar otro sistema, basado en el bitstream, que es el DSD (Direct Stream Digital), lo que pasa es que el DSD se quedó en el intento.
Es otra forma de codificación digital distinta al PCM, un poco basada en él, pero se quedó en el intento porque intentó lanzarse de manera comercial en base a los Super Audio CDs, pero no tuvo ninguna repercusión comercial.
De hecho, hoy en día el formato físico es algo que ha pasado casi a mejor vida.
Entonces, en los servicios de streaming que hay no hay ninguno que sirva DSD. Todos, o sirven sistemas con compresión con pérdidas, tipo Spotify, o hay sistemas que pueden servir PCM directamente sin ningún tipo de pérdida de comprensión; pero ya servicios DSD no hay.
Hay descargas digitales en DSD para público audiófilo porque creen que suena mejor. Técnicamente el formato no es mejor, es incluso peor, tiene más ruido en alta frecuencia que el PCM y para poder editarlo normalmente lo tienes que pasar a PCM, con lo cual todo se queda en PCM.
En PCM lo que ocurre es que para enviar por un cable Ethernet de 100 Mbit o de Gbit no hay mucho problema porque en Gbit por ejemplo el Dante envía 512 canales bidireccionales. En los de 100 envía 64 canales sin despeinarse.
Pero por ejemplo ahora mismo también estamos en la transición de que la propia radiofrecuencia, la emisión de las radios, los radiomicrófonos, sistemas de escucha, también están pasándose a digital. Y ahí, con el ancho que tenemos de excursión de portadora, sí tenemos que utilizar comprensión de datos.
Entonces tenemos que pasarlo a un MPEG–3 (Moving Picture Experts Group), por ejemplo, y después volver a pasarlo a PCM. Pero es lo único. En los demás sistemas, como van con cable y tienen mucho ancho de banda, todos son PCM.
Lo normal es que los sistemas Dante en mesas Yamaha funcionen a 24 bit / 48 KHz de frecuencia de muestreo.
Los sistemas Midas en sus mesas Pro trabajan a 24 bit / 96 KHz de frecuencia de muestreo.
Y así andan todas las nuevas series de Yamaha profesionales. La PM7 y la PM10 se han subido ya a 96 KHz también. DiGiCo que trabaja con varios protocolos, entre ellos el MADI, trabajará a 96 bit / 48 KHz, pero es todo PCM.
Protocolos para audio en red
Trade: ¿cuáles son los principales protocolos de audio en red en la actualidad?
Suso Ramallo: hoy en día los principales son el MADI, que es un sistema muy sencillo que no paga royalties y por eso lo utiliza mucha gente.
MADI es un sistema antiguo del año 91; se revisó porque pasó de 56 a 64 canales pero digamos que es un sistema que es anticuado. Salió una mejora que va sobre Ethernet, que podemos decir que es layer 1 capa 1, que sería la E50, que no difiere mucho del original. Es igual, es un protocolo layer 1, punto a punto, que va sobre tramas pero fue una mejora utilizando cableado de Ethernet y tal, en el 2.005; también es un layer 1 que tiene sus limitaciones.
MADI tiene la gran ventaja de que la latencia es bajísima y siempre es la misma.
Tiene la misma latencia que cualquier AES/EBU, que lo conecto y tiene una latencia despreciable. Pero es muy inflexible porque como es punto a punto, siempre tengo que llegar a una mesa de mezclas para poder llevar la señal a otro lado. Entonces ahí es donde nacieron los 2 y los 3 que son mucho más sencillos.
Todo está convergiendo hacia 2 y 3, pero sobre todo hacia 3, porque los 2 también han quedado un poco relegados.
Lo principal que hay ahora es Dante, por ejemplo. Es un protocolo que se basa en cable de Ethernet, categoría 5e, 6 o superiores, ya que son retrocompatibles, y que podemos mandar en uno de 100 Mbit, 64 canales y en uno de Gbit podemos mandar 512 canales bidireccionales.
Dante es uno de los protocolos principales porque la ventaja que tiene es que lo han puesto muy fácil para los fabricantes.
Y a pesar de que sea propietario y tengas que pagar por él, lo pusieron muy fácil con lo cual tuvo gran adhesión por parte de muchos fabricantes porque rápidamente tenían los sistemas fabricados en Dante.
Y al mismo tiempo es un sistema que es bastante robusto. No da muchos fallos. Hay millones ya montados por todo el mundo y son redes que funcionan bien.
La mayor parte de los fallos que he visto yo en Dante siempre han sido problemas de los usuarios que no saben de redes. Cuando voy a un festival y hay un problema con el Dante, conecto el ordenador y lo arreglo desde el ordenador. Porque son problemas de configuración.
El otro sería Ravenna. Ravenna, por ejemplo, tiene mucho despliegue sobre todo en el broadcast. Tiene un problema y es que tiene mayor latencia que Dante y eso es un problema para monitoraje en tiempo real, porque notas la latencia cuando tocas.
Pero por ejemplo todo el broadcast está básicamente metido en Ravenna. Las mesas de broadcast importantes trabajan todas con Ravenna.
Trade: ¿qué ventaja ofrece Ravenna al broadcast?
Suso Ramallo: es un sistema muy escalable y no es tan propietario como Dante. Dante pertenece a una empresa.
Trade: ¿y Ravenna es abierto como el MADI?
Suso Ramallo: Ravenna no es abierto del todo pero prácticamente es abierto. Hay un consorcio muy grande de fabricantes que lo desarrollaron.
Entonces es muy escalable pero básicamente es casi lo mismo. El reloj lo cogen del mismo lado, la forma de los paquetes… todo igual.
Últimamente tendríamos el AVB, que era un protocolo de transmisión de vídeo y audio, lo están utilizando ciertos fabricantes, por ejemplo Avid y MOTU, como su estándar.
Yo entiendo que es una cuestión de royalties sobre todo, por no pasar por la caja de Audinate, que son los propietarios de Dante.
Y después hay un protocolo, que es layer 1, que lo llamo yo «el chino de los protocolos digitales», que es el AES50.
El AES50 solo lo utiliza el grupo Music Group, que es Behringer, Midas y Klark Teknik, pero siempre les digo a todos los chic@s que por cada mesa Yamaha CL5 que se vende, se vende un palé de X32, la mesa Behringer, la mesa que ha roto el mercado desde hace unos años.
La Behringer X32 es una mesa súper barata –su calidad podemos discutirla– pero por el dinero que pagas es imposible que nadie te dé más por menos.
Directamente esa mesa ha roto el mercado. Ha hecho que todos los demás fabricantes empiecen a bajarse a tierra, empiecen a sacar mesas a un precio competitivo. Lleva el protocolo AES50. El AES50 es de AES, es un protocolo del 2.005 que está libre de royalties, nadie paga nada.
A Behringer le vino genial porque el AES50 lo empezó a utilizar Midas y cuando Behringer compró a Midas, dijeron «me viene Midas, nueva tecnología y el protocolo este que ya no hay que pasar por caja».
Es un protocolo muy limitado porque siempre es un punto a punto, pero tiene baja latencia y como no pago lo implemento en cualquier sitio, que no me va a costar mucho.
Y entonces las X32 salieron con él y ¿qué pasa? Que la X32 es la mesa digital más vendida en el planeta. Con una diferencia 100 a 1 si quieres. En todos los lados la tienen. Cuesta €2.000 euros y tienes una mesa de 32 canales para directo con entradas, salidas…
Por ejemplo, la solución que dio DiGiCo como mesa barata, que es la SD21, esa anda sobre los €8.000 ó €9.000. Es decir, digamos que no lo consiguen fabricar por menos de eso. Y dices, vale sí, es mejor. Pero es que la Beringher vale €2.000.
Yamaha lo intentó, sacó la serie TF. Ellos tenían la serie CL, que digamos es la serie media, que era para sustituir a las M7. Sacaron la seria QL, que era la serie más económica, y han sacado una serie ultra barata porque no podían competir con las QL con Behringer. Y sacaron las TF.
Yo prefiero una Behringer. Fueron capaces de fabricar a un precio que nadie pudo fabricar.
Hace unos años una Yamaha LS9, que digamos que era la más barata del directo de Yamaha, estábamos hablando de €9.000. Te doy más que una LS9 por €2.000 euros. Es que has roto el mercado.
Entonces, ¿qué ocurre? Que el AES50, siendo un protocolo antiquísimo, es el más extendido porque es como el chino. Vale, solo hablan chino en China, pero lo habla la mayoría de la población.
Trade: para recapitular e ir cerrando el capítulo de protocolos, dos preguntas rápidas: ¿cuáles son los protocolos con menor latencia? ¿y cuál es el que tiene más?
Suso Ramallo: el de menor latencia es el AES50. Y el MADI. Pero el MADI no lo consideramos un protocolo de red porque no funciona como tal.
El que más latencia tiene es CobraNet pero normalmente no se utiliza para aplicaciones de directo; se suele utilizar para aplicaciones de megafonía.
Trade: ¿y de directo? ¿de los que estamos hablando: Ravenna, Dante, AVB…?
Suso Ramallo: Ravenna sería el que tiene más latencia de todos y por eso se utiliza para aplicaciones de broadcast pero no para aplicaciones de directo.
Trade: y luego hablas de limitaciones. Es decir, que según el protocolo, te permite actuar sobre los elementos desde tu ordenador, sobre más o menos parámetros, entiendo…
Suso Ramallo: un estándar abierto la ventaja que tiene es que es igual que la informática. Si yo tengo un estándar abierto, como por ejemplo un ordenador con Linux, puedo modificar partes del core del Linux, lo que es el kernel (el «núcleo» en informática), ponerlo a mi medida y hacer lo que quiera.
Esa es la ventaja y el inconveniente. Para un usuario medio eso es el infierno porque claro, tienes que tener un conocimiento mínimo altísimo para poder hacer ese tipo de cosas.
Entonces, ¿qué ocurre? Que a los protocolos más abiertos cualquier usuario puede hacerle mejoras, modificarlo… al mismo tiempo también permite que lo fastidies y que dos protocolos que en teoría se llaman igual no se entiendan.
Trade: y llevándolo al otro extremo, ¿cuál sería el más «amigable»?
Suso Ramallo: Dante sería el más user friendly porque directamente ellos se lo guisan y se lo comen.
Con lo cual ya casi todas las mesas llevan dentro una tarjeta de Audinate Brooklyn 2 y todas funcionan igual, da igual el aparato que le metas que llevan esa tarjeta.
Trade: en esta parte del mundo, en Europa, en España incluso, ¿qué protocolo de audio en red es el más extendido?
Suso Ramallo: El AES50 es el más extendido por las X32 y la hermana mayor, que es la M32, y todas las MIDAS PRO. Pero el más extendido a nivel de número de dispositivos que lo tengan es Dante.
Y hay otros. Por ejemplo, Waves, los que fabrican plugins, tienen el suyo propio, el SoundGrid. Los que fabrican monitoraje, por ejemplo los de Aviom, tienen el suyo propio.
Trade: existen multitud de protocolos de marcas, ¿esta realidad te fuerza a utilizar conversores en la cadena?
Suso Ramallo: menos mal que ya existen conversores porque antiguamente la típica chapuza digital era tener mesa Yamaha fuera y una Midas dentro, lo spliteo todo en pasivo con dos cajetines, dos pulpos y tal…
Ahora lo puedes hacer en digital… de hecho la idea es que lo hagas en digital. Y no hagas «ñapas», que sería la palabra.
Con lo cual, por ejemplo, en el curso de sonido que damos en Trade, una de las cosas que enseño a los chic@s es a utilizar conversores, de forma que pasamos de un formato a otro formato sin tener que pasar por analógico nunca.
Fabricantes de equipos para audio en red
Trade: hemos hablado antes de fabricantes de mesas de sonido directo, pero ¿cuáles son los fabricantes clásicos que te encuentras en los demás eslabones de la cadena de audio digital?
Decías antes: la señal se digitaliza cerca de la fuente, en el cajetín, ¿hay aquí unos ciertos estándares de fabricantes?
Suso Ramallo: no, aquí cada uno fabrica el que le da la gana. De hecho en Dante, como hay más… por ejemplo, Yamaha, sus sistemas son Dante, pero hay muchos más fabricantes que ofertan cajetines en Dante.
El único problema es que posiblemente no te funcione la ganancia desde el cajetín de la Yamaha…
Todo. Ahora tenemos todo. Ahora tenemos desde fabricantes de mesas, etapas, todo… Todos los fabricantes actuales, si no lo tienen, te ofrecen una solución, la tarjeta, lo que sea, que tú puedes pinchar, y ya lo tienes…
Es más, hay varios fabricantes que te pueden ofertar para su mismo producto su conexión Dante o su conexión customizada o lo que tú quieras. Te dan directamente lo que tú les pidas.
Después, por ejemplo en Dante, incluso MADI, fabricantes que sacan dispositivos, previos y tal de diferentes marcas, que nadie te dice por qué no puedes utilizar las unas con otras.
El único problema ahí es que, por ejemplo, si todas se adhirieran al AES70, ya habría un control universal y entonces daría igual cualquier marca. El problema es que muchos fabricantes dicen no, es que yo te vendo una Yamaha y te tienes que comprar el rig a juego.
Trade: y ¿no se tiende hacia un estándar? ¿no hay una inercia que vaya hacia ahí?
Suso Ramallo: yo querría pensar que sí, por el dicho este de que a la fuerza ahorcan. ¿Qué significa? Que si lo piden los clientes pues acabarán aceptándolo, pero evidentemente las marcas lo que pretenden es hacer un sistema propietario para que siempre consumas sus productos.
Trade: acerca de la configuración. ¿Algo que destacar?
Suso Ramallo: la configuración, básicamente, es lo que dije antes. Hay que distinguir entre la parte, digamos, física, que yo conecto con esto, que eso ya empieza a carecer de bastante sentido, de hecho no tiene mucho sentido, y empezamos a hablar de la configuración lógica.
Conecto todos mis dispositivos a una red y desde un ordenador yo distribuyo la señal. Esta con esta, esa con esa, esta con la otra… Pero ya lo hago de una manera completamente lógica.
Trade: ¿qué software o tipo de software se utiliza para el control?
Suso Ramallo: normalmente cada fabricante de un protocolo te da su software de control.
Trade: es decir, que el protocolo que utilices va vinculado al software…
Suso Ramallo: sí, pero dentro de los layer 3, como son informática pura y dura, pues una cosa es para configurar, por ejemplo, las suscripciones en Dante, este canal con este canal…. y otra cosa es montar una red porque eso ya funciona como cualquier red normal.
El switch que te tienes que comprar es cualquiera que funcione bien pero no hace falta que sea para audio. Porque si es específico para audio, normalmente se están quedando contigo y cobrándote más por lo mismo.
Trade: uno genérico te sirve igual. Que sea robusto, que sea bueno…
Suso Ramallo: que sea bueno. Pero puede haber incluso switches de €30 que funcionen bien. Para solucionarte el problema te vale cualquiera.
Trade: para lo que es la red… entiendo que cuando hablamos de switch no es el cajetín…
Suso Ramallo: el switch es donde convergen todos los cables de RJ-45. Es donde converge todo y de ahí se reparte y tú, lógicamente, realizas las funciones desde un ordenador.
Trade: es decir que en el switch te entran todas las fuentes y salen hacia donde tengan que ir. Si tienen que ir hasta esta otra mesa, a una P.A….
Suso Ramallo: un típico fallo es que la gente no se da cuenta que los cables de Ethernet que llevan 8 hilos, los de Gigabyte (los de 100 les hacen falta solo 4), que ahí está entrada y salida.
Todo el mundo piensa en modo canónico de cable aquí, entrada, y luego que sale.
Aquí no. En el 100 lleva cuatro conductores, va simétrica la conexión y van 2 de salida y 2 de entrada. Haces cables cruzados normalmente porque sales de salida a entrada y de entrada a salida.
Clásicos problemas con el audio en red
Trade: tres incidencias, tres problemas que te sueles encontrar a la hora de trabajar con el audio en red.
Suso Ramallo: los problemas que me suelo encontrar normalmente son lógicos. O sea, gente que configura, por ejemplo, IPs de una mesa o de un cajetín, en distinto rango.
Es decir, unos están en una red y otros están en otra red… están conectados… Todo está conectado, todo parece que está bien pero no está bien, porque no están en el mismo sitio, con lo cual falla la configuración lógica, no veo este cajetín, no veo el otro, esto es un problema, se ha estropeado…
Es completamente un problema de configuración de la red.
Trade: ¿algún otro problema, alguna otra incidencia?
Suso Ramallo: problemas tontos. Que muchas veces se utiliza cableado que no es el adecuado. Por ejemplo, tienes un cable que funcionó muy bien en su día pero está machacado y cuando le pones 100 metros de cable la señal te llega de aquella manera… tienes fallos intermitentes de conexión porque de repente el cable está o machacado o es de baja calidad y 100 metros es excesivo.
Porque aquí recordamos que tenemos la posibilidad de 100 metros de cable y podemos repetirlo con un switch, por ejemplo, o con repetidores con el AES50, pero porque el estándar de Ethernet es así. Son 100 metros. En cobre.
A partir de 100 metros o le pones un switch para volver a reamplificar o directamente ya se acabó. A veces hay cables que ni siquiera son de esa calidad y 100 metros es excesivo. Pierden demasiada señal, con lo cual te llega un churro y tienes problemas de sincronía. A veces ocurre eso.
A veces ocurre que los propios conectores los han crimpado mal y dan fallo. A mí me ha pasado. Ocurre también que el problema que tienen los RJ-45 sobre todo si no los tienes encapsulados en Ethercom es que si se te rompe la presilla de plástico, no agarra y en el segundo bombo se te sale y ya no tienes más.
Lo llamamos la «presilla de Damocles». Entonces, una cosa a la que todos los chavales tienen que acostumbrarse es…. muchos saben soldar canon pero ahora mismo lo que tienen que saber es crimpar cables.
Llévate una crimpadora, el bolsillo lleno de RJ-45 y si tienes uno roto lo cambias.
Empleas cinco minutos de tu tiempo y le pones uno nuevo. Ha cambiado eso. Pero claro, eso es infinitamente mejor que soldar un conector de 150 pines.
Primeros pasos con el audio en red
Trade: no sé si dispones de bibliografía que puedas recomendar a gente que quiera aprender sobre audio en red, tanto de audio o de informática o de redes… O si hay algún libro que digas «esto es la biblia».
Suso Ramallo: más que recomendar libros yo lo que recomiendo es que vayan a un curso de formación. Pero, simplemente, con que bajen cualquier información sobre redes, sobre el protocolo TCP/IP, TCP/UDP, que sepan lo que son los puertos, que sepan los comandos básicos de red, eso sería más que suficiente.
Los comandos básicos de red y saber cómo funciona el protocolo, cómo funcionan las IPs… bueno pues una IP funciona así, qué es una máscara de subred, todo esto está en Wikipedia. Porque además, en la wikipedia hay artículos que están mal escritos pero estos están bien; debieron ser de los primeros (risas).
Trade: los artículos que no provocan debate en Wikipedia suelen ser correctos…
Suso Ramallo: claro. Dices ¿cómo es el IP4? Son cuatro octetos. Cuatro octetos, ¿cuántas direcciones nos permiten? Pues sería el equivalente, son 32 bit. Sería 2 elevado a la 32. Eso te da muchos millones. Eso es lo que puedes tú dividir en una red, empezar a entender lo que es una red de rango A o rango B o rango C, lo que es una máscara de subred, y eso todo lo tienes en la Wikipedia, no hace falta nada en especial. Si sabes de eso, ya tienes el 50%.
Trade: ¿y el otro 50%?
Suso Ramallo: el otro 50% es que se vengan al Máster de Sonido de Trade (risas)
Trade: Suso, ¿algo más que quieras añadir para cerrar la entrevista? ¿cómo podemos seguir tu actividad fuera de la escuela?
Suso Ramallo: nada más de mi parte. Los lectores pueden encontrarme en redes sociales y también mi sitio web.
Trade: genial Suso. Muchas gracias por tu tiempo y por esta extensa entrevista acerca del audio en red.
Suso Ramallo: a vosotros.
Deja una respuesta
Tu correo electrónico no será publicado.