Dither y Noise Shaping. Abordaje práctico

Pablo Panitta
Dithering in Ozone

Introducción:

Al reducir la profundidad de bits de una señal digital (por ejemplo de 24 a 16), se producirá lo que se denomina “ruido de cuantización”. Esto es producto de realizar un “truncamiento” (sacar los 8 bits menos significativos) de la señal de 24 y así llegar a la de 16 bits.

A fin de reducir los efectos adversos de este proceso, es que aplicamos una técnica llamada “Dithering”.

Este artículo no intenta presentar la teoría detallada del proceso (que por cierto existe mucha bibliografía al respecto), sino darle un abordaje más práctico, el cual es un poco más difícil de encontrar.


Dither. Un poco de teoría.

Ya dijimos que el “ruido de cuantización” es un efecto que aparece luego de haber reducido la cantidad de bits a través del truncado de la señal.

La forma de minimizar este ruido de cuantización es a través del proceso de Dithering, el cual es simplemente el agregado de ruido blanco (aleatorio y uniformemente distribuido) a la señal original, antes de la reducción.
¿Agrego ruido blanco para eliminar “ruido de cuantización”? Esto no parece tener mucho sentido. Y es verdad, en una primera lectura esto no parece ser un proceso muy útil.


La realidad es que el llamado “ruido de cuantización no es un ruido como tal, sino más bien una distorsión.

Por definición, para que una señal sea considerada como ruido, debe ser aleatoria y, por lo tanto, no debe estar relacionada (correlacionada) con otras variables. Y resulta ser que el ruido de cuantización, si lo está, y su relación es con el nivel de la señal a cuantizar.

Por lo tanto, lo que buscamos con proceso de Dithering es cambiar distorsión por ruido.

¿Y por qué esto sería un buen cambio? Bueno, resulta que la psicoacústica humana tolera mejor el ruido que la distorsión. Esta última resulta mucho más molesta y distractiva que el ruido en sí mismo.

________________________________


*1 Importante: El presente trabajo no constituye ninguna representación, recomendación o preferencia hacia ninguna marca o modelo mencionado. No se realiza un ranking de mejor o peor funcionamiento, sino solamente se exponen los resultados.

*2 El agregado de ruido a la señal a recuantizar hace decorrelacionar el error de cuantización del nivel de señal, y por lo tanto lo transformamos en verdaderamente ruido en vez de distorsión.



Dither. La práctica.

A continuación se presentan los resultados de mediciones realizadas con una señal de 24-bits 997Hz a 2LSB (least significant bits) a la que se ha procesado con distintos plugins o DAWs, para convertirla a 16-bits. Como se mencionó anteriormente, con el proceso intentamos bajar la distorsión a costa de un mayor ruido, y por lo tanto podemos medir parámetros relacionados con estos fenómenos, a saber: TD (Total Distortion) y SNR (Signal to Noise Ratio).



Dither y Noise Shaping. Abordaje práctico

Figura 1: Distorsión Total. Señales -30dBc de la fundamental

Dither y Noise Shaping. Abordaje práctico

Figura 2: Relación Señal a ruido (SNR). Si el proceso no baja significativamente la distorsión, no se procede a medir este parámetro (na).

En la Figura 1 podemos ver el impacto en la distorsión en las señales cuantizadas a 16-bits con el agregado de dither. Vemos como la distorsión se reduce drásticamente (o se anula)  con respecto a la señal original sin dither. ¡Exactamente lo que queríamos lograr!

En la Figura 2 vemos el precio a pagar por esa reducción. Se observa fácilmente la degradación de la relación SNR, debido al haber introducido el dither (aka ruido).

Vemos también que hay algunos procesadores que arrojan unos resultados particulares (Waves L2, Weiss DS1 v2.6.1, Maxim). 

En relación a estos, me gustaría solo comentar el caso del plugin de Softube Weiss DS1, en el cuál la versión actual (v2.6.1) incorpora autoblanking mientras que la anterior (v2.5.9) no lo tenía. Esto hace que para los niveles muy bajos de señal (como los utilizados en estas mediciones), la nueva versión no aplique dithering y, por ende, vemos los mismos valores de distorsión y SNR que en la señal de 16-bits sin dither. Por tal motivo, el comportamiento de ambas versiones es diferente para éstos niveles.

La selección de la intensidad del dither (en aquellos plugins que lo permiten), afecta al porcentaje de muestras que cambian de estado, o dicho de otra manera, modifican su nivel con respecto a la señal original.

Valores típicos para dither de baja intensidad rondan el 20% , para medios un 30% y altos de 35% en adelante.

Algo interesante para mencionar es que la aplicación del dither es independiente en cada canal. Por ejemplo, para el caso del procesamiento con dithering en stereo, el generado para el canal izquierdo será independiente al generado para el derecho.


Noise Shaping.

El modelado del ruido (Noise Shaping) es una técnica que me va a permitir, redistribuir el ruido a zonas de frecuencia de menor percepción acústica. Si el dither agrega ruido uniformemente distribuido, el noise shaping lo “acomoda”.

En otras palabras, se trata de reducir la potencia de ruido en zonas de mayor sensibilidad psicoacústica (medias y medias altas) y aumentarla en las zonas de menor sensibilidad (altas frecuencias). Con esto logro mejorar la percepción de la relación señal a ruido.

En la teoría, la potencia total de ruido se mantiene inalterada (solo existe redistribución) pero en la implementación práctica la misma aumenta luego de aplicar noise shaping.

________________________________


*3 Ingenieros de Softube me han confirmado que se ha introducido este cambio con el fin de reducir el consumo de CPU para señales de entrada de tan bajo nivel.

*4 La intensidad del Dither también puede relacionarse con los LSB (nivel) agregados (ticamente 1, 2 o 3 LSB). Generalmente para distribuciones triangulares, lo común son 2 LSB.


Sin embargo, esto es transparente para la escucha, ya que el oyente efectivamente percibirá una reducción del ruido frente a la señal útil, logrando una mejora notable en la calidad total percibida.

Los distintos niveles de noise shaping (en el caso que sea seleccionable), tienen que ver con la cantidad de potencia desplazada hacia las frecuencias psicoacústicamente menos sensibles.


A diferencia del Dihter, que no tiene mucha personalización posible, el Noise shaping si puede tener (y de hecho lo tiene) un trabajo de ajuste importante. Muchos de los fabricantes utilizan distribución de ruido basada en modelos desarrollados por ellos de manera de optimizar los efectos psicoacústicos. Es así que vemos siglas como: POWr, MBIT, IDR, UV22, etc. 

De forma sencilla se puede insertar un analizador de espectro, y analizar las curvas de ruido de las distintas marcas y modelos de plugins.


Resultados.

En la Figura 3, vemos reflejados los valores obtenidos de Noise Power(Npow) y Noise to Mask Ratio (NMR) para distintos niveles de dithering de los plugins medidos. 

La convención de etiquetado es:


Dither y Noise Shaping. Abordaje práctico

indica que corresponde al plugin Ozone con un Dither Medium y una intensidad de  Noise Shaping Low.

________________________________


*5 Parámetros que pueden variar en el Dither son su intensidad y su distribución (Rectangular, Triangular, Gaussiana). En audio, el uso común y recomendado es la distribución triangular (aunque unos pocos plugin permiten seleccionar el tipo a aplicar)

*6  Noise to Mask Ratio (NMR) es una medida de enmascaramiento del ruido. Valores más negativos indican que el perfil de ruido se encuentra más alejado del umbral de enmascaramiento, presentando una menor percepción psicoacústica.

Noise Power and NMR

Figura 3: Niveles de Noise Power y Noise to Mask Ratio para cada combinación medida. Si el procesador posee autoblanking, no se muestra en el gráfico

Recordar que el Noise Power se relaciona con la potencia de ruido que se encuentra en la banda y el NMR a cuánto psicoacústicamente se percibe dicho ruido. Mayores niveles de nPower (menos negativos) significan mayor ruido presente mientras que menores valores de NMR (más negativos) resultan en una menor percepción del mismo.

Se puede apreciar cómo, a medida que aumento la intensidad del noise shaping, el parámetro NPower (potencia de ruido sobre toda la banda) aumenta y en NMR (que es un parámetro de enmascaramiento de ruido) en general disminuye.


La escucha. Comparaciones.

Si bien los resultados son indicadores que nos orientan hacia las características de la señal procesada, no nos dan una idea cabal de cómo se escucha cada combinación. ¿Es una distorsión de x% algo tolerable a estos niveles?  ¿qué tan bueno o malo es un valor de SNR de ydB? O si cuánto es la diferencia de percepción entre los distintos valores de NMR.


Para que el lector pueda tener una representación auditiva, he creado una página en donde se pueden escuchar cada una de las señales procesadas, con el fin de poder ayudarlo a seleccionar el Dither y/o Noise Shaping que más le resulte conveniente.

Se puede validar cómo mediciones con una potencia de ruido (NPower) menor efectivamente se traduce en una menor percepción auditiva, o incluso combinaciones con el mismo valor de NPower pero menor NMR, se perciben con menor carga ruidosa, validando los resultados de las mediciones.

La realidad es que como todo esto ocurre a niveles muy bajos de señal, en la mayoría de los casos no será un tema de extrema preocupación. Pero como siempre estamos en la búsqueda de la excelencia… ¿por qué privarse de elegir lo que más nos sirva?

El siguiente link apunta a una página donde he creado una herramienta para poder comparar varias combinaciones de Dither y Noise Shaping, tanto para una señal senoidal como para una de instrumento.

Si bien se puede acceder desde cualquier dispositivo, se recomienda ingresar desde una PC, ya que se accederá a la versión completa de la herramienta. El acceso desde un dispositivo móvil, redireccionará a una versión reducida de la misma.


https://soundins.com.ar/Publications/Dither/DitherNS_Tool_Main.html


Ing. Pablo Panitta
Soundins

By Juan Benegas May 14, 2025
Estás pensando en ella. Lo sé. Muchos lo sabemos. Pensás todo el tiempo en ella. - “Que luzca bien, que suene bien, que sea la mejor”- Tenés la esperanza (casi inconfesable) de que esta vez va a superar la belleza que le diste a la anterior. Y.. sí…hubieron otras antes. Pero para vos es como si siempre hubiese sido la misma, la única, tu primer amor. Y no te queda otra que pensar siempre en ella. A mí me pasa lo mismo. Por eso sé que, aunque la llames siempre de diferente modo (porque se presenta a vos con nombres distintos) vos siempre reconocés que es ella. ¿Cómo podría ser otra? Ella, la que a veces se te arrima tímida pidiendo que le enfatices los graves o que le sustraigas (con mucha delicadeza) los medios. La que otras veces irrumpe pateando la puerta de tu estudio y arranca, sin aviso ni conteo previo, con una transiente que te obliga a arrancarte los auriculares de un solo manotazo. O ésa que se muestra como una bailarina de ballet hasta que una subsónica hace estallar los monitores que cuidabas como a dos órganos primordiales de tu propio cuerpo. No importa. Nada importa. Vos le mejorás el look, tanto si llega rockera, rapera, trapera, popera, metalera, tanguera…era… era…¡Era ella!. ¡Es ella! La que sostiene vivo a un mundo hecho de silencios (o de ruidos insoportables). ¡Y vos sos nada menos que el responsable involuntario de vestirla de gala, y aún de desvestirla cuando cierta ropa está demás y oculta sus mejores atributos! Cada mañana te sentás frente a tu PC, entre cables verdaderos y plugins que simulan ser reales y empezás tu tarea única, irremplazable: embellecerla hasta que suene espectacular, sin siquiera cuestionar el estado en que llegó a tus manos. Cuando promedia el día te decís: “Ésta es la mejor de todas”. Y es lógico que atesores esa esperanza, porque no siempre ella viene hasta vos como te gustaría. Como cuando sentís que te llegó sin alma, o peor aún, ¡que nació sin alma! y te ves obligado a adornar su cuerpo vacío, fantasmal: ¡un engendro que nunca debió haber sido! Pero está ahí para deprimirte… pero no. Aun así, surfeando entre umbrales que bajan y envolventes que se adaptan a la increíble ausencia de arte, vos te la ingeniás para ungirla con tu propia visión de lo artístico. Sabés que miles de personas la van a escuchar, la van a disfrutar en compañía, gracias a tus decisiones tomadas en perfecta y total soledad. Y nadie va a pensar en tus horas allí sentado, ni en tus filtros patovicas decidiendo quién pasará y quién no, ni en tus regimientos decompresores poniendo un techo a piquetes de coros enmascarados, ni en tus reverbs escapadas de catedrales góticas, latiendo sutilmente escondidas en el corazón de ella, como si te nombraran sin nombrarte, imponiendo tu sello indeleble sobre miles de oídos alegremente distraídos. Todos bailarán al ritmo de ella y (mal o bien) la cantarán, disfrutarán la fiesta mientras vos volvés a sentarte para recibirla una y otra vez, siempre distinta pero igual , y recomenzar tu tarea de hacedor de lo invisible, sabiendo que no podés quedarte clavado, inmóvil, que tenés que mejorar, avanzar, que tu trabajo no puede terminar espejándose en mezclas de referencia que “vendieron bien”, para que todo siga sonando igual, con las curvas de ecualización esperadas y que ella se repita y reproduzca al infinito según el gusto formateado y congelado de la sociedad o de la industria del ruido secuenciado. A veces también te preguntás “¿Lograré dar una pincelada nueva para que ella pueda seducir desde otro lugar?” Te contestás que sí, y entonces empezás de nuevo. Te sumergís buceando en un océano delimitadores y expansores, como buscando vislumbrar una isla no habitada, desconocida hasta el momento. Pero a veces te decís que no, y querés irte lejos, subirte a un camión de carga sin carga, oteando el otro horizonte, ése que se escapa a medida que avanzás, sólo para dilatar tu propia felicidad. Es cuando encendés la FM a la derecha de tu volante y de repente la escuchás. Sí, es ella, la que masterizaste el año pasado. Y suena tan bien que tu camión emprende una curva de 180 grados, llegando al borde mismo de la cancelación, para regresar otra vez a tu estudio, a la magia de ese sonido que nadie nunca vio, ni podrá ver jamás. Ahora estás terminando tu jornada de trabajo y ella está otra vez en el éter, renovada, entrelazándose entre la gente con su vestido nuevo, audible, intangible como siempre. Descubrís que, a pesar de todo, tu profesión, que creció hasta convertirse en oficio (sí, sabés que el oficio es la evolución de la profesión) es un raro privilegio, aún en un mundo sonoro en evidente decadencia. Emprendés el regreso a tu casa, tranquilo, porque aún existe ella, la que siempre podrá ser mejorada. Mientras caminás lento por la vereda solitaria y poco iluminada de la ciudad que nunca descansa, alguien, que te cruza por causalidad, puede ver la mueca de tu boca, la mueca inequívoca de que aún cansado y con tus ilusiones manoseadas no podés olvidarla. No podrás nunca. Que seguís pensando en ella. Como yo. Como tantos… Juan Benegas (poniéndole alma y piel a los decibeles)
By Pablo Panitta April 28, 2025
Batido en señales sub-Nyquist. ¿Qué onda?
A man wearing headphones is sitting in front of two computer monitors.
By Carlos Richter March 27, 2025
Cuál es la relación entre el DAW que utilizás y los recursos de tu computadora?
Plataformas de Streaming
By Carlos Richter November 18, 2024
Análisis del comportamiento de los servicios de streaming en relación a la sonoridad del contenido subido
Canal de consola SSL
By Pablo Rabinovich August 5, 2024
¿Qué hay detrás de los colores de los potes de los ecualizadores de las viejas consolas SSL?
Teletronix LA2A
By Pablo Rabinovich August 5, 2024
El Teletronix LA2A es uno de los compresores más utilizados en toda la historia de la industria discográfica. Conocer un poco acerca de su historia, es un buen punto de partida para acercarnos a su maravilloso sonido!
EMT 140
By Pablo Rabinovich August 5, 2024
El clásico sonido de la EMT 140 sin duda ha dejado una enorme huella en infinidad de álbumes que resultaron ser verdaderos hits. Debido a su tamaño, costo y peso, este es uno de los casos en los que los plugins que la emulan juegan un rol fundamental en la producción actual.
Creando una reverb con la acústica de un baño
By Pablo Rabinovich August 5, 2024
Desde un primer momento los estudios de grabación han intentado emular el realismo de una sala de conciertos. A partir de ahí todo fue pura creatividad. En la actualidad la reverb es un elemento indispensable en la producción musical.