Dither y Noise Shaping. Abordaje práctico

Pablo Panitta
Dithering in Ozone

Introducción:

Al reducir la profundidad de bits de una señal digital (por ejemplo de 24 a 16), se producirá lo que se denomina “ruido de cuantización”. Esto es producto de realizar un “truncamiento” (sacar los 8 bits menos significativos) de la señal de 24 y así llegar a la de 16 bits.

A fin de reducir los efectos adversos de este proceso, es que aplicamos una técnica llamada “Dithering”.

Este artículo no intenta presentar la teoría detallada del proceso (que por cierto existe mucha bibliografía al respecto), sino darle un abordaje más práctico, el cual es un poco más difícil de encontrar.


Dither. Un poco de teoría.

Ya dijimos que el “ruido de cuantización” es un efecto que aparece luego de haber reducido la cantidad de bits a través del truncado de la señal.

La forma de minimizar este ruido de cuantización es a través del proceso de Dithering, el cual es simplemente el agregado de ruido blanco (aleatorio y uniformemente distribuido) a la señal original, antes de la reducción.
¿Agrego ruido blanco para eliminar “ruido de cuantización”? Esto no parece tener mucho sentido. Y es verdad, en una primera lectura esto no parece ser un proceso muy útil.


La realidad es que el llamado “ruido de cuantización no es un ruido como tal, sino más bien una distorsión.

Por definición, para que una señal sea considerada como ruido, debe ser aleatoria y, por lo tanto, no debe estar relacionada (correlacionada) con otras variables. Y resulta ser que el ruido de cuantización, si lo está, y su relación es con el nivel de la señal a cuantizar.

Por lo tanto, lo que buscamos con proceso de Dithering es cambiar distorsión por ruido.

¿Y por qué esto sería un buen cambio? Bueno, resulta que la psicoacústica humana tolera mejor el ruido que la distorsión. Esta última resulta mucho más molesta y distractiva que el ruido en sí mismo.

________________________________


*1 Importante: El presente trabajo no constituye ninguna representación, recomendación o preferencia hacia ninguna marca o modelo mencionado. No se realiza un ranking de mejor o peor funcionamiento, sino solamente se exponen los resultados.

*2 El agregado de ruido a la señal a recuantizar hace decorrelacionar el error de cuantización del nivel de señal, y por lo tanto lo transformamos en verdaderamente ruido en vez de distorsión.



Dither. La práctica.

A continuación se presentan los resultados de mediciones realizadas con una señal de 24-bits 997Hz a 2LSB (least significant bits) a la que se ha procesado con distintos plugins o DAWs, para convertirla a 16-bits. Como se mencionó anteriormente, con el proceso intentamos bajar la distorsión a costa de un mayor ruido, y por lo tanto podemos medir parámetros relacionados con estos fenómenos, a saber: TD (Total Distortion) y SNR (Signal to Noise Ratio).



Dither y Noise Shaping. Abordaje práctico

Figura 1: Distorsión Total. Señales -30dBc de la fundamental

Dither y Noise Shaping. Abordaje práctico

Figura 2: Relación Señal a ruido (SNR). Si el proceso no baja significativamente la distorsión, no se procede a medir este parámetro (na).

En la Figura 1 podemos ver el impacto en la distorsión en las señales cuantizadas a 16-bits con el agregado de dither. Vemos como la distorsión se reduce drásticamente (o se anula)  con respecto a la señal original sin dither. ¡Exactamente lo que queríamos lograr!

En la Figura 2 vemos el precio a pagar por esa reducción. Se observa fácilmente la degradación de la relación SNR, debido al haber introducido el dither (aka ruido).

Vemos también que hay algunos procesadores que arrojan unos resultados particulares (Waves L2, Weiss DS1 v2.6.1, Maxim). 

En relación a estos, me gustaría solo comentar el caso del plugin de Softube Weiss DS1, en el cuál la versión actual (v2.6.1) incorpora autoblanking mientras que la anterior (v2.5.9) no lo tenía. Esto hace que para los niveles muy bajos de señal (como los utilizados en estas mediciones), la nueva versión no aplique dithering y, por ende, vemos los mismos valores de distorsión y SNR que en la señal de 16-bits sin dither. Por tal motivo, el comportamiento de ambas versiones es diferente para éstos niveles.

La selección de la intensidad del dither (en aquellos plugins que lo permiten), afecta al porcentaje de muestras que cambian de estado, o dicho de otra manera, modifican su nivel con respecto a la señal original.

Valores típicos para dither de baja intensidad rondan el 20% , para medios un 30% y altos de 35% en adelante.

Algo interesante para mencionar es que la aplicación del dither es independiente en cada canal. Por ejemplo, para el caso del procesamiento con dithering en stereo, el generado para el canal izquierdo será independiente al generado para el derecho.


Noise Shaping.

El modelado del ruido (Noise Shaping) es una técnica que me va a permitir, redistribuir el ruido a zonas de frecuencia de menor percepción acústica. Si el dither agrega ruido uniformemente distribuido, el noise shaping lo “acomoda”.

En otras palabras, se trata de reducir la potencia de ruido en zonas de mayor sensibilidad psicoacústica (medias y medias altas) y aumentarla en las zonas de menor sensibilidad (altas frecuencias). Con esto logro mejorar la percepción de la relación señal a ruido.

En la teoría, la potencia total de ruido se mantiene inalterada (solo existe redistribución) pero en la implementación práctica la misma aumenta luego de aplicar noise shaping.

________________________________


*3 Ingenieros de Softube me han confirmado que se ha introducido este cambio con el fin de reducir el consumo de CPU para señales de entrada de tan bajo nivel.

*4 La intensidad del Dither también puede relacionarse con los LSB (nivel) agregados (ticamente 1, 2 o 3 LSB). Generalmente para distribuciones triangulares, lo común son 2 LSB.


Sin embargo, esto es transparente para la escucha, ya que el oyente efectivamente percibirá una reducción del ruido frente a la señal útil, logrando una mejora notable en la calidad total percibida.

Los distintos niveles de noise shaping (en el caso que sea seleccionable), tienen que ver con la cantidad de potencia desplazada hacia las frecuencias psicoacústicamente menos sensibles.


A diferencia del Dihter, que no tiene mucha personalización posible, el Noise shaping si puede tener (y de hecho lo tiene) un trabajo de ajuste importante. Muchos de los fabricantes utilizan distribución de ruido basada en modelos desarrollados por ellos de manera de optimizar los efectos psicoacústicos. Es así que vemos siglas como: POWr, MBIT, IDR, UV22, etc. 

De forma sencilla se puede insertar un analizador de espectro, y analizar las curvas de ruido de las distintas marcas y modelos de plugins.


Resultados.

En la Figura 3, vemos reflejados los valores obtenidos de Noise Power(Npow) y Noise to Mask Ratio (NMR) para distintos niveles de dithering de los plugins medidos. 

La convención de etiquetado es:


Dither y Noise Shaping. Abordaje práctico

indica que corresponde al plugin Ozone con un Dither Medium y una intensidad de  Noise Shaping Low.

________________________________


*5 Parámetros que pueden variar en el Dither son su intensidad y su distribución (Rectangular, Triangular, Gaussiana). En audio, el uso común y recomendado es la distribución triangular (aunque unos pocos plugin permiten seleccionar el tipo a aplicar)

*6  Noise to Mask Ratio (NMR) es una medida de enmascaramiento del ruido. Valores más negativos indican que el perfil de ruido se encuentra más alejado del umbral de enmascaramiento, presentando una menor percepción psicoacústica.

Noise Power and NMR

Figura 3: Niveles de Noise Power y Noise to Mask Ratio para cada combinación medida. Si el procesador posee autoblanking, no se muestra en el gráfico

Recordar que el Noise Power se relaciona con la potencia de ruido que se encuentra en la banda y el NMR a cuánto psicoacústicamente se percibe dicho ruido. Mayores niveles de nPower (menos negativos) significan mayor ruido presente mientras que menores valores de NMR (más negativos) resultan en una menor percepción del mismo.

Se puede apreciar cómo, a medida que aumento la intensidad del noise shaping, el parámetro NPower (potencia de ruido sobre toda la banda) aumenta y en NMR (que es un parámetro de enmascaramiento de ruido) en general disminuye.


La escucha. Comparaciones.

Si bien los resultados son indicadores que nos orientan hacia las características de la señal procesada, no nos dan una idea cabal de cómo se escucha cada combinación. ¿Es una distorsión de x% algo tolerable a estos niveles?  ¿qué tan bueno o malo es un valor de SNR de ydB? O si cuánto es la diferencia de percepción entre los distintos valores de NMR.


Para que el lector pueda tener una representación auditiva, he creado una página en donde se pueden escuchar cada una de las señales procesadas, con el fin de poder ayudarlo a seleccionar el Dither y/o Noise Shaping que más le resulte conveniente.

Se puede validar cómo mediciones con una potencia de ruido (NPower) menor efectivamente se traduce en una menor percepción auditiva, o incluso combinaciones con el mismo valor de NPower pero menor NMR, se perciben con menor carga ruidosa, validando los resultados de las mediciones.

La realidad es que como todo esto ocurre a niveles muy bajos de señal, en la mayoría de los casos no será un tema de extrema preocupación. Pero como siempre estamos en la búsqueda de la excelencia… ¿por qué privarse de elegir lo que más nos sirva?

El siguiente link apunta a una página donde he creado una herramienta para poder comparar varias combinaciones de Dither y Noise Shaping, tanto para una señal senoidal como para una de instrumento.

Si bien se puede acceder desde cualquier dispositivo, se recomienda ingresar desde una PC, ya que se accederá a la versión completa de la herramienta. El acceso desde un dispositivo móvil, redireccionará a una versión reducida de la misma.


https://soundins.com.ar/Publications/Dither/DitherNS_Tool_Main.html


Ing. Pablo Panitta
Soundins

Filtros en un ecualizador
By Pablo Rabinovich June 5, 2026
Comprendé el impacto de las pendientes de los filtros en la ingeniería de sonido. Aprendé más en el Instituto de Sonido Orion
By Pablo Rabinovich May 20, 2026
Si es bueno y sencillo, es dos veces bueno
Persona con auriculares
By Gustavo González May 12, 2026
Artículo sobre la obtención de una respuesta neutra en los auriculares
UAD EMT 140
By Pablo Rabinovich May 4, 2026
El sonido inconfundible de la reverb de placa
Equipos Avalon Design y Manley
By Pablo Rabinovich April 29, 2026
Una diferencia clave que muchos pasan por alto
By Pablo Rabinovich April 26, 2026
Ese clásico sonido norteamericano en un plugin
By Gustavo González March 31, 2026
Existe una suerte de “consenso general” que acepta que el espectro tonal audible se puede dividir en 3 grandes secciones: Graves, Medios y Agudos. Sin embargo, esta sencilla división tonal contiene información que no se observa a simple vista… dado que si contamos con 3 macros tonales, en dicha configuración existen 2 puntos de cruce, es decir, la transición de los graves hacia los medios y de los medios hacia los agudos.
By Gustavo González November 29, 2025
No descuides una parte crucial de tus auriculares!
By Pablo Rabinovich November 18, 2025
Decidí preparar este artículo porque he notado que muchas veces se da una confusión importante en cuanto a cuáles son las funciones del look-ahead y de los parámetros de envolventes en uno de los limitadores más reconocidos de la industria del audio profesional: FabFilter Pro-L2 Look-ahead, cuál es su rol en los procesadores dinámicos? El look-ahead es una técnica que le permite a un procesador dinámico “anticipar” su reacción ante señales transitorias. Se implementa dividiendo la entrada en dos copias: 1) Copia retardada: Se dirige al circuito que aplicará la modificación en la ganancia, desembocando en la salida de audio. 2) Copia sin retardo: alimenta el detector vía side-chain que se utiliza para medir el nivel y generar la señal de control. Como la señal de control se calcula sobre la copia sin retardo y luego se aplica a la señal retardada, el procesador consigue que la reducción de ganancia se inicie antes de que la transiente llegue al punto de salida. En la práctica equivale a un “tiempo de ataque negativo” porque el control puede empezar a actuar antes de que la transiente aparezca en la ruta de audio.  En el Pro-L2, este retardo interno establecido en milisegundos le permite al algoritmo anticipar picos y suavizar la reducción de ganancia evitando recorte abrupto de la señal. En la práctica, el look-ahead reduce artefactos intrínsecos a las variaciones muy veloces de ganancia, que suelen producir distorsión agregada. Sin look-ahead, para atrapar un pico necesitaríamos un ataque extremadamente rápido, y este tipo de reacción en un procesador dinámico, al implicar cambios de ganancia con pendientes muy pronunciadas, introduce nuevos componentes espectrales, ocasionando distorsión y “clicks”, lo que en el dominio digital puede producir intermodulación y aliasing. El look-ahead le permite al procesador moldear la etapa de ataque, empezando a reducir la ganancia antes de que la transiente aparezca, generando una pendiente efectiva menor para la misma atenuación, y de este modo reducir la distorsión. Envolventes: El Pro-L2 no divide la señal en ataque y sostenido, sino que divide la evaluación del nivel en componentes rápidos y lentos dentro del detector, generando una única envolvente de reducción de ganancia cuyo comportamiento temporal varía según el algoritmo ( Style ). De esa forma puede tratar transitorios y material sostenido de manera diferente, pero sin separar la señal en dos caminos. Pro-L2 utiliza detección híbrida (pico + envolvente) con componentes que atienden picos y componentes que siguen la envolvente RMS. La salida del detector se procesa para obtener el objetivo de ganancia. Esto afecta directamente el release efectivo. Attack: En el Pro-L2 este parámetro no funciona del mismo modo que en un compresor o un expansor. El parámetro de ataque en el Pro‑L2 define la duración de la etapa de transiente del algoritmo, determinando qué porciones del material se clasifican como transientes frente a sostenidos. En otras palabras, el attack define la ventana temporal de la transiente, no la velocidad de inicio de reducción. La asignación de un ataque corto le indica al limitador que la etapa de transiente es muy breve. Release: Operativamente, el release controla la velocidad con la que el limitador regresa a la ganancia unidad (reducción 0 dB) después de que la señal dejó de sobrepasar el umbral/ceiling. Es decir: determina la constante temporal con la que la señal de control (la ganancia aplicada) se recupera luego de un evento de reducción. Normalmente, los limitadores digitales suelen implementar el release aplicando un suavizado exponencial sobre la ganancia. El Pro-L2 implementa una etapa de liberación adaptativa dependiente del programa. En la práctica esto significa que el detector combina componentes de respuesta rápida para transitorios, y lenta ante una envolvente sostenida, para establecer la reducción necesaria. El tiempo efectivo de release varía según la magnitud y la duración de la reducción de ganancia: aumentos grandes de reducción suelen activar un release más largo. Asimismo, reducciones pequeñas o rápidas pueden liberarse más velozmente.
By Pablo Rabinovich November 14, 2025
Análisis sobre la distorsión de baja frecuencia en los compresores
Más Artículos