Psicoperceptiva de los Medios Graves

Gustavo González

Existe una suerte de “consenso general” que acepta que el espectro tonal audible se puede dividir en 3 grandes secciones: Graves, Medios y Agudos. 

Sin embargo, esta sencilla división tonal contiene información que no se observa a simple vista… dado que si contamos con 3 macros tonales, en dicha configuración existen 2 puntos de cruce, es decir, la transición de los graves hacia los medios y de los medios hacia los agudos.

Aquí nos ocuparemos de la primera transición (de los graves a los medios) ampliamente denominada en la producción musical como “medios-graves”.

A medida que avancemos en el artículo, el lector podrá comprender la enorme importancia de este sector tonal del espectro.

Existen múltiples factores psico perceptivos que condicionan la necesidad de ocuparse del mismo, en términos de carácter tonal, dinámico, de planos, e incluso apertura en el campo estéreo, cuando se considere necesario.


Como primera medida, necesitamos determinar cuál es la región tonal que estamos ocupando. Considero que el ancho de banda fuerte en el presente artículo se produce entre los 200 y 400 Hz, aunque sin lugar a dudas algunos ingenieros de mezcla propondrán un “Q” más amplio… a título personal creo que para el propósito de este artículo, la zona mencionada será suficiente.


Como concepto central del artículo, me gustaría dejar claro que la región de medios graves sirve como
punto de apoyo tonal y dinámico en la percepción general de una mezcla, desde el cual se obtienen sensaciones sobre el nivel de comprensión, claridad, sensación de apertura y espacialidad. Por lo tanto, si logramos manejar esta zona tonal de forma correcta obtendremos un audio orgánico y natural.

Veremos a continuación cómo nuestro cerebro interpreta dicha región, dado que el oído es naturalmente sensible en esta zona por diferentes motivos.


  • La fonoaudiología explica que existen formantes de la voz humana (sobre todo la masculina) que radican tonalmente aquí. Y como es sabido, nuestro oído es principalmente  voco-centrista.


  • A diferencia de los graves, se pudo concluir a partir de diferentes experimentaciones psico perceptivas que el cerebro utiliza dicha información para hacer algunas estimaciones cognitivas; como la estimación de la cercanía y presencia de otro individuo (HRTF). Dicho concepto es claramente trasladable a la aplicación en una mezcla de audio, donde los planos y la ecualización de un instrumento en esa zona le “sugiere” al oyente la misma información.


  • Se tocan cuestiones del equilibrio binaural, es decir, el cerebro “une” o “separa” los instrumentos de una mezcla según la relación de medios graves que conserven entre sí. Si otorgamos más energía general en esta región, vamos a percibir un audio más centrado y compacto, pero con menor dinámica y naturalidad. Por el contrario, si distribuimos dicha información tonal  entre distintos instrumentos, la mezcla será percibida como abierta, aireada e incluso con mayor ambiencia, donde se conserva la separación instrumental dado que cada instrumento posee su propia huella tímbrica.


  • La presión sonora en medios graves (carga tonal) es igualmente sensible, subir 2 dB en 200 ciclos tendrá un impacto más directo que subir 5 dB en 40 ciclos; esto se fundamenta teóricamente (en parte) en  las curvas isofónicas de Fletcher y Munson (1933).


De la teoría a la escucha…


  • Los modelos de Loudness de Moore y Glasberg (2006) que procesan todo el espectro, muestran que pequeños aumentos en medios-graves generan una subida perceptiva desproporcionada respecto al nivel  de presión sonora real. Esto ocurre porque (como ya mencionamos) esa banda tonal coincide con zonas donde el oído tiene alta integración temporal y espacial, por lo que se interpreta como cuerpo o masa sonora más que como simple nivel SPL.


  • Aquí la función de transferencia relacionada con la cabeza (HRTF) actúa mostrando que las longitudes de onda en medio-graves difractan alrededor de la cabeza del oyente en lugar de ser bloqueadas por ella (sombra acústica). Esto sucede porque, por ejemplo, a 300 ciclos la longitud de onda (λ) es de aproximadamente 1.14 metros, lo que es más grande que la distancia entre oídos (aprox. 17−20 cm).


  • Los transitorios de una señal de audio también encuentran aquí un punto de apoyo muy importante. Desde el punto de vista instrumental, un bombo de batería o un bajo generan más sensación de “presencia” aquí, que en el sub-low.

  • El fenómeno del enmascaramiento acústico también sucede aquí. A partir de modelos de excitación auditiva se confirma que el exceso de energía en dicha zona puede enmascarar armónicos de voz y detalles en la zona de presencia (2–4 kHz), dando como resultado un sonido cálido pero opaco si hay demasiada carga armónica en medios graves. Esto coincide con descripciones subjetivas como “embarrado” o “cerrado”.


Extra del editor…


Si nos desplazamos más abajo en el espectro entramos en la zona de los “graves”, donde damos con una problemática compartida en muchos home-studios que deriva, a menudo, de consecuencias comúnmente relacionadas con recintos que acústicamente han sido tratados incorrectamente o no poseen tratamiento. 

La siguiente medición la realice yo mismo en un control de monitoreo, y muestra claramente entre otras cosas, un exceso de energía en torno a los 125 ciclos, que seguramente es una resultante de la interacción de las dimensiones de la sala y longitudes de onda relativas a la misma.


No es de mi interés en este artículo entrar en cuestiones de acústica de salas, sino utilizar el gráfico para ejemplificar una buena oportunidad donde los auriculares pueden ser  nuestros aliados frecuenciales (siempre que midan correctamente) para ajustar la mezcla en una región tan delicada y necesaria, como ya vimos. 

Encontramos aquí, una aplicación práctica de los auriculares como herramienta de monitoreo tonal y de compresión dinámica.

By Gustavo González November 29, 2025
No descuides una parte crucial de tus auriculares!
By Pablo Rabinovich November 18, 2025
Decidí preparar este artículo porque he notado que muchas veces se da una confusión importante en cuanto a cuáles son las funciones del look-ahead y de los parámetros de envolventes en uno de los limitadores más reconocidos de la industria del audio profesional: FabFilter Pro-L2 Look-ahead, cuál es su rol en los procesadores dinámicos? El look-ahead es una técnica que le permite a un procesador dinámico “anticipar” su reacción ante señales transitorias. Se implementa dividiendo la entrada en dos copias: 1) Copia retardada: Se dirige al circuito que aplicará la modificación en la ganancia, desembocando en la salida de audio. 2) Copia sin retardo: alimenta el detector vía side-chain que se utiliza para medir el nivel y generar la señal de control. Como la señal de control se calcula sobre la copia sin retardo y luego se aplica a la señal retardada, el procesador consigue que la reducción de ganancia se inicie antes de que la transiente llegue al punto de salida. En la práctica equivale a un “tiempo de ataque negativo” porque el control puede empezar a actuar antes de que la transiente aparezca en la ruta de audio.  En el Pro-L2, este retardo interno establecido en milisegundos le permite al algoritmo anticipar picos y suavizar la reducción de ganancia evitando recorte abrupto de la señal. En la práctica, el look-ahead reduce artefactos intrínsecos a las variaciones muy veloces de ganancia, que suelen producir distorsión agregada. Sin look-ahead, para atrapar un pico necesitaríamos un ataque extremadamente rápido, y este tipo de reacción en un procesador dinámico, al implicar cambios de ganancia con pendientes muy pronunciadas, introduce nuevos componentes espectrales, ocasionando distorsión y “clicks”, lo que en el dominio digital puede producir intermodulación y aliasing. El look-ahead le permite al procesador moldear la etapa de ataque, empezando a reducir la ganancia antes de que la transiente aparezca, generando una pendiente efectiva menor para la misma atenuación, y de este modo reducir la distorsión. Envolventes: El Pro-L2 no divide la señal en ataque y sostenido, sino que divide la evaluación del nivel en componentes rápidos y lentos dentro del detector, generando una única envolvente de reducción de ganancia cuyo comportamiento temporal varía según el algoritmo ( Style ). De esa forma puede tratar transitorios y material sostenido de manera diferente, pero sin separar la señal en dos caminos. Pro-L2 utiliza detección híbrida (pico + envolvente) con componentes que atienden picos y componentes que siguen la envolvente RMS. La salida del detector se procesa para obtener el objetivo de ganancia. Esto afecta directamente el release efectivo. Attack: En el Pro-L2 este parámetro no funciona del mismo modo que en un compresor o un expansor. El parámetro de ataque en el Pro‑L2 define la duración de la etapa de transiente del algoritmo, determinando qué porciones del material se clasifican como transientes frente a sostenidos. En otras palabras, el attack define la ventana temporal de la transiente, no la velocidad de inicio de reducción. La asignación de un ataque corto le indica al limitador que la etapa de transiente es muy breve. Release: Operativamente, el release controla la velocidad con la que el limitador regresa a la ganancia unidad (reducción 0 dB) después de que la señal dejó de sobrepasar el umbral/ceiling. Es decir: determina la constante temporal con la que la señal de control (la ganancia aplicada) se recupera luego de un evento de reducción. Normalmente, los limitadores digitales suelen implementar el release aplicando un suavizado exponencial sobre la ganancia. El Pro-L2 implementa una etapa de liberación adaptativa dependiente del programa. En la práctica esto significa que el detector combina componentes de respuesta rápida para transitorios, y lenta ante una envolvente sostenida, para establecer la reducción necesaria. El tiempo efectivo de release varía según la magnitud y la duración de la reducción de ganancia: aumentos grandes de reducción suelen activar un release más largo. Asimismo, reducciones pequeñas o rápidas pueden liberarse más velozmente.
By Pablo Rabinovich November 14, 2025
Análisis sobre la distorsión de baja frecuencia en los compresores
By Gustavo González September 26, 2025
El monitoreo es una etapa crítica. La elección del auricular también.
comb filtering
By Pablo Rabinovich August 23, 2025
La importancia de las reflexiones en los pliegues de nuestras orejas
Neve 2254A
By Pablo Panitta August 8, 2025
Una leyenda que sigue sonando!
By Juan Benegas May 14, 2025
Estás pensando en ella. Lo sé. Muchos lo sabemos. Pensás todo el tiempo en ella. - “Que luzca bien, que suene bien, que sea la mejor”- Tenés la esperanza (casi inconfesable) de que esta vez va a superar la belleza que le diste a la anterior. Y.. sí…hubieron otras antes. Pero para vos es como si siempre hubiese sido la misma, la única, tu primer amor. Y no te queda otra que pensar siempre en ella. A mí me pasa lo mismo. Por eso sé que, aunque la llames siempre de diferente modo (porque se presenta a vos con nombres distintos) vos siempre reconocés que es ella. ¿Cómo podría ser otra? Ella, la que a veces se te arrima tímida pidiendo que le enfatices los graves o que le sustraigas (con mucha delicadeza) los medios. La que otras veces irrumpe pateando la puerta de tu estudio y arranca, sin aviso ni conteo previo, con una transiente que te obliga a arrancarte los auriculares de un solo manotazo. O ésa que se muestra como una bailarina de ballet hasta que una subsónica hace estallar los monitores que cuidabas como a dos órganos primordiales de tu propio cuerpo. No importa. Nada importa. Vos le mejorás el look, tanto si llega rockera, rapera, trapera, popera, metalera, tanguera…era… era…¡Era ella!. ¡Es ella! La que sostiene vivo a un mundo hecho de silencios (o de ruidos insoportables). ¡Y vos sos nada menos que el responsable involuntario de vestirla de gala, y aún de desvestirla cuando cierta ropa está demás y oculta sus mejores atributos! Cada mañana te sentás frente a tu PC, entre cables verdaderos y plugins que simulan ser reales y empezás tu tarea única, irremplazable: embellecerla hasta que suene espectacular, sin siquiera cuestionar el estado en que llegó a tus manos. Cuando promedia el día te decís: “Ésta es la mejor de todas”. Y es lógico que atesores esa esperanza, porque no siempre ella viene hasta vos como te gustaría. Como cuando sentís que te llegó sin alma, o peor aún, ¡que nació sin alma! y te ves obligado a adornar su cuerpo vacío, fantasmal: ¡un engendro que nunca debió haber sido! Pero está ahí para deprimirte… pero no. Aun así, surfeando entre umbrales que bajan y envolventes que se adaptan a la increíble ausencia de arte, vos te la ingeniás para ungirla con tu propia visión de lo artístico. Sabés que miles de personas la van a escuchar, la van a disfrutar en compañía, gracias a tus decisiones tomadas en perfecta y total soledad. Y nadie va a pensar en tus horas allí sentado, ni en tus filtros patovicas decidiendo quién pasará y quién no, ni en tus regimientos decompresores poniendo un techo a piquetes de coros enmascarados, ni en tus reverbs escapadas de catedrales góticas, latiendo sutilmente escondidas en el corazón de ella, como si te nombraran sin nombrarte, imponiendo tu sello indeleble sobre miles de oídos alegremente distraídos. Todos bailarán al ritmo de ella y (mal o bien) la cantarán, disfrutarán la fiesta mientras vos volvés a sentarte para recibirla una y otra vez, siempre distinta pero igual , y recomenzar tu tarea de hacedor de lo invisible, sabiendo que no podés quedarte clavado, inmóvil, que tenés que mejorar, avanzar, que tu trabajo no puede terminar espejándose en mezclas de referencia que “vendieron bien”, para que todo siga sonando igual, con las curvas de ecualización esperadas y que ella se repita y reproduzca al infinito según el gusto formateado y congelado de la sociedad o de la industria del ruido secuenciado. A veces también te preguntás “¿Lograré dar una pincelada nueva para que ella pueda seducir desde otro lugar?” Te contestás que sí, y entonces empezás de nuevo. Te sumergís buceando en un océano delimitadores y expansores, como buscando vislumbrar una isla no habitada, desconocida hasta el momento. Pero a veces te decís que no, y querés irte lejos, subirte a un camión de carga sin carga, oteando el otro horizonte, ése que se escapa a medida que avanzás, sólo para dilatar tu propia felicidad. Es cuando encendés la FM a la derecha de tu volante y de repente la escuchás. Sí, es ella, la que masterizaste el año pasado. Y suena tan bien que tu camión emprende una curva de 180 grados, llegando al borde mismo de la cancelación, para regresar otra vez a tu estudio, a la magia de ese sonido que nadie nunca vio, ni podrá ver jamás. Ahora estás terminando tu jornada de trabajo y ella está otra vez en el éter, renovada, entrelazándose entre la gente con su vestido nuevo, audible, intangible como siempre. Descubrís que, a pesar de todo, tu profesión, que creció hasta convertirse en oficio (sí, sabés que el oficio es la evolución de la profesión) es un raro privilegio, aún en un mundo sonoro en evidente decadencia. Emprendés el regreso a tu casa, tranquilo, porque aún existe ella, la que siempre podrá ser mejorada. Mientras caminás lento por la vereda solitaria y poco iluminada de la ciudad que nunca descansa, alguien, que te cruza por causalidad, puede ver la mueca de tu boca, la mueca inequívoca de que aún cansado y con tus ilusiones manoseadas no podés olvidarla. No podrás nunca. Que seguís pensando en ella. Como yo. Como tantos… Juan Benegas (poniéndole alma y piel a los decibeles)
By Pablo Panitta April 28, 2025
Batido en señales sub-Nyquist. ¿Qué onda?
Dither y Noise Shaping. Abordaje práctico
By Pablo Panitta April 5, 2025
Introducción: Al reducir la profundidad de bits de una señal digital (por ejemplo de 24 a 16), se producirá lo que se denomina “ruido de cuantización”. Esto es producto de realizar un “truncamiento” (sacar los 8 bits menos significativos) de la señal de 24 y así llegar a la de 16 bits. A fin de reducir los efectos adversos de este proceso, es que aplicamos una técnica llamada “Dithering”. Este artículo no intenta presentar la teoría detallada del proceso (que por cierto existe mucha bibliografía al respecto), sino darle un abordaje más práctico, el cual es un poco más difícil de encontrar. Dither. Un poco de teoría. Ya dijimos que el “ ruido de cuantización ” es un efecto que aparece luego de haber reducido la cantidad de bits a través del truncado de la señal. La forma de minimizar este ruido de cuantización es a través del proceso de Dithering , el cual es simplemente el agregado de ruido blanco (aleatorio y uniformemente distribuido) a la señal original, antes de la reducción. ¿Agrego ruido blanco para eliminar “ruido de cuantización”? Esto no parece tener mucho sentido. Y es verdad, en una primera lectura esto no parece ser un proceso muy útil. La realidad es que el llamado “ ruido de cuantización ” no es un ruido como tal, sino más bien una distorsión .  Por definición, para que una señal sea considerada como ruido, debe ser aleatoria y, por lo tanto, no debe estar relacionada (correlacionada) con otras variables. Y resulta ser que el ruido de cuantización, si lo está, y su relación es con el nivel de la señal a cuantizar. Por lo tanto, lo que buscamos con proceso de Dithering es cambiar distorsión por ruido . ¿Y por qué esto sería un buen cambio? Bueno, resulta que la psicoacústica humana tolera mejor el ruido que la distorsión . Esta última resulta mucho más molesta y distractiva que el ruido en sí mismo. ________________________________ *1 Importante: El presente trabajo no constituye ninguna representación, recomendación o preferencia hacia ninguna marca o modelo mencionado. No se realiza un ranking de mejor o peor funcionamiento, sino solamente se exponen los resultados. *2 El agregado de ruido a la señal a recuantizar hace decorrelacionar el error de cuantización del nivel de señal, y por lo tanto lo transformamos en verdaderamente ruido en vez de distorsión. Dither. La práctica. A continuación se presentan los resultados de mediciones realizadas con una señal de 24-bits 997Hz a 2LSB (least significant bits) a la que se ha procesado con distintos plugins o DAWs, para convertirla a 16-bits. Como se mencionó anteriormente, con el proceso intentamos bajar la distorsión a costa de un mayor ruido, y por lo tanto podemos medir parámetros relacionados con estos fenómenos, a saber: TD (Total Distortion) y SNR (Signal to Noise Ratio).
A man wearing headphones is sitting in front of two computer monitors.
By Carlos Richter March 27, 2025
Cuál es la relación entre el DAW que utilizás y los recursos de tu computadora?
Más Artículos