---
title: "Espectrograma"
slug: espectrograma
definition: "Representación visual tridimensional de una señal de audio que muestra cómo evoluciona el espectro de frecuencias a lo largo del tiempo, con la intensidad codificada en color o escala de grises."
synonyms: ["spectrogram", "sonograma", "mel-espectrograma", "STFT magnitude"]
publishedAt: 2026-06-21
---
Un **espectrograma** es el resultado de aplicar la *Short-Time Fourier Transform* (STFT) a una señal de audio: se corta la grabación en ventanas cortas y superpuestas, se calcula la FFT de cada una y se apilan los espectros resultantes. El eje horizontal representa el tiempo, el eje vertical la frecuencia y la intensidad de cada punto —el color o el brillo— representa cuánta energía hay en esa frecuencia en ese instante.

Esta representación es la entrada más habitual para los modelos de aprendizaje automático en MIR y AMT. Una nota musical aparece en el espectrograma como una línea horizontal brillante a la frecuencia fundamental, acompañada de líneas más tenues en sus armónicos. Los transitorios de ataque —el golpe inicial de una nota de gaita, por ejemplo— se ven como columnas verticales de energía repartida en muchas frecuencias a la vez.

Una variante muy utilizada es el **mel-espectrograma**, que redistribuye el eje de frecuencias según la escala mel —una escala perceptiva que comprime las frecuencias altas, donde el oído humano discrimina menos—. Los modelos de reconocimiento de voz, separación de fuentes y AMT suelen preferirlo sobre el espectrograma lineal porque su representación se ajusta mejor a cómo percibimos los cambios de tono.

En la práctica, cuando se analiza una grabación de gaita asturiana para transcripción automática, el espectrograma es la primera imagen que se genera: permite verificar visualmente si las notas son visibles, si hay ruido de fondo relevante y cómo interactúan el punteiro y el roncón en la señal.
