Tever
ES

Definición

Transcripción automática de música (AMT)

También conocido como: AMT · automatic music transcription · transcripción automática

Proceso computacional que convierte una señal de audio musical en representación simbólica —partitura, MIDI o tablatura— mediante algoritmos de análisis espectral y aprendizaje automático.

La transcripción automática de música (AMT, del inglés automatic music transcription) es el problema de conseguir que un ordenador escuche una grabación y devuelva una representación simbólica de lo que suena: qué notas se tocan, cuándo empieza y termina cada una, con qué instrumento. La salida habitual es un archivo MIDI o una partitura en formato MusicXML.

El problema parece sencillo para el oído humano, pero resulta muy difícil para una máquina. La razón principal es la polifonía: cuando varias notas suenan a la vez, sus armónicos se mezclan en una sola onda y separarlas requiere descomponer el espectro con herramientas como la transformada de Fourier. A eso se suman el timbre (el mismo Do suena distinto en un piano y en una gaita), el ruido de fondo y las variaciones de tempo que los intérpretes humanos introducen de manera natural.

La investigación doctoral que lleva adelante Tever Díaz García en este sitio aborda AMT sobre un corpus de gaita asturiana —un instrumento con afinación no temperada y comportamiento acústico particular—, lo que añade dificultad adicional respecto a los benchmarks estándar construidos sobre piano. El trabajo combina análisis espectral clásico con modelos de aprendizaje automático entrenados sobre grabaciones anotadas manualmente.

La AMT es también la puerta de entrada a otras tareas de Music Information Retrieval: una vez se tiene la representación simbólica, es posible hacer análisis armónico, recuperación por similitud o generación de nuevas piezas.