martes, 6 de abril de 2010

Metadatos en los archivos de audio

Un problema que surgió a mediados de los 90 cuando empezaron a utilizarse archivos de audio digitalizado como MP3 es la inclusión en estos de metadatos. Estos son "datos sobre los datos", es decir, información sobre los datos contenidos en el archivo. En el caso que nos ocupa se trataría de información relevante sobre la canción o grabación de audio que contiene el archivo como el autor, el título, el año de publicación, el álbum al que pertenece, etc.

El formato de archivo MP3 no se preocupaba originalmente de estas cuestiones, pero pronto surgió un "convenio no oficial" bautizado como ID3 que permitía almacenar información sobre el audio usando etiquetas que se añadían al propio archivo sin afectar a su funcionamiento.


La primera versión de ID3 (conocida como ID3v1) simplemente añadía al final del archivo 128 bytes comenzando por la cadena de texto "TAG" e incluyendo una serie de campos de un máximo de 30 bytes donde se podían almacenar los caracteres ASCII correspondientes a los distintos datos sobre la canción. Una mejora posterior (llamada ID3v1.1) permitió almacenar también el número de pista sacrificando dos bytes del campo comment ya existente.



Debido a las limitaciones en el tamaño y la codificación de los metadatos de ID3, unos años después se creó una nueva versión conocida como ID3v2, aunque poco tiene que ver con la anterior. Ahora la información se coloca al principio del archivo para favorecer el streaming e incluye un montón de etiquetas de tamaño variable y con soporte Unicode que lo hacen más flexible e internacional.



Aunque hay distintas versiones y extensiones del estándar que permiten almacenar incluso imágenes con la portada del disco, la versión más ampliamente soportada hasta el momento es ID3v2.3, ya que Windows Media Player (al menos hasta la versión 12) no soporta la 2.4 a pesar de ser más conveniente y llevar definida casi 10 añitos (una vez más Microsoft lidera la adopción de estándares ;) La web oficial de ID3 puede ser de interés para profundizar en el asunto...

Otros formatos de audio posteriores a MP3 como Vorbis y FLAC tienen su propia forma de incluir metadatos, conocida como Vorbis comment.

Aunque algunos reproductores multimedia como foobar2000 soportan la edición de los metadatos de las canciones, hay programas especializados que facilitan mucho las cosas a la hora de etiquetar grandes cantidades de archivos:
  • En Windows destaca MP3TAG, que apesar de su nombre soporta muchos otros formatos de audio y va cargado con todas las opciones imaginables a la hora de trabajar con los metadatos.
  • En Linux existe una aplicación similar aunque algo menos potente llamada EasyTAG, fácilmente instalable desde los repositorios oficiales de las principales distribuciones.
Estos programas, así como los rippers o extractores de audio de CD, suelen ser capaces de identificar los archivos de audio, consultar sus metadatos en servidores como freedb.org y añadírselos por nosotros con la comodidad que ello supone (más sobre estos asuntos en un futuro post).

En otra próxima entrega haré un repaso de algunas utilidades de consola disponibles en Linux que permiten trabajar con estos metadatos de los archivos de audio y que abren la puerta a cualquier otra operación no soportada por EasyTAG (u otros programas basados en GUI) mediante su inclusión en shell scripts de fabricación casera ;-)