.

Recuerdo que hace un par de años veía un texto donde se exponían distintas maneras matematicas de buscar música similar y ahora me vuelve a la cabeza al toparme, de nuevo vía Hacker News, con un artículo titulado «Are Hit Songs Becoming Less Musically Diverse?». Más allá de lanzar la pregunta al aire, o de limitarse a especular u opinar, se propusieron establecer alguna manera de medir la diversidad musical, para lo que buscaron una muestra suficientemente bien definida.

Uno de estos conjuntos de datos es el Music Genome Project, el motor que impulsa Pandora. Estos datos los producen analistas musicales, quienes puntúan las canciones sobre cuatrocientos atributos que incluyen el género, las voces, el ritmo, la clave y los instrumentos. Con estos datos se pueden hacer hacer agrupaciones y comparaciones, como la que ponen de ejemplo (el del artículo ofrece información adicional al pasar el ratón por los distintos elementos):

Uso de sintetizadores en los temas más vendidos en los EE.UU. entre los años 1979 y 1986.

En el artículo señalan que, si bien la prevalencia de sintetizadores podría ser un indicador fuerte de similitud, la comparación entre canciones individuales revela diferencias evidentes con lo que este análisis no es suficiente. Una valoración más completa requeriría evaluar de forma ponderada los cientos de atributos del conjunto de datos.

Por suerte y conveniencia, esa agrupación ponderada es justo lo que hace The Echo Nest, una plataforma propiedad de Spotify. Como ventaja adicional, los datos de EchoNest son públicos, a diferencia de los del Music Genome Project. Sumando los cuadrados de las diferencias entre canciones de ocho parámetros de EchoNest se puede establecer, a priori, un criterio de similitud/diferencia:

Cálculo de similitud y diferencia de los temas más vendidos en los EE.UU. entre los años 1982 y 1986.

De nuevo, en el artículo se puede jugar con la tabla, seleccionando los intervalos de años y escuchando muestras de los temas.

Con este cálculo hacen una comparación de la similitud de los éxitos musicales entre 1958 y 2016 para ver si se puede observar alguna tendencia en las medidas. Además ofrecen algún dato adicional sobre las tendencias musicales en general, tanto de gustos como de composición y producción, para quizás explicar los resultados obtenidos.

Hay más artículos, igual de bien presentados, para los que se queden con ganas de explorar otras facetas de este asunto. Uno de ellos, «Are Pop Lyrics Getting More Repetitive?», plantea medir medir la de repetitividad de las letras de las canciones por el grado de compresión sin pérdidas que se le puede aplicar. Empiezan el texto con una mención a «The Complexity of Songs», de donde sale el Primer Lema de Knuth que mencionaba por aquí hace una temporada.

.

Donald Knuth publicó en 1977 “The Complexity of Songs” en la que postula que nuestros ancestros inventaron el concepto de estribillo para reducir la complejidad de las canciones, algo crucial cuando se tienen que memorizar un gran número de ellas. El Primer Lema de Knuth demuestra que si una canción de longitud N entonces el estribillo reduce la complejidad de la canción a cN, donde el factor c < 1.

Knuth demuestra además una forma de producir canciones de complejidad — en notación de LandauO(√N), un método mejorado por un granjero escocés llamado O. MacDonald. Métodos más ingeniosos producen canciones de complejidad O(log N), una clase conocida como m botellas de cerveza en el muro.

Finalmente, durante el siglo XX — estimulado por el hecho de que el advenimiento de drogas modernas ha llevado a requisitos de aún menos memoria — lleva a la mejora definitiva: canciones arbitrariamente largas con complejidad O(1), por ejemplo, para una canción definida por la relación de recurrencia:

S0=ε, Sk = VkSk-1, k ≥ 1,
Vk = ‘That’s the way,’ U ‘I like it,’U, ∀ k ≥ 1
U = ‘uh huh,’ ‘uh huh’

El texto completo se puede leer en este enlace y, aunque se trata de un chiste, como en muchas cosas en la vida, nos reímos porque es gracioso y nos reímos porque es verdad, que diría De Niro haciendo de Capone.

Dado que este «análisis» parece versar sobre las letras de las canciones resultaría curioso hacer lo mismo para la música. Con instrumentos como esta herramienta de Hooktheory para buscar canciones con los mismos acordes uno se siente tentado de replicar los resultados de como los observados por estudiosos como Axis of Awesome.