La diversidad musical en las canciones con más ventas

Recuerdo que hace un par de años veía un texto donde se exponían distintas maneras matemáticas de buscar música similar y ahora me vuelve a la cabeza al toparme, de nuevo vía Hacker News, con un artículo titulado «Are Hit Songs Becoming Less Musically Diverse?». Más allá de lanzar la pregunta al aire, o de limitarse a especular u opinar, se propusieron establecer alguna manera de medir la diversidad musical, para lo que buscaron una muestra suficientemente bien definida.

Uno de estos conjuntos de datos es el Music Genome Project, el motor que impulsa Pandora. Estos datos los producen analistas musicales, quienes puntúan las canciones sobre cuatrocientos atributos que incluyen el género, las voces, el ritmo, la clave y los instrumentos. Con estos datos se pueden hacer hacer agrupaciones y comparaciones, como la que ponen de ejemplo (el del artículo ofrece información adicional al pasar el ratón por los distintos elementos):

Uso de sintetizadores en los temas más vendidos en los EE.UU. entre los años 1979 y 1986.

En el artículo señalan que, si bien la prevalencia de sintetizadores podría ser un indicador fuerte de similitud, la comparación entre canciones individuales revela diferencias evidentes con lo que este análisis no es suficiente. Una valoración más completa requeriría evaluar de forma ponderada los cientos de atributos del conjunto de datos.

Por suerte y conveniencia, esa agrupación ponderada es justo lo que hace The Echo Nest, una plataforma propiedad de Spotify. Como ventaja adicional, los datos de EchoNest son públicos, a diferencia de los del Music Genome Project. Sumando los cuadrados de las diferencias entre canciones de ocho parámetros de EchoNest se puede establecer, a priori, un criterio de similitud/diferencia:

Cálculo de similitud y diferencia de los temas más vendidos en los EE.UU. entre los años 1982 y 1986.

De nuevo, en el artículo se puede jugar con la tabla, seleccionando los intervalos de años y escuchando muestras de los temas.

Con este cálculo hacen una comparación de la similitud de los éxitos musicales entre 1958 y 2016 para ver si se puede observar alguna tendencia en las medidas. Además ofrecen algún dato adicional sobre las tendencias musicales en general, tanto de gustos como de composición y producción, para quizás explicar los resultados obtenidos.

Hay más artículos, igual de bien presentados, para los que se queden con ganas de explorar otras facetas de este asunto. Uno de ellos, «Are Pop Lyrics Getting More Repetitive?», plantea medir medir la de repetitividad de las letras de las canciones por el grado de compresión sin pérdidas que se le puede aplicar. Empiezan el texto con una mención a «The Complexity of Songs», de donde sale el Primer Lema de Knuth que mencionaba por aquí hace una temporada.