.

Recuerdo que hace un par de años veía un texto donde se exponían distintas maneras matematicas de buscar música similar y ahora me vuelve a la cabeza al toparme, de nuevo vía Hacker News, con un artículo titulado «Are Hit Songs Becoming Less Musically Diverse?». Más allá de lanzar la pregunta al aire, o de limitarse a especular u opinar, se propusieron establecer alguna manera de medir la diversidad musical, para lo que buscaron una muestra suficientemente bien definida.

Uno de estos conjuntos de datos es el Music Genome Project, el motor que impulsa Pandora. Estos datos los producen analistas musicales, quienes puntúan las canciones sobre cuatrocientos atributos que incluyen el género, las voces, el ritmo, la clave y los instrumentos. Con estos datos se pueden hacer hacer agrupaciones y comparaciones, como la que ponen de ejemplo (el del artículo ofrece información adicional al pasar el ratón por los distintos elementos):

Uso de sintetizadores en los temas más vendidos en los EE.UU. entre los años 1979 y 1986.

En el artículo señalan que, si bien la prevalencia de sintetizadores podría ser un indicador fuerte de similitud, la comparación entre canciones individuales revela diferencias evidentes con lo que este análisis no es suficiente. Una valoración más completa requeriría evaluar de forma ponderada los cientos de atributos del conjunto de datos.

Por suerte y conveniencia, esa agrupación ponderada es justo lo que hace The Echo Nest, una plataforma propiedad de Spotify. Como ventaja adicional, los datos de EchoNest son públicos, a diferencia de los del Music Genome Project. Sumando los cuadrados de las diferencias entre canciones de ocho parámetros de EchoNest se puede establecer, a priori, un criterio de similitud/diferencia:

Cálculo de similitud y diferencia de los temas más vendidos en los EE.UU. entre los años 1982 y 1986.

De nuevo, en el artículo se puede jugar con la tabla, seleccionando los intervalos de años y escuchando muestras de los temas.

Con este cálculo hacen una comparación de la similitud de los éxitos musicales entre 1958 y 2016 para ver si se puede observar alguna tendencia en las medidas. Además ofrecen algún dato adicional sobre las tendencias musicales en general, tanto de gustos como de composición y producción, para quizás explicar los resultados obtenidos.

Hay más artículos, igual de bien presentados, para los que se queden con ganas de explorar otras facetas de este asunto. Uno de ellos, «Are Pop Lyrics Getting More Repetitive?», plantea medir medir la de repetitividad de las letras de las canciones por el grado de compresión sin pérdidas que se le puede aplicar. Empiezan el texto con una mención a «The Complexity of Songs», de donde sale el Primer Lema de Knuth que mencionaba por aquí hace una temporada.

.

Llego vía Hacker News a un artículo sobre lo que significa afinar una batería. El texto está en la web de los fabricantes de Resotune, un afinador electrónico de baterías, y lo firma John Roberts.

A pesar de no haber afinado una batería en mi vida el contenido me pareció bastante interesante. En mi limitado trato con la física de la música, había visto con brevedad previamente el tema de los sobretonos, pero no había dedicado tiempo a pensar en el análisis de las vibraciones de una membrana circular como modelo del parche de una batería. La parte matemática del asunto me cuesta aunque, afortundamente, hay una serie de ilustraciones realizadas por Oleg Alexandrov con MATLAB que representan gráficamente algunos modos de vibración de un parche ideal:

Claro que un tambor es algo más complejo que una membrana. Eso no ha detenido a un grupo de la Universidad de Edimburgo a la hora de plantear la posibilidad de sintetizar sonidos (entre ellos, de instrumentos de percusión) a partir de su modelado físico. El proyecto académico NESS ha finalizado hace unos meses pero dentro de sus modelos incluyeron uno de percusión.

Modelo del proyecto NESS de una caja con sus distintos componentes.

.

Llego vía Hacker News a «Combinatorial Music Theory», un texto de Andrew Duncan inicialmente publicado en el volumen 39 del Journal of the Audio Engineering Society en junio de 1991, que no sé si incluye las correcciones publicadas en octubre de ese mismo año en la misma publicación. En cualquier caso, la sinopsis del artículo original es suficientemente interesante para mí:

Musical patterns may be investigated with the mathematical tools more commonly applied in science and engineering. For example, the cyclic autocorrelation of a musical scale describes its interval content. Fingering patterns on string instruments are embedded in a space with an unusual topology. Ideas from crystallography may be applied to the description of structure-preserving transformations of melodies. These phenomena are explored for the particularly common case of the twelve-note equally tempered scale.

Y es que la relación entre matemáticas y música es incuestionable, como se puede leer en este extracto de una entrevista de Fred Stuckey a Chuck Berry para Guitar Player en 1971:

In fact—you won’t believe it—but my biggest influence was my mathematics teacher. Music is so much mathematics that it’s pathetic.

La disciplina en la que se puede etiquetar el texto del señor Duncan se denomina combinatoriality, y mis conocimientos lingüísticos y matemáticos son lo suficientemente limitados como para no saber si existe un término adecuadamente equivalente en español (¿combinabilidad?). Para los disminuidos matemáticos como yo, ayuda que el artículo esté acompañado de gráficos ilustrativos de los conceptos que describe.

El grafo anterior, que el autor denomina H12, representa la topología discreta o conectividad del diapasón de una guitarra. Dado que los vértices están numerados se pueden establecer los sentidos ascendente y descendente y, por lo tanto, el grafo tiene al menos direccionalidad implícita.

Todo este estudio ha tenido como fruto el Z-Board, un controlador MIDI que bien podría haber incluido (de haberlo conocido) en entradas como la de teclados alternativos.

.

Hace unos meses me apunté un enlace en Hacker News a un artículo sobre procesar letras de canciones consideradas jebi desde una perspectiva de lengua natural. El texto da suficientes explicaciones como para hacerse una idea del análisis realizado de los datos y, de acuerdo con el título, es una primera parte de una serie de artículos.

Tiene bastantes curiosidades, como el gráfico anterior representando la fracción de palabrotas frente al índice SMOG por canciones de cada grupo, o el conjunto de palabras «menos metálicas», que es toda una tentación si se quiere un desafío para escribir una canción de este estilo.

Me pregunto si las agrupaciones que se esbozan se podrían considerar otro método matemático para buscar música similar.

.

Ben Frederickson, un desarrollador de software que vive en Vancouver, ha publicado un par de entradas en su blog sobre cómo calcular la similitud entre dos artistas en términos de distancia. Para ello hace uso de un conjunto de datos sacados de last.fm en 2008 para plantear y desarrollar distintos métodos.

En la primera entrada parte de un criterio de similitud sencillo: el número de usuarios que dos artistas tienen en común. Rápidamente identifica como problema que los grupos más populares los tendrán casi todos los usuarios, con lo que la métrica no resulta especialmente fiable. La solución más sencilla que propone es calcular el coeficiente de Jaccard, aunque también menciona el coeficiente de Sørensen–Dice y el coeficiente de Ochiai. Después explica cómo tratar el problema como uno geométrico, con sus beneficios y penalizaciones, para pasar a comentar y mostrar las ventajas de usar TF-IDF y, finalmente, Okapi BM25.

La segunda entrada se centra en el uso de factorización de matrices para reducir la dimensionalidad de los datos antes de calcular la similitud entre dos artistas. Partiendo de la descomposición en valores singulares para hacer análisis de semántica latente, pasa a explicar e implementar el método descrito en «Collaborative Filtering for Implicit Feedback Datasets».

Para el desarrollo ha usado python, acompañando los resultados de gráficos interactivos hechos con D3.js, lo que hace la lectura aún más interesante.