.

Si el otro día señalaba los chistes gráficos de Miguel Bustos, entre los que había más de un juego de palabras con personajes salidos de Los Simpson, ayer me topaba en Metal Injection con Springfield Albums, una colección de portadas de discos reinterpretadas o modificadas con habitantes de Springfield, de las que dejo una pequeña muestra a continuación:

Veremos si en algún momento hacen también la de «Abbey Road».

.
Covet - "parachute" (official video) []

.

No se puede decir que tenga un sentido del humor muy selectivo pero sí que tenga ciertas debilidades o preferencias humorísticas. Una de ellas son los juegos de palabras, especialmente los que están ilustrados, incluso aquellos que son muy tontos, como el del bonito del norte. Por eso me encantó encontrar los chistes malos de Miguel Bustos que publica en Instagram, como estos:

Me recuerda un poco a lo que publicaban hace años en humor tonto para gente inteligente.

.

Little Richard - Live in France 1966 []

.

Echando la vista atrás, hace tres años hice una primera mención por estos lares al modelo WaveNet de van den Oord et al.. Ahora me vuelvo con el trabajo de este integrante de Google DeepMind en Jukebox, una red neuronal que genera música, incluyendo canto rudimentario, como audio crudo en distintos géneros y estilos de artistas. [Además, han publicado] los pesos y el código del modelo, junto a una herramienta para explorar las muestras generadas.

Esquema del entrenamiento de tres VQ-VAE con resoluciones temporales diferentes. En cada nivel, el audio de entrada es segmentado y codificado en vectores latentes ht, que son cuantificados a los vectores del libro de códigos ezt más cercados. El código zt es una representación discreta del audio sobre la que posteriormente se entrena la previa. El descodificador toma la secuencia de vectores del libro de códigos y reconstruye el audio. El nivel superior aprende el grado más alto de abstracción, dado que está condificando audio más largo por token mientras el tamaño del libro de códigos se mantiene igual. El audio se puede reconstruir utilizando los códigos de cualquiera de los niveles de abstracción, donde los codigos de los niveles inferiores y menos abstractos producen el audio de mayor calidad.
Fuente: Jukebox: A Generative Model for Music

Recientemente vi una mención a modelos generativos VAE para síntesis de música leyendo sobre la I.A. que produce un ritmo a la batería a partir de cualquiera secuencia MIDI de entrada, pero sigo siendo bastante ignorante en lo que se refiere a todas estas tecnologías. Eso no quita (o quizás ayuda a) que me sigan pareciendo muy interesantes.