Talvez você já tenha dito por aí que “todas essas músicas parecem iguais”. Basta uma nova canção fazer sucesso e atingir o topo das paradas que, automaticamente, surge alguém dizendo que parece com aquela outra que, ironicamente, também foi um sucesso. Para descobrir se realmente uma música é “igual” à outra, dois estudantes pesquisadores da Universidade de São Francisco, na Califórnia, resolveram utilizar dados do Spotify nessa missão.
Os cientistas utilizaram a interface pública de programação de aplicativos do Spotify para criar quatro modelos de aprendizado de máquina capazes de prever se uma música pode se tornar ou não um sucesso. “Nosso objetivo era verificar se as músicas de sucesso tinham características semelhantes e, se sim, se essas características poderiam ser usadas para prever quais músicas seriam sucesso no futuro”, explicou Kai Middlebrook, um dos pesquisadores.
Ele e o colega Kian Sheik se concentraram em alguns aspectos das músicas, como ritmo, valência, acústica de energia, sonoridade e dançabilidade e o resultado foram quatro modelos.
Regressão logística: Neste modelo, uma música recebe um rótulo de 1, que indica que a música será um sucesso e 0, que indica que a música vai flopar. Cada recurso da música tem um peso que ajuda a prever o sucesso dela. Esses recursos são considerados rápidos e fáceis de serem interpretados e pode facilitar a compreensão das variáveis independentes (recursos da música) dos dependentes (acerto ou erro).
Arquitetura florestal aleatória: Neste modelo, os cientistas utilizam árvores de decisão para decompor os dados com perguntas objetivas de sim e não. No entanto, há a possibilidade de memorização dos dados de treinamento com ajuste muito de perto, o que significa que o modelo pode não estar detectando uma relação real entre os recursos e a popularidade da música, porque os dados, em geral, incluem uma informação irrelevante. Por isso, Middlebrook e Sheik construíram esse modelo para combinar centenas de milhares de árvores de decisão analisando subconjuntos diferentes, fazendo uma previsão calculando a média de cada árvore e combinando os resultados. Esses modelos são mais flexíveis do que os lineares, o que segundo Middlebrook é uma vantagem importante.
Máquina de vetores de suporte: esse modelo procura o “hiperplano” que separa melhor os dados em duas categorias.
Rede Neural: Neste modelo, é utilizada uma camada oculta com 10 filtros para aprender com os dados da música.
Cientistas planejam ampliar pesquisa
Os dois cientistas testaram os resultados obtidos com dados históricos da Billboard utilizando uma rede de computadores da Universidade de São Francisco para analisar os números. Todo o processo demorou semanas.
Eles descobriram que a “máquina de vetores de suporte” tinha a maior taxa de precisão de acertos, chegando a impressionantes 99,53%. A menor taxa ficou com o modelo de “floresta aleatória”, com 88%. Para Middlebrook, se as gravadoras utilizassem esse método de análise para lançar uma música, teriam uma decisão comercial mais sólida.
Depois de concluir que é possível prever se uma música será sucesso com base em análises de seu áudio, a dupla pretende analisar outros fatores que podem contribuir com o sucesso de uma música, como experiência do artista, presença nas mídias sociais e influência da gravadora.