ANÁLISE DA SIMILARIDADE DE GÊNEROS MUSICAIS BRASILEIROS UTILIZANDO WEB SCRAPING E MINERAÇÃO DE TEXTOS NO R

Autores

  • Luiz Fernando Guilhem Nassif Maia
  • Alinne de Carvalho Veiga
  • Renata Souza Bueno

Resumo

A música é uma das formas de arte mais importantes para o ser humano, em especial para o povo brasileiro. A música brasileira é muito diversificada visto que sofre influências de diversas culturas como a europeia, a indígena, a africana e a americana.
Este trabalho se propõe a verificar quais as principais palavras que diferenciam cada estilo musical brasileiro e quais os gêneros que mais se assemelham em relação às letras de suas músicas.
Para isso, foi montado um banco de dados utilizando Web Scraping, uma técnica de extração de dados da internet pela leitura de códigos HTML. Inicialmente, foram considerados treze estilos musicais diferentes e coletou-se dados como nome da música, dos cantores e letra da música para mil músicas de cada estilo.
Técnicas de processamento de texto comumente utilizadas em mineração de texto como remoção de stop words e stemização foram utilizadas. Além disso, para cada palavra em cada estilo musical foi calculada a medida tf-idf (JONES, 1972). Finalmente, foi computada a medida de similaridade do cosseno (ARAÚJO NETO e NEGREIROS, 2017) para cada gênero musical levando em conta os valores do tf-idf e foi realizada uma análise de agrupamentos com essa similaridade.

Downloads

Não há dados estatísticos.

Downloads

Publicado

2019-07-02