Proposta de base de dados para classificação automática de gêneros musicais brasileiros
Automatic brazilian music genres classification: a database proposal
Propuesta de base de datos para clasificación automática de géneros musicales brasileños
Paulo Sérgio da Conceição Moreira
PPGGI/UFPR
Brasil
Denise Fukumi Tsunoda
PPGGI/UFPR
Brasil
Submetido em: 23/02/2021
Aceito em: 14/06/2021
Publicado em: 28/10/2021
Licença:
Autor para correspondência: Paulo Sérgio da Conceição Moreira
Email: psxm54@gmail.com
ORCID: https://orcid.org/0000-0002-3168-2177
Como citar este artigo:
MOREIRA, Paulo Sérgio da; TSUNODA, Denise Fukumi. Proposta de base de dados para classificação automática de gêneros musicais brasileiros. REBECIN, São Paulo, v. 8, edição especial, p. 1-13, 2021. DOI: 10.24208/rebecin.v8i.234.
RESUMO
Diante da quantidade de músicas disponíveis atualmente, classificar músicas manualmente é uma tarefa árdua. Neste sentido, a classificação automática de gêneros musicais é uma abordagem pertinente, auxiliando o processo de organização, pesquisa, recuperação e recomendação de músicas. Verifica que, apesar da existência de bases de dados tradicionais relacionadas à classificação de gêneros musicais, essas bases tendem a considerar gêneros tradicionais, como o Jazz e a Música Clássica, ignorando gêneros regionais, como os da cultura brasileira, por exemplo. Desse modo, o objetivo deste estudo é apresentar uma base de dados destinada à classificação automática de gêneros musicais brasileiros. Para tanto, utiliza o Spotify para identificar músicas relacionadas aos gêneros Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode e Samba. Como resultado, desenvolve uma base de dados com 1.907 registros relacionados a esses gêneros, e estabelece comparação entre esta e outras seis bases de dados, identificando que a base proposta supera quatro bases em número de registros e consiste na mais abrangente em relação ao total de gêneros considerados. Por fim, disponibiliza a base para novos estudos, e incentiva a sua aplicação em pesquisas que envolvam heurísticas de Mineração de Dados e Deep Learning.
Palavras-Chave: Base de Dados; Classificação de Gêneros Musicais; Gêneros Musicais; Música Brasileira; Recuperação de Informação Musical.
ABSTRACT
Due to the amount of music currently available, classifying songs manually is an arduous task. In this sense, automatic music genre classification is a pertinent approach, helping to organize, search, retrieve and recommend music. Although there are traditional databases related to the music genre classification, these databases only considered traditional genres, such as Jazz and Classical Music. Also, they ignore regional genres, such as those of Brazilian culture, for example. Thus, the objective of this study is to present a database for the automatic Brazilian music genres classification. For that, we used Spotify to identify music related to the genres Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode, and Samba. As a result, we developed a database with 1,907 records related to these genres, and compared this database with six other databases, identifying that the proposed base exceeds four bases in the number of records and consists of the most comprehensive about the total number of records genders considered. Finally, we provide the basis for further studies and encourage its application in research involving Data Mining and Deep Learning.
Keywords: Database; Music Genre Classification; Music Genres; Brazilian Music; Music Information Retrieval.
RESUMEN
Dada la cantidad de música disponible actualmente, clasificar la música manualmente es una tarea ardua. En este sentido, la clasificación automática de géneros musicales es un enfoque relevante, que ayuda al proceso de organizar, investigar, recuperar y recomendar música. Verifica que, a pesar de la existencia de bases de datos tradicionales relacionadas con la clasificación de géneros musicales, estas bases de datos tienden a considerar géneros tradicionales, como Jazz y Música Clásica, ignorando géneros regionales, como los de la cultura brasileña, por ejemplo. Así, el objetivo de este estudio es presentar una base de datos para la clasificación automática de los géneros musicales brasileños. Por ello, utiliza Spotify para identificar canciones relacionadas con los géneros Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode y Samba. Como resultado, desarrolla una base de datos con 1.907 registros relacionados con estos géneros, y hace una comparación entre esta y otras seis bases de datos, identificando que la base de datos propuesta supera las cuatro bases en número de registros y es la más completa en relación al total. de géneros considerados. Por último, proporciona la base para estudios adicionales y fomenta su aplicación en la investigación que involucre la heurística de la minería de datos y el aprendizaje profundo.
Palabras llave: Base de datos; Clasificación de géneros musicales; Géneros musicales; Música brasileña; Recuperación de información musical.
A quantidade de músicas disponíveis atualmente é um desafio para a recuperação de informações musicais (LIU et al., 2021; VISHNUPRIYA; MEENAKSHI, 2018; YU et al., 2020), de tal modo que organizar e classificar músicas manualmente é uma tarefa árdua (LIU et al., 2021; YANG et al., 2020). Nesse contexto, considerar o gênero musical para organizar, pesquisar, recuperar e recomendar músicas é uma abordagem pertinente (VISHNUPRIYA; MEENAKSHI, 2018; YANG et al., 2020; YU et al., 2020), uma vez que os usuários já manifestam suas preferências musicais em gêneros como Hip-Hop, Rock e Jazz, por exemplo (LIU et al., 2021; VISHNUPRIYA; MEENAKSHI, 2018).
Desse modo, a classificação automática de gêneros musicais surge como serviço crucial para os agentes inseridos no fornecimento e na distribuição de conteúdo musical (LIU et al., 2021), tendo o seu início no trabalho de Tzanetakis e Cook (2002) (AGUIAR; COSTA; SILLA JÚNIOR, 2020; VISHNUPRIYA; MEENAKSHI, 2018). Neste estudo, além da metodologia para a extração de características diretamente do áudio, os autores apresentaram a base de dados GTZAN (TZANETAKIS; COOK, 2002), uma das mais populares do tema.
Entretanto, na GTZAN, assim como em outras bases tradicionais, como a CODAICH (MCKAY; MCENNIS; FUJINAGA, 2005) e a desenvolvida por Homburg et al. (2005), predominam gêneros como Jazz e Música Clássica, ignorando, por exemplo, gêneros regionais, como os relacionados ao Brasil (SIMAS FILHO; BORGES JÚNIOR; FERNANDES JÚNIOR, 2018). Neste aspecto, portanto, o objetivo deste estudo é apresentar uma base de dados destinada à classificação automática de gêneros musicais brasileiros.
2 CONSTRUÇÃO DA BASE DE DADOS
As músicas que compõem a base deste estudo foram coletadas no dia 15 de março de 2021, diretamente de playlists do serviço de streaming Spotify[1]. No total, 1.907 registros formam a base proposta, e representam 11 gêneros musicais brasileiros, conforme a seguinte distribuição: a) Axé (179); b) Bossa Nova (154); c) Brega (184); d) Choro (95); e) Forró (228); f) Frevo (97); g) Funk Carioca (160); h) Maracatu (152); i) Música Sertaneja (249); j) Pagode (218); e k) Samba (191).
Em relação às características extraídas, empregou-se o conjunto fornecido pela Application Programming Interface (API) da plataforma Spotify[2] (QUADRO 1), tendo em vista a sua adoção em estudos semelhantes (FURINI, 2021; SANTANA et al., 2020). Entende-se, ainda, que esse conjunto atende aos critérios de Li, Ogihara e Li (2003), como a necessidade de utilizar informações abrangentes e que representem as músicas selecionadas, além de gerar um arquivo final que dispensa grande capacidade de armazenamento.
Quadro 1: conjunto de características extraídas
Característica |
Descrição |
Acousticness |
Medida para identificar se a faixa é acústica |
Danceability |
Representa o quão "dançante" é a faixa |
Duration_ms |
Duração em milissegundos da canção |
Energy |
Característica relacionada à intensidade da música |
Instrumentalness |
Prevê se a faixa não apresenta vocais |
Key |
Representa o tom da música. Por exemplo: 0 = C; 1 = C# etc. |
Liveness |
Verifica se a música foi gravada ao vivo |
Loudness |
Indica o volume geral da canção em decibéis (dB) |
Mode |
Representa o modo da faixa (1 = Maior; 0 = Menor) |
Speechiness |
Verifica o quão “falada” é a música |
Tempo |
Número estimado de batidas por minuto (BPM) da faixa |
Valence |
Descreve a positividade da música |
Fonte: Os autores (2021).
Para a etapa de extração, utilizou-se um script em Python empregando a biblioteca spotipy[3], que permitiu o acesso à API, possibilitando a coleta das informações mediante os endereços das playlists e dos respectivos perfis dos seus proprietários.
3 RESULTADOS E DISCUSSÃO
A base elaborada conta com 684 artistas diferentes, sendo a categoria “Vários Artistas” a mais comum (153). O gênero com mais artistas é a Bossa Nova (105); por sua vez, o Maracatu apresenta a menor quantidade (19). Para uma rápida visualização, os três artistas mais representativos de cada gênero, desconsiderando a categoria “Vários Artistas”, são elencados no Quadro 2.
Quadro 2: top 3 de artistas mais representativos de cada gênero
Gênero |
Artista (#) |
Axé |
Banda Eva (21), É O Tchan (17), Harmonia do Samba (13) |
Bossa Nova |
João Gilberto (12), Antônio Carlos Jobim (9), João Donato (6) |
Brega |
Banda Calypso (14), Reginaldo Rossi (7), José Augusto (6) |
Choro |
Pixinguinha (10), Waldir Azevedo (8), Jacob do Bandolim (7) |
Forró |
Luan Estilizado (10), Zé Vaqueiro (7), Danieze Santiago (7) |
Frevo |
Alçeu Valença (10), André Rio (9), Silvério Pessoa (5) |
Funk Carioca |
MC Marcinho (12), DJ Marlboro (9), MC Lipi (6) |
Maracatu |
Comadre Florzinha (24), Pandeiro do Mestre (20), Cordel do Fogo Encantado (17) |
Música Sertaneja |
Henrique & Juliano (14), Chitãozinho & Xororó (13), Gusttavo Lima (13) |
Pagode |
Pixote (12), Thiaguinho (10), Sorriso Maroto (9) |
Samba |
Zeca Pagodinho (12), Jorge Aragão (12), Beth Carvalho (11) |
Fonte: Os autores (2021).
Quanto às características extraídas, na Tabela 1 apresentam-se as estatísticas descritivas para as variáveis numéricas da base.
Tabela 1: estatísticas descritivas das características numéricas
Característica |
Mínimo |
Média |
Desvio Padrão |
Máximo |
Acousticness |
0,0001 |
0,4267 |
0,2575 |
0,9940 |
Danceability |
0,2170 |
0,6319 |
0,1285 |
0,9750 |
Duration_ms |
45.000 |
205.524 |
55.589 |
733.145 |
Energy |
0,0462 |
0,6706 |
0,1977 |
0,9940 |
Instrumentalness |
0,000 |
0,0585 |
0,2024 |
0,9610 |
Liveness |
0,0162 |
0,3126 |
0,2862 |
0,9950 |
Loudness |
-24,8640 |
-7,9065 |
3,6346 |
-0,1090 |
Speechiness |
0,0232 |
0,0835 |
0,0816 |
0,6830 |
Tempo |
49,9500 |
24,4100 |
27,9500 |
205,6200 |
Valence |
0,0749 |
0,7125 |
0,1939 |
0,9820 |
Fonte: Os autores (2021).
Concernente ao tom em que as músicas foram escritas, o mais comum é o Ré Maior (D), com 13,75% de canções. Em relação ao modo, 35,22% das faixas encontram-se no modo menor, enquanto 64,78% estão em modo maior. Finalmente, apresenta-se uma comparação entre a base de dados proposta e outras bases com gêneros brasileiros (QUADRO 3).
Quadro 3: comparação entre bases de dados com gêneros brasileiros
Base |
Gêneros |
# |
Autores |
Brazilian Music Database (BRMD) |
Axé, Bossa Nova, Forró, Rap, Sertanejo e Samba |
8.994 |
Pereira e Silla Júnior (2017) |
Latin Music Database (LMD) |
Axé, Bachata, Bolero, Forró, Gaúcha, Merengue, Pagode, Salsa, Sertaneja, Tango |
3.227 (1.565 de gêneros brasileiros) |
Silla J[unior, Koerich e Kaestner (2008) |
Este estudo |
Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode e Samba |
1.907 |
- |
Simas Filho, Borges Júnior e Fernandes Júnior |
Blues, Country, Forró, Hip-Hop, Jazz, Música Popular Brasileira (MPB), Música Clássica, Pop, Reggae, Rock, Samba e Soul |
1.008 (282 de gêneros brasileiros) |
Simas Filho, Borges Júnior. e Fernandes Júnior (2018) |
Volkël et al. |
Baião, Bolero, Bossa Nova, Cha-cha-cha, Samba-enredo, Mambo, Merengue, Pagode, Son |
376 (152 de gêneros brasileiros) |
Volkël et al. (2010) |
Brazilian Music Dataset (BMD) |
Forró, Rock, Repente, MPB, Brega, Sertanejo e Disco |
120 |
Souza, Pereira e Veloso (2016) |
Goulart et al. |
Axé, Bossa Nova, Forró e Samba |
80 |
Goulart et al. (2011) |
Fonte: Os autores (2021).
A base deste estudo supera as bases BMD e a de Goulart et al. (2011), tanto em número de registros, quanto em número de gêneros. As bases desenvolvidas por Simas Filho, Borges Júnior e Fernandes Júnior (2016), e por Volkël et al. (2010), além de apresentarem menos registros, são compostas por poucas músicas brasileiras. Em relação à LMD, ressalta-se que o total de ocorrências para gêneros tipicamente nacionais é inferior ao apresentado nesta pesquisa. Por fim, quanto à BRMD, esta apresenta menor número de gêneros (7x11), e não contempla - assim como as demais - músicas de Choro, Frevo, Funk Carioca e Maracatu.
4 CONSIDERAÇÕES FINAIS
Este estudo apresentou uma nova base de dados destinada à classificação de gêneros musicais brasileiros, contendo 1.907 registros, e que representam os gêneros Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode e Samba. O diferencial da proposta desta pesquisa é a presença de gêneros não explorados em outros estudos, mesmo esses utilizando bases maiores em termos de registros.
Em um primeiro momento, a base será anexada como material suplementar desta pesquisa, contudo, o próximo passo é disponibilizá-la em um repositório de dados científicos, como a Base de Dados Científicos da Universidade Federal do Paraná (BDC/UFPR), para que pesquisadores possam empregá-la em seus estudos.
Dentre as limitações da pesquisa, é preciso mencionar que: a) as características extraídas são apenas as fornecidas pela API do Spotify; b) não há padronização na duração das músicas, sendo considerada a duração total de cada música; e c) não é possível reduzir possíveis vieses quanto à classificação das músicas de acordo com os gêneros, uma vez que esta é determinada pelo Spotify ou pelos seus usuários.
Finalmente, como trabalhos futuros, incentiva-se o uso da base proposta em estudos destinados à classificação automática de gêneros musicais, aplicando heurísticas de Mineração de Dados e arquiteturas de Deep Learning para essa tarefa. Além disso, almeja-se expandir a quantidade de registros e características, acrescentando, por exemplo, o conteúdo das letras das canções.
REFERÊNCIAS
AGUIAR, R. L.; COSTA, Y. M. G.; SILLA JÚNIOR, C. N. Exploring data augmentation to improve music genre classification with ConvNets. In: INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 29., 2018, Rio de Janeiro. Proceedings [...]. Rio de Janeiro: IEEE, 2018, p. 1-8. Disponível em: https://doi.org/10.1109/IJCNN.2018.8489166. Acesso em: 17 mar. 2021.
FURINI, M. automatic music playlist generation based on music-programming of FM radios. In: ANNUAL CONSUMER COMMUNICATIONS & NETWORKING CONFERENCE (CCNC), 18., 2021, Las Vegas. Proceedings [...]. Las Vegas: IEEE, 2021, p. 1-4. Disponível em: https://doi.org/10.1109/CCNC49032.2021.9369526. Acesso em: 18 mar. 2021.
GOULART, A. J. H. et al. Music genre classification based on entropy and fractal lacunarity. In: IEEE INTERNATIONAL SYMPOSIUM ON MULTIMEDIA, 14., 2011, Dana Point. Proceedings [...]. Dana Point: IEEE, 2011, p. 533-536. Disponível em: https://doi.org/10.1109/ISM.2011.94. Acesso em: 19 mar. 2021.
HOMBURG, H. et al. A benchmark dataset for audio classification and clustering. In: INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 6., 2005, Londres. Proceedings [...]. Londres: ISMIR, 2005, p. 528-531. Disponível em: https://archives.ismir.net/ismir2005/paper/000117.pdf. Acesso em: 17 mar. 2021.
LI, T.; OGIHARA, M.; LI, Q. A comparative study on content-based music genre classification. In: ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMAION RETRIEVAL, 26., 2003, Toronto. Proceedings [...] . Toronto: ACM, 2003, p. 282-289. Disponível em: https://doi.org/10.1145/860435.860487. Acesso em: 18 mar. 2021.
LIU, C. et al. Bottom-up broadcast neural network for music genre classification. Multimedia Tools and Applications, v. 80, n. 5, p. 7313-7331, fev. 2021. Disponível em: https://doi.org/10.1007/s11042-020-09643-6. Acesso em: 17 mar. 2021.
MCKKAY, C.; MCENNIS, D.; FUJINAGA, I. A large publicly accessible prototype audio database for music research. In: INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 7., 2006, Victoria. Proceedings [...]. Victoria: ISMIR, 2006, p. 1-4. Disponível em: http://www.music.mcgill.ca/~cmckay/NEMA/publications/ISMIR_2006_Codaich_jMusicMetaManager.pdf. Acesso em: 17 mar. 2021.
PEREIRA, R. M.; SILLA JR., C.N. Using simplified chords sequences to classify songs genres. In: IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND Expo (ICME), 18., 2017, Hong Kong. Proceedings [...]. Hong Kong: IEEE, 2017, p. 1446-1451. Disponível em: https://doi.org/10.1109/ICME.2017.8019531. Acesso em: 18 mar. 2021.
SANTANA, I. A. P. et al. Music4All: a new music database and its applications. In: INTERNATIONAL CONFERENCE ON SYSTEMS, SIGNALS AND IMAGE PROCESSING (IWSSIP), 27., 2020, Niterói. Proceedings [...] . Niterói: IEEE, 2020, p. 399-404. Disponível em: https://doi.org/10.1109/IWSSIP48289.2020.9145170. Acesso em: 18 mar. 2021.
SILLA JÚNIOR, C. N.; KOERICH, A. L.; KAESTNER, C. A.A. The latin music database. In: INTERNATIONAL CONFERENCE ON MUSIC INFORMATION RETRIEVAL, 9., 2008. Filadélfia. Proceedings [...]. Filadélfia: ISMIR, 2008. p. 451-456. Disponível em: https://archives.ismir.net/ismir2008/paper/000106.pdf. Acesso em: 17 mar. 2021.
SIMAS FILHO, E. F.; BORGES JÚNIOR, E. A.; FERNANDES JÚNIOR, A. C. L. Genre classification for brazilian music using independent and discriminant features. Journal of Communication and Information Systems, v. 33, n. 1, maio 2018. Disponível em: https://jcis.emnuvens.com.br/jcis/article/view/515. Acesso em: 17 mar. 2021.
TZANETAKIS, G.; COOK, P. Musical genre classification of audio signals. IEEE Transactions on Speech and Audio Processing, v. 10, n. 5, p. 293-302, nov. 2002. Disponível em: https://doi.org/10.1109/TSA.2002.800560. Acesso em: 17 mar. 2021.
VISHNUPRIYA, S.; MEENAKSHI, K. Automatic music genre classification using Convolution Neural Network. In: INTERNATIONAL CONFERENCE ON COMPUTER COMMUNICATION AND INFORMATICS (ICCCI), 7., 2018, Coimbatore. Proceedings [...] . Coimbatore: IEEE, 2018. p. 1-4. Disponível em: https://doi.org/10.1109/ICCCI.2018.8441340. Acesso em: 17 mar. 2021.
VÖLKEL, T. et al. Automatic genre classification of Latin American music using characteristic rhythmic patterns. In: AUDIO MOSTLY CONFERENCE: A CONFERENCE ON INTERACTION WITH SOUND, 5., 2010, Piteå. Proceedings [...]. Piteå: ACM, 2010. p. 1-7. Disponível em: https://doi.org/10.1145/1859799.1859815. Acesso em: 19 mar. 2021.
YANG, R. et al. Parallel recurrent convolutional neural networks-based music genre classification method for mobile devices. IEEE Access, v. 8, p. 19629-19637, jan. 2020. Disponível em: https://doi.org/10.1109/ACCESS.2020.2968170. Acesso em: 17 mar. 2021.
YU, Y. et al. Deep attention based music genre classification. Neurocomputing, v. 372, p. 84-91, jan. 2020. Disponível em: https://doi.org/10.1016/j.neucom.2019.09.054. Acesso em: 17 mar. 2021.
[1] Disponível em: https://www.spotify.com/br/. Acesso em: 13 mar. 2021.
[2] Disponível em: https://developer.spotify.com/documentation/web-api/quick-start/. Acesso em: 13 mar. 2021.
[3] Disponível em: https://spotipy.readthedocs.io/en/2.17.1/. Acesso em: 13 mar. 2021.