Proposta de base de dados para classificação automática de gêneros musicais brasileiros

 

Automatic brazilian music genres classification: a database proposal

 

Propuesta de base de datos para clasificación automática de géneros musicales brasileños

 

Paulo Sérgio da Conceição Moreira

PPGGI/UFPR

Brasil

Denise Fukumi Tsunoda

PPGGI/UFPR

Brasil

 

 

Submetido em: 23/02/2021

Aceito em: 14/06/2021

Publicado em: 28/10/2021

 

Licença:

 

Autor para correspondência: Paulo Sérgio da Conceição Moreira

Email: psxm54@gmail.com

ORCID: https://orcid.org/0000-0002-3168-2177

 

 

Como citar este artigo:

MOREIRA, Paulo Sérgio da; TSUNODA, Denise Fukumi. Proposta de base de dados para classificação automática de gêneros musicais brasileiros. REBECIN, São Paulo, v. 8, edição especial, p. 1-13, 2021. DOI:  10.24208/rebecin.v8i.234.  

 

 

 

RESUMO

 

Diante da quantidade de músicas disponíveis atualmente, classificar músicas manualmente é uma tarefa árdua. Neste sentido, a classificação automática de gêneros musicais é uma abordagem pertinente, auxiliando o processo de organização, pesquisa, recuperação e recomendação de músicas. Verifica que, apesar da existência de bases de dados tradicionais relacionadas à classificação de gêneros musicais, essas bases tendem a considerar gêneros tradicionais, como o Jazz e a Música Clássica, ignorando gêneros regionais, como os da cultura brasileira, por exemplo. Desse modo, o objetivo deste estudo é apresentar uma base de dados destinada à classificação automática de gêneros musicais brasileiros. Para tanto, utiliza o Spotify para identificar músicas relacionadas aos gêneros Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode e Samba. Como resultado, desenvolve uma base de dados com 1.907 registros relacionados a esses gêneros, e estabelece comparação entre esta e outras seis bases de dados, identificando que a base proposta supera quatro bases em número de registros e consiste na mais abrangente em relação ao total de gêneros considerados. Por fim, disponibiliza a base para novos estudos, e incentiva a sua aplicação em pesquisas que envolvam heurísticas de Mineração de Dados e Deep Learning

 

Palavras-Chave: Base de Dados; Classificação de Gêneros Musicais; Gêneros Musicais; Música Brasileira; Recuperação de Informação Musical.

 

ABSTRACT

 

Due to the amount of music currently available, classifying songs manually is an arduous task. In this sense, automatic music genre classification is a pertinent approach, helping to organize, search, retrieve and recommend music. Although there are traditional databases related to the music genre classification, these databases only considered traditional genres, such as Jazz and Classical Music.  Also, they ignore regional genres, such as those of Brazilian culture, for example. Thus, the objective of this study is to present a database for the automatic Brazilian music genres classification. For that, we used Spotify to identify music related to the genres Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode, and Samba. As a result, we developed a database with 1,907 records related to these genres, and compared this database with six other databases, identifying that the proposed base exceeds four bases in the number of records and consists of the most comprehensive about the total number of records genders considered. Finally, we provide the basis for further studies and encourage its application in research involving Data Mining and Deep Learning.

 

Keywords: Database; Music Genre Classification; Music Genres; Brazilian Music; Music Information Retrieval.

 

RESUMEN

 

Dada la cantidad de música disponible actualmente, clasificar la música manualmente es una tarea ardua. En este sentido, la clasificación automática de géneros musicales es un enfoque relevante, que ayuda al proceso de organizar, investigar, recuperar y recomendar música. Verifica que, a pesar de la existencia de bases de datos tradicionales relacionadas con la clasificación de géneros musicales, estas bases de datos tienden a considerar géneros tradicionales, como Jazz y Música Clásica, ignorando géneros regionales, como los de la cultura brasileña, por ejemplo. Así, el objetivo de este estudio es presentar una base de datos para la clasificación automática de los géneros musicales brasileños. Por ello, utiliza Spotify para identificar canciones relacionadas con los géneros Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode y Samba. Como resultado, desarrolla una base de datos con 1.907 registros relacionados con estos géneros, y hace una comparación entre esta y otras seis bases de datos, identificando que la base de datos propuesta supera las cuatro bases en número de registros y es la más completa en relación al total. de géneros considerados. Por último, proporciona la base para estudios adicionales y fomenta su aplicación en la investigación que involucre la heurística de la minería de datos y el aprendizaje profundo.

 

Palabras llave: Base de datos; Clasificación de géneros musicales; Géneros musicales; Música brasileña; Recuperación de información musical.

 

1 INTRODUÇÃO

 

A quantidade de músicas disponíveis atualmente é um desafio para a recuperação de informações musicais (LIU et al., 2021; VISHNUPRIYA; MEENAKSHI, 2018; YU et al., 2020), de tal modo que organizar e classificar músicas manualmente é uma tarefa árdua (LIU et al., 2021; YANG et al., 2020). Nesse contexto, considerar o gênero musical para organizar, pesquisar, recuperar e recomendar músicas é uma abordagem pertinente (VISHNUPRIYA; MEENAKSHI, 2018; YANG et al., 2020; YU et al., 2020), uma vez que os usuários já manifestam suas preferências musicais em gêneros como Hip-Hop, Rock e Jazz, por exemplo (LIU et al., 2021; VISHNUPRIYA; MEENAKSHI, 2018).

Desse modo, a classificação automática de gêneros musicais surge como serviço crucial para os agentes inseridos no fornecimento e na distribuição de conteúdo musical (LIU et al., 2021), tendo o seu início no trabalho de Tzanetakis e Cook (2002) (AGUIAR; COSTA; SILLA JÚNIOR, 2020; VISHNUPRIYA; MEENAKSHI, 2018). Neste estudo, além da metodologia para a extração de características diretamente do áudio, os autores apresentaram a base de dados GTZAN (TZANETAKIS; COOK, 2002), uma das mais populares do tema.

Entretanto, na GTZAN, assim como em outras bases tradicionais, como a CODAICH (MCKAY; MCENNIS; FUJINAGA, 2005) e a desenvolvida por Homburg et al. (2005), predominam gêneros como Jazz e Música Clássica, ignorando, por exemplo, gêneros regionais, como os relacionados ao Brasil (SIMAS FILHO; BORGES JÚNIOR; FERNANDES JÚNIOR, 2018). Neste aspecto, portanto, o objetivo deste estudo é apresentar uma base de dados destinada à classificação automática de gêneros musicais brasileiros.

2 CONSTRUÇÃO DA BASE DE DADOS

 

As músicas que compõem a base deste estudo foram coletadas no dia 15 de março de 2021, diretamente de playlists do serviço de streaming Spotify[1]. No total, 1.907 registros formam a base proposta, e representam 11 gêneros musicais brasileiros, conforme a seguinte distribuição: a) Axé (179); b) Bossa Nova (154); c) Brega (184); d) Choro (95); e) Forró (228); f) Frevo (97); g) Funk Carioca (160); h) Maracatu (152); i) Música Sertaneja (249); j) Pagode (218); e k) Samba (191).

         Em relação às características extraídas, empregou-se o conjunto fornecido pela Application Programming Interface (API) da plataforma Spotify[2] (QUADRO 1), tendo em vista a sua adoção em estudos semelhantes (FURINI, 2021; SANTANA et al., 2020). Entende-se, ainda, que esse conjunto atende aos critérios de Li, Ogihara e Li (2003), como a necessidade de utilizar informações abrangentes e que representem as músicas selecionadas, além de gerar um arquivo final que dispensa grande capacidade de armazenamento.

 

Quadro 1: conjunto de características extraídas

Característica

Descrição

Acousticness

Medida para identificar se a faixa é acústica

Danceability

Representa o quão "dançante" é a faixa

Duration_ms

Duração em milissegundos da canção

Energy

Característica relacionada à intensidade da música

Instrumentalness

Prevê se a faixa não apresenta vocais

Key

Representa o tom da música. Por exemplo: 0 = C; 1 = C# etc.

Liveness

Verifica se a música foi gravada ao vivo

Loudness

Indica o volume geral da canção em decibéis (dB)

Mode

Representa o modo da faixa (1 = Maior; 0 = Menor)

Speechiness

Verifica o quão “falada” é a música

Tempo

Número estimado de batidas por minuto (BPM) da faixa

Valence

Descreve a positividade da música

Fonte: Os autores (2021).

 

Para a etapa de extração, utilizou-se um script em Python empregando a biblioteca spotipy[3], que permitiu o acesso à API, possibilitando a coleta das informações mediante os endereços das playlists e dos respectivos perfis dos seus proprietários.

 

3 RESULTADOS E DISCUSSÃO

 

A base elaborada conta com 684 artistas diferentes, sendo a categoria “Vários Artistas” a mais comum (153). O gênero com mais artistas é a Bossa Nova (105); por sua vez, o Maracatu apresenta a menor quantidade (19). Para uma rápida visualização, os três artistas mais representativos de cada gênero, desconsiderando a categoria “Vários Artistas”, são elencados no Quadro 2.

 

 

 

 

Quadro 2: top 3 de artistas mais representativos de cada gênero      

Gênero

Artista (#)

Axé

Banda Eva (21), É O Tchan (17), Harmonia do Samba (13)

Bossa Nova

João Gilberto (12), Antônio Carlos Jobim (9), João Donato (6)

Brega

Banda Calypso (14), Reginaldo Rossi (7), José Augusto (6)

Choro

Pixinguinha (10), Waldir Azevedo (8), Jacob do Bandolim (7)

Forró

Luan Estilizado (10), Zé Vaqueiro (7), Danieze Santiago (7)

Frevo

Alçeu Valença (10), André Rio (9), Silvério Pessoa (5)

Funk Carioca

MC Marcinho (12), DJ Marlboro (9), MC Lipi (6)

Maracatu

Comadre Florzinha (24), Pandeiro do Mestre (20), Cordel do Fogo Encantado (17)

Música Sertaneja

Henrique & Juliano (14), Chitãozinho & Xororó (13), Gusttavo Lima (13)

Pagode

Pixote (12), Thiaguinho (10), Sorriso Maroto (9)

Samba

Zeca Pagodinho (12), Jorge Aragão (12), Beth Carvalho (11)

Fonte: Os autores (2021).

 

         Quanto às características extraídas, na Tabela 1 apresentam-se as estatísticas descritivas para as variáveis numéricas da base.

 

 

 

 

 

 

 

Tabela 1: estatísticas descritivas das características numéricas

                                                                                 

Característica

Mínimo

Média

Desvio Padrão

Máximo

Acousticness

0,0001

0,4267

0,2575

0,9940

Danceability

0,2170

0,6319

0,1285

0,9750

Duration_ms

45.000

205.524

55.589

733.145

Energy

0,0462

0,6706

0,1977

0,9940

Instrumentalness

0,000

0,0585

0,2024

0,9610

Liveness

0,0162

0,3126

0,2862

0,9950

Loudness

-24,8640

-7,9065

3,6346

-0,1090

Speechiness

0,0232

0,0835

0,0816

0,6830

Tempo

49,9500

24,4100

27,9500

205,6200

Valence

0,0749

0,7125

0,1939

0,9820

Fonte: Os autores (2021).

 

Concernente ao tom em que as músicas foram escritas, o mais comum é o Ré Maior (D), com 13,75% de canções. Em relação ao modo, 35,22% das faixas encontram-se no modo menor, enquanto 64,78% estão em modo maior. Finalmente, apresenta-se uma comparação entre a base de dados proposta e outras bases com gêneros brasileiros (QUADRO 3).

 

Quadro 3: comparação entre bases de dados com gêneros brasileiros

Base

Gêneros

#

Autores

Brazilian Music Database (BRMD)

Axé, Bossa Nova, Forró, Rap, Sertanejo e Samba

8.994

Pereira e Silla Júnior (2017)

Latin Music Database (LMD)

Axé, Bachata, Bolero, Forró, Gaúcha, Merengue, Pagode, Salsa, Sertaneja, Tango

3.227 (1.565 de gêneros brasileiros)

Silla J[unior, Koerich e Kaestner (2008)

Este estudo

Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode e Samba

1.907

-

Simas Filho, Borges Júnior e Fernandes Júnior

Blues, Country, Forró, Hip-Hop, Jazz, Música Popular Brasileira (MPB), Música Clássica, Pop, Reggae, Rock, Samba e Soul

1.008 (282 de gêneros brasileiros)

Simas Filho, Borges Júnior. e Fernandes Júnior (2018)

Volkël et al.

Baião, Bolero, Bossa Nova, Cha-cha-cha, Samba-enredo, Mambo, Merengue, Pagode, Son

376 (152 de gêneros brasileiros)

Volkël et al. (2010)

Brazilian Music Dataset (BMD)

Forró, Rock, Repente, MPB, Brega, Sertanejo e Disco

120

Souza, Pereira e Veloso (2016)

Goulart et al.

Axé, Bossa Nova, Forró e Samba

80

Goulart et al. (2011)

Fonte: Os autores (2021).

 

A base deste estudo supera as bases BMD e a de Goulart et al. (2011), tanto em número de registros, quanto em número de gêneros. As bases desenvolvidas por Simas Filho, Borges Júnior e Fernandes Júnior (2016), e por Volkël et al. (2010), além de apresentarem menos registros, são compostas por poucas músicas brasileiras. Em relação à LMD, ressalta-se que o total de ocorrências para gêneros tipicamente nacionais é inferior ao apresentado nesta pesquisa. Por fim, quanto à BRMD, esta apresenta menor número de gêneros (7x11), e não contempla - assim como as demais - músicas de Choro, Frevo, Funk Carioca e Maracatu.

 

4 CONSIDERAÇÕES FINAIS

 

Este estudo apresentou uma nova base de dados destinada à classificação de gêneros musicais brasileiros, contendo 1.907 registros, e que representam os gêneros Axé, Bossa Nova, Brega, Choro, Forró, Frevo, Funk Carioca, Maracatu, Música Sertaneja, Pagode e Samba. O diferencial da proposta desta pesquisa é a presença de gêneros não explorados em outros estudos, mesmo esses utilizando bases maiores em termos de registros.

Em um primeiro momento, a base será anexada como material suplementar desta pesquisa, contudo, o próximo passo é disponibilizá-la em um repositório de dados científicos, como a Base de Dados Científicos da Universidade Federal do Paraná (BDC/UFPR), para que pesquisadores possam empregá-la em seus estudos.

         Dentre as limitações da pesquisa, é preciso mencionar que: a) as características extraídas são apenas as fornecidas pela API do Spotify; b) não há padronização na duração das músicas, sendo considerada a duração total de cada música; e c) não é possível reduzir possíveis vieses quanto à classificação das músicas de acordo com os gêneros, uma vez que esta é determinada pelo Spotify ou pelos seus usuários.

         Finalmente, como trabalhos futuros, incentiva-se o uso da base proposta em estudos destinados à classificação automática de gêneros musicais, aplicando heurísticas de Mineração de Dados e arquiteturas de Deep Learning para essa tarefa. Além disso, almeja-se expandir a quantidade de registros e características, acrescentando, por exemplo, o conteúdo das letras das canções.

 

REFERÊNCIAS

 

AGUIAR, R. L.; COSTA, Y. M. G.; SILLA JÚNIOR, C. N. Exploring data augmentation to improve music genre classification with ConvNets. In: INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS (IJCNN), 29., 2018, Rio de Janeiro. Proceedings [...]. Rio de Janeiro: IEEE, 2018, p. 1-8. Disponível em: https://doi.org/10.1109/IJCNN.2018.8489166. Acesso em: 17 mar. 2021.

 

FURINI, M. automatic music playlist generation based on music-programming of FM radios. In: ANNUAL CONSUMER COMMUNICATIONS & NETWORKING CONFERENCE (CCNC), 18., 2021, Las Vegas. Proceedings [...]. Las Vegas: IEEE, 2021, p. 1-4. Disponível em: https://doi.org/10.1109/CCNC49032.2021.9369526. Acesso em: 18 mar. 2021.

 

GOULART, A. J. H. et al. Music genre classification based on entropy and fractal lacunarity. In: IEEE INTERNATIONAL SYMPOSIUM ON MULTIMEDIA, 14., 2011, Dana Point. Proceedings [...]. Dana Point: IEEE, 2011, p. 533-536. Disponível em: https://doi.org/10.1109/ISM.2011.94. Acesso em: 19 mar. 2021.

 

HOMBURG, H. et al. A benchmark dataset for audio classification and clustering. In: INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 6., 2005, Londres. Proceedings [...]. Londres: ISMIR, 2005, p. 528-531. Disponível em: https://archives.ismir.net/ismir2005/paper/000117.pdf. Acesso em: 17 mar. 2021.

 

LI, T.; OGIHARA, M.; LI, Q. A comparative study on content-based music genre classification. In: ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMAION RETRIEVAL, 26., 2003, Toronto. Proceedings [...] . Toronto: ACM, 2003, p. 282-289. Disponível em: https://doi.org/10.1145/860435.860487. Acesso em: 18 mar. 2021.

 

LIU, C. et al. Bottom-up broadcast neural network for music genre classification. Multimedia Tools and Applications, v. 80, n. 5, p. 7313-7331, fev. 2021. Disponível em: https://doi.org/10.1007/s11042-020-09643-6. Acesso em: 17 mar. 2021.

 

MCKKAY, C.; MCENNIS, D.; FUJINAGA, I. A large publicly accessible prototype audio database for music research. In: INTERNATIONAL SOCIETY FOR MUSIC INFORMATION RETRIEVAL CONFERENCE, 7., 2006, Victoria. Proceedings [...]. Victoria: ISMIR, 2006, p. 1-4. Disponível em: http://www.music.mcgill.ca/~cmckay/NEMA/publications/ISMIR_2006_Codaich_jMusicMetaManager.pdf. Acesso em: 17 mar. 2021.

 

PEREIRA, R. M.; SILLA JR., C.N. Using simplified chords sequences to classify songs genres. In: IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND Expo (ICME), 18., 2017, Hong Kong. Proceedings [...]. Hong Kong: IEEE, 2017, p. 1446-1451. Disponível em: https://doi.org/10.1109/ICME.2017.8019531. Acesso em: 18 mar. 2021.

 

SANTANA, I. A. P. et al. Music4All: a new music database and its applications. In: INTERNATIONAL CONFERENCE ON SYSTEMS, SIGNALS AND IMAGE PROCESSING (IWSSIP), 27., 2020, Niterói.  Proceedings [...] . Niterói: IEEE, 2020, p. 399-404. Disponível em: https://doi.org/10.1109/IWSSIP48289.2020.9145170. Acesso em: 18 mar. 2021.

 

SILLA JÚNIOR, C. N.; KOERICH, A. L.; KAESTNER, C. A.A. The latin music database. In: INTERNATIONAL CONFERENCE ON MUSIC INFORMATION RETRIEVAL, 9., 2008. Filadélfia. Proceedings [...]. Filadélfia: ISMIR, 2008. p. 451-456. Disponível em: https://archives.ismir.net/ismir2008/paper/000106.pdf. Acesso em: 17 mar. 2021.

SIMAS FILHO, E. F.; BORGES JÚNIOR, E. A.; FERNANDES JÚNIOR, A. C. L. Genre classification for brazilian music using independent and discriminant features. Journal of Communication and Information Systems, v. 33, n. 1, maio 2018. Disponível em: https://jcis.emnuvens.com.br/jcis/article/view/515. Acesso em: 17 mar. 2021.

 

TZANETAKIS, G.; COOK, P. Musical genre classification of audio signals. IEEE Transactions on Speech and Audio Processing, v. 10, n. 5, p. 293-302, nov. 2002. Disponível em: https://doi.org/10.1109/TSA.2002.800560. Acesso em: 17 mar. 2021.

 

VISHNUPRIYA, S.; MEENAKSHI, K. Automatic music genre classification using Convolution Neural Network. In: INTERNATIONAL CONFERENCE ON COMPUTER COMMUNICATION AND INFORMATICS (ICCCI), 7., 2018, Coimbatore. Proceedings [...] . Coimbatore: IEEE, 2018. p. 1-4. Disponível em: https://doi.org/10.1109/ICCCI.2018.8441340. Acesso em: 17 mar. 2021.

 

VÖLKEL, T. et al. Automatic genre classification of Latin American music using characteristic rhythmic patterns. In: AUDIO MOSTLY CONFERENCE: A CONFERENCE ON INTERACTION WITH SOUND, 5., 2010, Piteå. Proceedings [...]. Piteå: ACM, 2010. p. 1-7. Disponível em: https://doi.org/10.1145/1859799.1859815. Acesso em: 19 mar. 2021.

 

YANG, R. et al. Parallel recurrent convolutional neural networks-based music genre classification method for mobile devices. IEEE Access, v. 8, p. 19629-19637, jan. 2020. Disponível em: https://doi.org/10.1109/ACCESS.2020.2968170. Acesso em: 17 mar. 2021.

 

YU, Y. et al. Deep attention based music genre classification. Neurocomputing, v. 372, p. 84-91, jan. 2020. Disponível em: https://doi.org/10.1016/j.neucom.2019.09.054. Acesso em: 17 mar. 2021.



[1] Disponível em: https://www.spotify.com/br/. Acesso em: 13 mar. 2021.

[2] Disponível em: https://developer.spotify.com/documentation/web-api/quick-start/. Acesso em: 13 mar. 2021.

[3] Disponível em: https://spotipy.readthedocs.io/en/2.17.1/. Acesso em: 13 mar. 2021.