Rapport Data Camp.pdf


Preview of PDF document rapport-data-camp.pdf

Page 1 23425

Text preview


Deep Learning for Music Genre Classification

TABLE OF CONTENTS
1 Executive Summary

3

2 The Dataset
2.1 About the Dataset . . . . . . . .
2.2 Data exploration . . . . . . . . .
2.2.1 Dimensionality Reduction
2.2.2 Data Distribution . . . . .

.
.
.
.

4
4
5
5
6

3 Data Engineering
3.1 Regular Spectograms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Introducing mel-spectograms . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Comparaison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7
7
7
8

.
.
.
.

.
.
.
.

.
.
.
.

4 Convolution Neural Network
4.1 Architecture . . . . . . . . . . . . . .
4.2 First results . . . . . . . . . . . . . .
4.3 Reducing mel-spectograms’ resolution
4.3.1 Resolution devided by 4 . . .
4.3.2 Resolution devided by 16 . . .
4.3.3 Insights . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

5 Long Short Term Memory Neural Network
5.1 First Approach . . . . . . . . . . . . . . . .
5.2 Reducing Overfitting . . . . . . . . . . . . .
5.3 Reducing mel-spectograms’ resolution . . . .
5.3.1 Resolution devided by 4 . . . . . . .
5.3.2 Resolution devided 16 . . . . . . . .
5.3.3 Insights . . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

9
9
10
11
11
11
12

.
.
.
.
.
.

13
13
14
16
16
16
17

6 Stacked models
18
6.1 The idea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
6.2 Reducing mel-spectograms’ resolution . . . . . . . . . . . . . . . . . . . . . . . . 20
7 Results comparison and possible improvements

21

A Confusion Matrices

22

Bibliographie

25

2