Name		Name	Last commit message	Last commit date
Latest commit History 47 Commits
Paper		Paper
performance_test		performance_test
speed_test		speed_test
.gitignore		.gitignore
CQT.ipynb		CQT.ipynb
MelSpectrogram.ipynb		MelSpectrogram.ipynb
README.md		README.md
STFT.ipynb		STFT.ipynb
Spectrogram.py		Spectrogram.py

Repository files navigation

nnAudio

Audio processing by using pytorch 1D convolution network. By doing so, spectrograms can be generated from audio on-the-fly during neural network training.

Dependencies

Numpy 1.14.5

Scipy 1.2.0

PyTorch 1.1.0

Instruction

All the required codes are contained inside the jupyter-notebook. The audio processing layer can be integrated as part of the neural network as shown below.

class Model(torch.nn.Module):
    def __init__(self, avg=.9998):
        super(Model, self).__init__()
        # Getting Mel Spectrogram on the fly
+       self.spec_layer = Spectrogram.STFT(sr=44100, n_fft=n_fft, freq_bins=freq_bins, fmin=50, fmax=6000, freq_scale='log', pad_mode='constant', center=True)
        self.n_bins = freq_bins         
        
        # Creating CNN Layers
        self.CNN_freq_kernel_size=(128,1)
        self.CNN_freq_kernel_stride=(2,1)
        k_out = 128
        k2_out = 256
        self.CNN_freq = nn.Conv2d(1,k_out,
                                kernel_size=self.CNN_freq_kernel_size,stride=self.CNN_freq_kernel_stride)
        self.CNN_time = nn.Conv2d(k_out,k2_out,
                                kernel_size=(1,regions),stride=(1,1))    
        
        self.region_v = 1 + (self.n_bins-self.CNN_freq_kernel_size[0])//self.CNN_freq_kernel_stride[0]
        self.linear = torch.nn.Linear(k2_out*self.region_v, m, bias=False)
        
    def forward(self,x):
+        z = self.spec_layer(x)
        z = torch.log(z+epsilon)
        z2 = torch.relu(self.CNN_freq(z.unsqueeze(1)))
        z3 = torch.relu(self.CNN_time(z2))
        y = self.linear(torch.relu(torch.flatten(z3,1)))
        return torch.sigmoid(y)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

nnAudio

Dependencies

Instruction

About

Releases

Packages

Languages

License

Hadryan/nnAudio

Folders and files

Latest commit

History

Repository files navigation

nnAudio

Dependencies

Instruction

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages