Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/101
Title: AUDIO SCENE CLASSIFICATION USING GATED RECURRENT NEURAL NETWORK
Authors: Đặng, Thị Thúy An
Trần, Thị Kiều
Keywords: Audio scene classification
MFCC
GRNNs
LSTM
GRU
Issue Date: 2016
Abstract: Phân loại bối cảnh âm thanh đã nhận được sự chú ý trong nhiều năm qua. Đó là sự nhận dạng môi trường xung quanh với sự hỗ trợ của âm thanh nền. Nghiên cứu này để xuất ba hệ thống cho việc phân loại dựa trên Gated Recurrent Neural Network. Một hệ thống gồm hai phần chính là trích xuất đặc trưng và phân loại. Đối với trích xuất đặc trưng, chúng tôi sử dụng thuật toán MFCC, những đặc trưng này sẽ là dữ liệu vào của quá trình phân loại sau đó. Đối với quá trình phân loại, chúng tôi sử dụng phương pháp Gated Recurrent Neural Network bao gồm hai thuật toán chính là Long short term memory và Gated recurrent unit. Chúng tôi thử nghiệm các hệ thống đề xuất trên tập dữ liệu LITIS Rouen bao gồm 19 danh mục và có độ dài 1500 phút. Tỷ lệ phân loại cao nhất dựa trên hệ thống đề xuất của chúng tôi là 94.92%. Đây là một tỷ lệ khá cao trong phân loại bối cảnh âm thanh và cao hơn 3.0% khi so sánh với bài báo gốc
URI: http://thuvien.cit.udn.vn//handle/123456789/101
Appears in Collections:CITA 2016

Files in This Item:

 Sign in to read



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.