Please use this identifier to cite or link to this item:
https://elib.vku.udn.vn/handle/123456789/101
Title: | AUDIO SCENE CLASSIFICATION USING GATED RECURRENT NEURAL NETWORK |
Authors: | Đặng, Thị Thúy An Trần, Thị Kiều |
Keywords: | Audio scene classification MFCC GRNNs LSTM GRU |
Issue Date: | 2016 |
Abstract: | Phân loại bối cảnh âm thanh đã nhận được sự chú ý trong nhiều năm qua. Đó là sự nhận dạng môi trường xung quanh với sự hỗ trợ của âm thanh nền. Nghiên cứu này để xuất ba hệ thống cho việc phân loại dựa trên Gated Recurrent Neural Network. Một hệ thống gồm hai phần chính là trích xuất đặc trưng và phân loại. Đối với trích xuất đặc trưng, chúng tôi sử dụng thuật toán MFCC, những đặc trưng này sẽ là dữ liệu vào của quá trình phân loại sau đó. Đối với quá trình phân loại, chúng tôi sử dụng phương pháp Gated Recurrent Neural Network bao gồm hai thuật toán chính là Long short term memory và Gated recurrent unit. Chúng tôi thử nghiệm các hệ thống đề xuất trên tập dữ liệu LITIS Rouen bao gồm 19 danh mục và có độ dài 1500 phút. Tỷ lệ phân loại cao nhất dựa trên hệ thống đề xuất của chúng tôi là 94.92%. Đây là một tỷ lệ khá cao trong phân loại bối cảnh âm thanh và cao hơn 3.0% khi so sánh với bài báo gốc |
URI: | http://thuvien.cit.udn.vn//handle/123456789/101 |
Appears in Collections: | CITA 2016 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.