Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc

Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/763

Title:	Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
Other Titles:	A Convolutional Neural Network Model to Separate Singing Voice from Music
Authors:	Nguyễn, Tấn Phú Nguyễn, Nhị Gia Vinh Lê, Thị Diễm Lê, Minh Lý
Keywords:	Mạng nơron tích chập (Convolutional Neural Network) Phép biến đổi Fourier thời gian ngắn (Short time Fourier Transform) Đặc trưng âm thanh (audio feature) Demixing Secrets Dataset 100 (DSD100)
Issue Date:	2020
Publisher:	Nhà xuất bản Đà Nẵng
Abstract:	Nghiên cứu này đề xuất một mô hình phân tách giọng hát từ nguồn hỗn hợp âm nhạc bằng mạng nơron tích chập - CNN (Convolutional Neural Network). Phép biến đổi Fourier thời gian ngắn - STFT (Short time Fourier Transform) được áp dụng để trích các đặc trưng cơ bản của tín hiệu giọng hát. Bộ dữ liệu DSD100 (Demixing Secrets Dataset 100) gồm các hỗn hợp âm nhạc của giọng hát và nhạc đệm từ các nhạc cụ như trống, bass, .v.v. được sử dụng để đánh giá hiệu suất của mô hình mạng CNN. Kết quả thực nghiệm cho thấy mô hình mạng CNN đạt độ chính xác là 97.24%.
Description:	Bài báo khoa học; từ trang 211-218
URI:	http://elib.vku.udn.vn/handle/123456789/763
ISBN:	978-604-84-5517-0
Appears in Collections:	CITA 2020

Files in This Item: