Please use this identifier to cite or link to this item:
https://elib.vku.udn.vn/handle/123456789/763
Title: | Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc |
Other Titles: | A Convolutional Neural Network Model to Separate Singing Voice from Music |
Authors: | Nguyễn, Tấn Phú Nguyễn, Nhị Gia Vinh Lê, Thị Diễm Lê, Minh Lý |
Keywords: | Mạng nơron tích chập (Convolutional Neural Network) Phép biến đổi Fourier thời gian ngắn (Short time Fourier Transform) Đặc trưng âm thanh (audio feature) Demixing Secrets Dataset 100 (DSD100) |
Issue Date: | 2020 |
Publisher: | Nhà xuất bản Đà Nẵng |
Abstract: | Nghiên cứu này đề xuất một mô hình phân tách giọng hát từ nguồn hỗn hợp âm nhạc bằng mạng nơron tích chập - CNN (Convolutional Neural Network). Phép biến đổi Fourier thời gian ngắn - STFT (Short time Fourier Transform) được áp dụng để trích các đặc trưng cơ bản của tín hiệu giọng hát. Bộ dữ liệu DSD100 (Demixing Secrets Dataset 100) gồm các hỗn hợp âm nhạc của giọng hát và nhạc đệm từ các nhạc cụ như trống, bass, .v.v. được sử dụng để đánh giá hiệu suất của mô hình mạng CNN. Kết quả thực nghiệm cho thấy mô hình mạng CNN đạt độ chính xác là 97.24%. |
Description: | Bài báo khoa học; từ trang 211-218 |
URI: | http://elib.vku.udn.vn/handle/123456789/763 |
ISBN: | 978-604-84-5517-0 |
Appears in Collections: | CITA 2020 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.