
Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://elib.vku.udn.vn/handle/123456789/763
Nhan đề: | Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc |
Nhan đề khác: | A Convolutional Neural Network Model to Separate Singing Voice from Music |
Tác giả: | Nguyễn, Tấn Phú Nguyễn, Nhị Gia Vinh Lê, Thị Diễm Lê, Minh Lý |
Từ khoá: | Mạng nơron tích chập (Convolutional Neural Network) Phép biến đổi Fourier thời gian ngắn (Short time Fourier Transform) Đặc trưng âm thanh (audio feature) Demixing Secrets Dataset 100 (DSD100) |
Năm xuất bản: | 2020 |
Nhà xuất bản: | Nhà xuất bản Đà Nẵng |
Tóm tắt: | Nghiên cứu này đề xuất một mô hình phân tách giọng hát từ nguồn hỗn hợp âm nhạc bằng mạng nơron tích chập - CNN (Convolutional Neural Network). Phép biến đổi Fourier thời gian ngắn - STFT (Short time Fourier Transform) được áp dụng để trích các đặc trưng cơ bản của tín hiệu giọng hát. Bộ dữ liệu DSD100 (Demixing Secrets Dataset 100) gồm các hỗn hợp âm nhạc của giọng hát và nhạc đệm từ các nhạc cụ như trống, bass, .v.v. được sử dụng để đánh giá hiệu suất của mô hình mạng CNN. Kết quả thực nghiệm cho thấy mô hình mạng CNN đạt độ chính xác là 97.24%. |
Mô tả: | Bài báo khoa học; từ trang 211-218 |
Định danh: | http://elib.vku.udn.vn/handle/123456789/763 |
ISBN: | 978-604-84-5517-0 |
Bộ sưu tập: | CITA 2020 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.