Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://elib.vku.udn.vn/handle/123456789/763
Nhan đề: Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
Nhan đề khác: A Convolutional Neural Network Model to Separate Singing Voice from Music
Tác giả: Nguyễn, Tấn Phú
Nguyễn, Nhị Gia Vinh
Lê, Thị Diễm
Lê, Minh Lý
Từ khoá: Mạng nơron tích chập (Convolutional Neural Network)
Phép biến đổi Fourier thời gian ngắn (Short time Fourier Transform)
Đặc trưng âm thanh (audio feature)
Demixing Secrets Dataset 100 (DSD100)
Năm xuất bản: 2020
Nhà xuất bản: Nhà xuất bản Đà Nẵng
Tóm tắt: Nghiên cứu này đề xuất một mô hình phân tách giọng hát từ nguồn hỗn hợp âm nhạc bằng mạng nơron tích chập - CNN (Convolutional Neural Network). Phép biến đổi Fourier thời gian ngắn - STFT (Short time Fourier Transform) được áp dụng để trích các đặc trưng cơ bản của tín hiệu giọng hát. Bộ dữ liệu DSD100 (Demixing Secrets Dataset 100) gồm các hỗn hợp âm nhạc của giọng hát và nhạc đệm từ các nhạc cụ như trống, bass, .v.v. được sử dụng để đánh giá hiệu suất của mô hình mạng CNN. Kết quả thực nghiệm cho thấy mô hình mạng CNN đạt độ chính xác là 97.24%.
Mô tả: Bài báo khoa học; từ trang 211-218
Định danh: http://elib.vku.udn.vn/handle/123456789/763
ISBN: 978-604-84-5517-0
Bộ sưu tập: CITA 2020

Các tập tin trong tài liệu này:

 Đăng nhập để xem toàn văn



Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.