Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/3826
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNguyễn, Hữu Nhật Minh-
dc.contributor.authorNguyễn, Kết Đoàn-
dc.contributor.authorNguyễn, Trần Tiến-
dc.contributor.authorTrần, Nguyên Anh-
dc.contributor.authorVõ, Văn Nam-
dc.date.accessioned2024-06-17T08:34:45Z-
dc.date.available2024-06-17T08:34:45Z-
dc.date.issued2024-06-
dc.identifier.urihttps://elib.vku.udn.vn/handle/123456789/3826-
dc.descriptionKỷ yếu Nghiên cứu khoa học của sinh viên Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn năm học 2023-2024; trang 26-33vi_VN
dc.description.abstractNhận dạng giọng nói tự động, đã phát triển mạnh mẽ trong thập kỷ qua và được sử dụng để nhận dạng và chuyển đổi giọng nói của con người thành văn bản một cách tự động. Tuy nhiên, nhận dạng giọng nói tiếng Việt đối mặt với những thách thức nghiêm trọng như dễ phát âm sai và sự đa dạng lớn trong giọng nói tiếng Việt. Là một ngôn ngữ có dấu, tiếng Việt không chỉ dựa trên phụ âm và nguyên âm mà còn phụ thuộc vào sự biến đổi của cao độ hoặc dấu trong khi phát âm. Trong bài báo này, chúng tôi đề xuất XÂY DỰNG MỘT BỘ DỮ LIỆU PHÁT ÂM SAI DÀNH RIÊNG CHO NGÔN NGỮ TIẾNG VIỆT gồm bộ dữ liệu sinh viên 3 miền Bắc - Trung - Nam phát âm giọng địa phương được thu thập trên website thu thập dữ liệu chúng tôi đã phát triển và bộ dữ liệu người nước phát âm tiếng Việt được thu thập từ OpenAI TTS. Bên cạnh đó chúng tôi đề xuất MÔ HÌNH DANANGVMD ĐỂ NHẬN DẠNG PHÁT ÂM SAI TRÊN NGÔN NGỮ TIẾNG vIỆT dựa trên âm thanh và bản phiên dịch âm chuẩn tắc. Bằng cách tận dụng các thông tin từ các embedding của bộ mã hóa âm vị và bộ mã hóa ngôn ngữ, DaNangVMD cung cấp một giải pháp mạnh mẽ cho việc phát hiện và chẩn đoán phát âm sai chính xác. Qua quá trình đánh giá mở rộng, DaNangVMD được đề xuất cho thấy hiệu suất vượt trội so với các mô hình cơ bản PAPL với độ chính xác nhận dạng âm vị lên đến 92.3% và điểm F1 cho nhận dạng các âm vị phát âm sai đạt 59.35%, đạt SOTA cho bài toán nhận dạng phát âm sai trên ngôn ngữ Tiếng Việtvi_VN
dc.language.isoenvi_VN
dc.publisherTrường Đại học Công nghệ Thông tin và Truyền thông Việt - Hànvi_VN
dc.relation.ispartofseriesNCKHSV;-
dc.subjectMispronunciation Detectionvi_VN
dc.subjectPhoneme Recognitionvi_VN
dc.subjectMultimodal Embeddingsvi_VN
dc.subjectVietnamese Speech Recognitionvi_VN
dc.titleXây dựng và phát triển mô hình nhận dạng phát âm sai trong Tiếng Việtvi_VN
dc.title.alternativeBuilding and Developing a Mispronunciation Detection Model in Vietnamesevi_VN
dc.typeWorking Papervi_VN
Appears in Collections:SV NCKH Năm học 2023-2024

Files in This Item:

 Sign in to read



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.