Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/4142
Title: Xây dựng kho ngữ liệu đa ngữ nhờ vào UNL
Other Titles: Building a Multilangual Corpus with UNL
Authors: Võ, Trung Hùng
Phan, Thị Lệ Thuyền
Ninh, Khánh Chi
Keywords: UNL
Universal networking language
Automatic translation
Multilingual corpus
Issue Date: Sep-2023
Publisher: Nhà xuất bản Khoa học Tự nhiên và Công nghệ
Abstract: Bài báo này trình bày việc xây dựng kho dữ liệu đa ngữ nhờ vào một ngôn ngữ gọi là UNL (Universal Networking Language). UNL được định nghĩa gồm có các thành phần tương ứng như là một ngôn ngữ tự nhiên và nó có thể biểu diễn mọi thông tin của ngôn ngữ ở dạng có cấu trúc mà không gây nhập nhằng về ngữ nghĩa. Với đặc tính này, ngôn ngữ UNL có thể sử dụng như là một ngôn ngữ trung gian (ngôn ngữ trục) để chuyển đổi qua lại giữa các ngôn ngữ tự nhiên thay vì dịch trực tiếp giữa hai ngôn ngữ mà chúng ta thường hay sử dụng. Việc sử dụng ngôn ngữ UNL trong hệ thống dịch đa ngữ có hai ưu điểm lớn: UNL không có sự nhập nhằng về ngữ nghĩa và giảm số lượng cặp dịch từ n*(n-1)/2 xuống 2*n. Chúng tôi thử nghiệm với 106.434 câu, kết quả đầu ra cho thấy dịch qua UNL tốt hơn so với dịch trực tiếp bằng Google Translator (đánh giá dựa trên hai phương pháp NIST và BLEU).
Description: Kỷ yếu Hội nghị Khoa học công nghệ Quốc gia lần thứ XVI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR 2023); trang 608-613.
URI: http://vap.ac.vn/Portals/0/TuyenTap/2024/2/21/64e13532907845ed9f5a2547dfec276f/77BB_FAIR2023_paper_7338.pdf
10.15625/vap.2023.0090
https://elib.vku.udn.vn/handle/123456789/4142
ISBN: 978-604-357-201-8
Appears in Collections:NĂM 2023

Files in This Item:

 Sign in to read



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.