Please use this identifier to cite or link to this item:
https://elib.vku.udn.vn/handle/123456789/4142
Title: | Xây dựng kho ngữ liệu đa ngữ nhờ vào UNL |
Other Titles: | Building a Multilangual Corpus with UNL |
Authors: | Võ, Trung Hùng Phan, Thị Lệ Thuyền Ninh, Khánh Chi |
Keywords: | UNL Universal networking language Automatic translation Multilingual corpus |
Issue Date: | Sep-2023 |
Publisher: | Nhà xuất bản Khoa học Tự nhiên và Công nghệ |
Abstract: | Bài báo này trình bày việc xây dựng kho dữ liệu đa ngữ nhờ vào một ngôn ngữ gọi là UNL (Universal Networking Language). UNL được định nghĩa gồm có các thành phần tương ứng như là một ngôn ngữ tự nhiên và nó có thể biểu diễn mọi thông tin của ngôn ngữ ở dạng có cấu trúc mà không gây nhập nhằng về ngữ nghĩa. Với đặc tính này, ngôn ngữ UNL có thể sử dụng như là một ngôn ngữ trung gian (ngôn ngữ trục) để chuyển đổi qua lại giữa các ngôn ngữ tự nhiên thay vì dịch trực tiếp giữa hai ngôn ngữ mà chúng ta thường hay sử dụng. Việc sử dụng ngôn ngữ UNL trong hệ thống dịch đa ngữ có hai ưu điểm lớn: UNL không có sự nhập nhằng về ngữ nghĩa và giảm số lượng cặp dịch từ n*(n-1)/2 xuống 2*n. Chúng tôi thử nghiệm với 106.434 câu, kết quả đầu ra cho thấy dịch qua UNL tốt hơn so với dịch trực tiếp bằng Google Translator (đánh giá dựa trên hai phương pháp NIST và BLEU). |
Description: | Kỷ yếu Hội nghị Khoa học công nghệ Quốc gia lần thứ XVI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR 2023); trang 608-613. |
URI: | http://vap.ac.vn/Portals/0/TuyenTap/2024/2/21/64e13532907845ed9f5a2547dfec276f/77BB_FAIR2023_paper_7338.pdf 10.15625/vap.2023.0090 https://elib.vku.udn.vn/handle/123456789/4142 |
ISBN: | 978-604-357-201-8 |
Appears in Collections: | NĂM 2023 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.