Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/2682
Title: Trích xuất dữ liệu hồ sơ nhập học để cải tiến quy trình tuyển sinh tại Trường Đại học Công nghệ Đồng Nai
Authors: Đỗ, Phúc Thịnh
Bùi, Ngọc Tiến
Bùi, Nguyên Tuấn Anh
Phan, Tiến Linh
Keywords: Text detection
text recognition
OCR
text matching
Issue Date: Jun-2023
Publisher: Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn
Series/Report no.: CITA;
Abstract: Nhận dạng ký tự quang học là một trong những nhiệm vụ có tính ứng dụng rất cao trong cuộc sống hàng ngày. Tuy nhiên, đây vẫn còn là một trong những tác vụ đầy thách thức trong lĩnh vực thị giác máy tính. Một trong những khó khăn của bài toán này là chất lượng hình ảnh không tốt và góc nhìn không chuẩn dẫn đến việc nhận dạng văn bản rất khó khăn. Mặt khác, nhiều mô hình nhận dạng văn bản thường chỉ hỗ trợ tốt cho các ngôn ngữ như tiếng Anh, tiếng Trung, tiếng Nhật ... Trong bài báo này chúng tôi đề xuất và sử dụng mô hình hỗ trợ cho việc rút trích thông tin từ hồ sơ sinh viên gồm hai thành phần: trình phát hiện vùng văn bản và trình nhận dạng văn bản. Song song với đó, chúng tôi thu thập dữ liệu và huấn luyện mô hình cho ngôn ngữ tiếng Việt. Thực nghiệm cho thấy, mô hình của chúng tôi tốt hơn các phương pháp một thành phần khi so sánh trên các bộ dữ liệu chuẩn.
Description: Kỷ yếu Hội thảo Khoa học Quốc gia về Công nghệ thông tin và Ứng dụng trong các lĩnh vực - Lần thứ 12 (CITA 2023); trang 192-200.
URI: http://elib.vku.udn.vn/handle/123456789/2682
ISBN: 978-604-80-8083-9
Appears in Collections:CITA 2023 (National)

Files in This Item:

 Sign in to read



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.