Nghiên cứu sử dụng trí tuệ nhân tạo để phát hiện website có chứa nội dung thô tục

Lê, Cẩm Bằng; Phan, Lê Việt Hùng

Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này: https://elib.vku.udn.vn/handle/123456789/2655

Nhan đề:	Nghiên cứu sử dụng trí tuệ nhân tạo để phát hiện website có chứa nội dung thô tục
Nhan đề khác:	Research Artificial Intelligence to Detect Websites Containing Profanity Content
Tác giả:	Đặng, Đại Thọ Lê, Cẩm Bằng Phan, Lê Việt Hùng
Từ khoá:	Profanity Word2vec PhoBERT Machine Learning Deep Learning Artificial Intelligence
Năm xuất bản:	thá-2023
Nhà xuất bản:	Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn
Tùng thư/Số báo cáo:	NCKHSV;
Tóm tắt:	Nội dung thô tục là một vấn đề nhức nhối ảnh hưởng đến an toàn và sức khoẻ của người dùng internet. Mục tiêu của nghiên cứu này là xây dựng một hệ thống tự động phát hiện và cảnh báo các website có chứa nội dung thô tục bằng cách sử dụng các phương pháp trí tuệ nhân tạo hiện đại. Chúng tôi đã áp dụng các phương pháp tiền xử lý, biểu diễn dữ liệu bao gồm Word2vec, PhoBERT và các mô hình Machine Learning và Deep Learning khác nhau. Chúng tôi đã thu thập và xây dựng một bộ dữ liệu ngôn ngữ thô tục tiếng Việt, tiến hành huấn luyện và đánh giá các mô hình trên bộ dữ liệu này. Kết quả cho thấy mô hình BiLSTM với dữ liệu được biểu diễn với PhoBERT có độ chính xác cao nhất là 78%. Nghiên cứu này có thể được áp dụng rộng rãi trong việc cải thiện môi trường internet, bảo vệ trẻ em và thanh thiếu niên khỏi các tác hại tiêu cực của nội dung thô tục trên mạng.
Mô tả:	Kỷ yếu Nghiên cứu khoa học của sinh viên Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn năm học 2022-2023; trang 34-40.
Định danh:	http://elib.vku.udn.vn/handle/123456789/2655
Bộ sưu tập:	SV NCKH Năm học 2022-2023

Các tập tin trong tài liệu này:

Đăng nhập để xem toàn văn

Hiển thị đầy đủ biểu ghi tài liệu Xem thống kê

Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.