Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://elib.vku.udn.vn/handle/123456789/2692
Nhan đề: | Tăng tốc cho khai thác tập hữu ích cao bằng việc tránh khai thác lại các tập hữu ích cao phổ biến |
Tác giả: | Nông, Thị Hoa Nguyễn, Đức Hiển |
Từ khoá: | tập mục hữu ích cao khai thác tập mục hữu ích cao tập mục tập mục phổ biến khai thác dữ liệu |
Năm xuất bản: | thá-2023 |
Nhà xuất bản: | Trường Đại học Công nghệ Thông tin và Truyền thông Việt - Hàn |
Tùng thư/Số báo cáo: | CITA; |
Tóm tắt: | Khai thác tập hữu ích cao là tìm ra tập mặt hàng thường được bán cùng nhau và có lãi lớn hơn hoặc bằng một ngưỡng cho trước từ các cơ sở dữ liệu giao dịch về mua hàng. Các tập hữu ích cao thu được gồm các tập hữu ích cao xuất hiện nhiều lần. Tri thức về các tập hữu ích cao phổ biến này đã được biết và quen thuộc. Vì vậy, các thuật toán không cần khai thác lại các tập mục này. Các nghiên cứu trước đây chưa tránh khai thác lại các tập mục hữu ích cao phổ biến nên vẫn tốn thời gian tính toán và bộ nhớ lưu trữ. Trong bài báo này, chúng tôi đưa ra một thuật toán khai tập hữu ích cao mà tránh sinh ra các tập hữu ích cao phổ biến đã biết. Một danh sách nhỏ gọn để lưu trữ các tập mục sinh ra trong quá trình khai thác được trình bày. Thuật toán khai thác tập hữu ích cao gồm các bước sau: Đầu tiên, dùng một phần cơ sở dữ liệu để tìm các mục vừa phổ biến vừa có lãi cao. Tiếp theo, sinh ra các tập mục trong mỗi giao dịch mà mỗi tập mục chứa tối đa một mục vừa phổ biến vừa có lãi cao. Các tập mục được sinh ra được tính lãi và lưu vào một danh sách chung. Sau khi duyệt xong cơ sở dữ liệu, kiểm tra lãi của từng tập mục trong danh sách chung để đưa ra các tập hữu ích cao. Các thực nghiệm được làm trên các tập dữ liệu chuẩn. Thuật toán đề xuất được so sánh với các thuật toán chuẩn. Kết quả thực nghiệm cho thấy thuật toán đề xuất cho kết quả tốt hơn các thuật toán được so sánh khi cân đối thời gian tính toán và bộ nhớ lưu trữ. Đặc biệt, thuật toán mới giảm đáng kể dung lượng bộ nhớ. |
Mô tả: | Kỷ yếu Hội thảo Khoa học Quốc gia về Công nghệ thông tin và Ứng dụng trong các lĩnh vực - Lần thứ 12 (CITA 2023); trang 110-119. |
Định danh: | http://elib.vku.udn.vn/handle/123456789/2692 |
ISBN: | 978-604-80-8083-9 |
Bộ sưu tập: | CITA 2023 (National) |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.