Please use this identifier to cite or link to this item:
https://elib.vku.udn.vn/handle/123456789/1899
Title: | Tổng quan khả năng ứng dụng CAM và Grad-CAM trong nhận dạng khuôn mặt và giải thích ngữ cảnh hành vi ở người |
Authors: | Trần, Thị Trà Vinh Phan, Thị Lan Anh Nguyễn, Vũ Anh Quang Trần, Trung Tín |
Keywords: | bản đồ kích hoạt lớp bản đồ kích hoạt lớp trọng số gradient mạng neural tích chập nhận dạng khuôn mặt |
Issue Date: | 2021 |
Publisher: | Nhà xuất bản Đà Nẵng |
Abstract: | Nhận dạng khuôn mặt được đề cập từ thập niên 90 của thế kỷ trước cho phép nhận diện khuôn mặt trong bức ảnh và nhận dạng danh tính của người trong bức ảnh. Tuy nhiên, việc kết hợp giữa nhận dạng khuôn mặt và giải thích ngữ cảnh hành vi ở người vẫn chưa được đề cập và nghiên cứu. Trong bài báo này, chúng tôi thảo luận việc kết hợp nhiệm vụ nhận dạng khuôn mặt người và giải thích ngữ cảnh hành vi sẽ mang lại hiệu quả trong công tác giám sát hành vi ở những khu vực công cộng như ga tàu, bến xe, ký túc xá sinh viên, hay chung cư, căn hộ. Để làm được việc này, điều trước tiên chúng tôi tiến hành đánh giá tổng quan khả năng ứng dụng Class Activation Mapping (CAM) và Gradient-weighted Class Activation Mapping (Grad-CAM) trong việc nhận dạng khuôn mặt người và giải thích ngữ cảnh hành vi nhằm đạt độ chính xác dự đoán và phân loại cao hơn. CAM và Grad-CAM đều là những kỹ thuật nhằm mục đích làm cho các mô hình dựa trên Convolutional Neural Network (CNN) minh bạch hơn bằng cách trực quan hoá các vùng đầu vào “quan trọng” đối với các dự đoán từ mô hình này hoặc giải thích bằng hình ảnh. Mô hình CNN được ứng dụng rất nhiều trong kỹ thuật xử lý ảnh được xử lý dựa vào các mô hình học máy/học sâu. Dựa vào đánh giá tổng quan này, chúng tôi sẽ tiến hành xây dựng mô hình học sâu để nhận dạng dựa trên cấu trúc CNN nhằm tạo ra một bộ kỹ thuật học máy/học sâu có hiệu suất học tập cao (độ chính xác của dự đoán) cho phép người dùng hiểu và tin cậy một cách thích hợp. Bài báo này dựa trên các nghiên cứu trước đó nhằm đưa ra các kết quả nghiên cứu tính đến thời điểm hiện tại để xem xét tính khả thi trong việc kết hợp các kỹ thuật CAM và GradCAM trong ứng dụng nhận dạng, phân loại khuôn mặt người và giải thích ngữ cảnh hành vi ở người. |
Description: | Hội thảo Khoa học Quốc gia về Công nghệ thông tin và Ứng dụng trong các lĩnh vực lần thứ 10 (CITA-2021); Chủ đề: Khoa học dữ liệu và Trí tuệ nhân tạo; Poster; từ trang 38-47. |
URI: | http://elib.vku.udn.vn/handle/123456789/1899 |
Appears in Collections: | CITA 2021 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.