Page 224 - Kỷ yếu hội thảo khoa học lần thứ 12 - Công nghệ thông tin và Ứng dụng trong các lĩnh vực (CITA 2023)
P. 224
208
Sau dense, fully connect.
Hình 5. Task Vector -
Ve chính:
i) Action
Touch .
Recite .
Count .
ii) Quantifier .
iii) Entity .
4 n v q
4.1
task vector. Vide
là batch size, frame, channel, height, width bacth size
1 batch, frame luôn là 30 khung hình), channel
là 3 kênh màu cho hình RGB và
S frame
null.
Hình 6. ing
0 video
và
50 epochs:
CITA 2023 ISBN: 978-604-80-8083-9