Page 224 - Kỷ yếu hội thảo khoa học lần thứ 12 - Công nghệ thông tin và Ứng dụng trong các lĩnh vực (CITA 2023)
P. 224

208


                     Sau                         dense, fully connect.









                                            Hình 5. Task Vector -

                     Ve                                        chính:
                     i) Action
                       Touch                                                     .
                       Recite                                 .
                       Count                 .
                     ii) Quantifier                                     .

                     iii) Entity                                                               .

                     4          n         v        q

                     4.1
                                                                     task vector. Vide
                           là  batch size,  frame, channel, height, width   bacth size
                     1 batch, frame                                       luôn là 30 khung hình), channel
                     là 3 kênh màu cho hình RGB và

                            S              frame


                                                                                       null.




















                                                    Hình 6.           ing

                                               0 video
                                      và
                     50 epochs:




                     CITA 2023                                                   ISBN: 978-604-80-8083-9
   219   220   221   222   223   224   225   226   227   228   229