Audio Visual GK Questions

Designing and Evaluating a Dual-Stream Transformer-Based Architecture for Visual Question Answering

Abstract: In the realm of Visual Question Answering, accurate answers often hinge on the harmonious fusion of textual and visual elements. While these complex architectures are effective, they ...

IEEE

Object-Aware Image Augmentation for Audio-Visual Zero-Shot Learning

Abstract: Audio-visual zero-shot learning (ZSL) leverages both video and audio information for model training, aiming to classify new video categories that were not seen during the training. However, ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Designing and Evaluating a Dual-Stream Transformer-Based Architecture for Visual Question Answering

Object-Aware Image Augmentation for Audio-Visual Zero-Shot Learning

Trending now