Visual Basic Tutorial 2

SAM2-LOVE: Segment Anything Model 2 in Language-aided Audio-Visual Scenes

Abstract: Reference Audio-Visual Segmentation (Ref-AVS) aims to provide a pixel-wise scene understanding in Language-aided Audio-Visual Scenes (LAVS). This task requires the model to continuously ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

SAM2-LOVE: Segment Anything Model 2 in Language-aided Audio-Visual Scenes

Trending now