Xingjian He

research

∙ 08/18/2023

EAVL: Explicitly Align Vision and Language for Referring Image Segmentation

Referring image segmentation aims to segment an object mentioned in natu...

0 Yichen Yan, et al. ∙

research

∙ 06/15/2023

COSA: Concatenated Sample Pretrained Vision-Language Foundation Model

Due to the limited scale and quality of video-text training corpus, most...

0 Sihan Chen, et al. ∙

research

∙ 05/24/2023

MMNet: Multi-Mask Network for Referring Image Segmentation

Referring image segmentation aims to segment an object referred to by na...

0 Yichen Yan, et al. ∙

research

∙ 05/22/2023

VLAB: Enhancing Video Language Pre-training by Feature Adapting and Blending

Large-scale image-text contrastive pre-training models, such as CLIP, ha...

0 Xingjian He, et al. ∙

research

∙ 05/19/2023

Enhancing Vision-Language Pre-Training with Jointly Learned Questioner and Dense Captioner

Large pre-trained multimodal models have demonstrated significant succes...

0 Zikang Liu, et al. ∙

research

∙ 04/17/2023

VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset

In this paper, we propose a Vision-Audio-Language Omni-peRception pretra...

0 Sihan Chen, et al. ∙

research

∙ 10/09/2022

MAMO: Masked Multimodal Modeling for Fine-Grained Vision-Language Representation Learning

Multimodal representation learning has shown promising improvements on v...

0 Zijia Zhao, et al. ∙

research

∙ 09/06/2021

Exploiting Spatial-Temporal Semantic Consistency for Video Scene Parsing

Compared with image scene parsing, video scene parsing introduces tempor...

0 Xingjian He, et al. ∙

research

∙ 01/26/2021

Global-Local Propagation Network for RGB-D Semantic Segmentation

Depth information matters in RGB-D semantic segmentation task for provid...

0 Sihan Chen, et al. ∙

research

∙ 05/10/2020

Non-Autoregressive Image Captioning with Counterfactuals-Critical Multi-Agent Learning

Most image captioning models are autoregressive, i.e. they generate each...

0 Longteng Guo, et al. ∙

Xingjian He

Featured Co-authors

Sign in with Google

Consider DeepAI Pro