Jingdong Chen

research

∙ 09/15/2023

The Multimodal Information Based Speech Processing (MISP) 2023 Challenge: Audio-Visual Target Speaker Extraction

Previous Multimodal Information based Speech Processing (MISP) challenge...

0 Shilong Wu, et al. ∙

research

∙ 09/08/2023

Mapping EEG Signals to Visual Stimuli: A Deep Learning Approach to Match vs. Mismatch Classification

Existing approaches to modeling associations between visual stimuli and ...

0 Yiqian Yang, et al. ∙

research

∙ 03/11/2023

The Multimodal Information based Speech Processing (MISP) 2022 Challenge: Audio-Visual Diarization and Recognition

The Multi-modal Information based Speech Processing (MISP) challenge aim...

0 Zhe Wang, et al. ∙

research

∙ 11/08/2022

Robust Manifold Nonnegative Tucker Factorization for Tensor Data Representation

Nonnegative Tucker Factorization (NTF) minimizes the euclidean distance ...

0 Jianyu Wang, et al. ∙

research

∙ 03/20/2022

SimAN: Exploring Self-Supervised Representation Learning of Scene Text via Similarity-Aware Normalization

Recently self-supervised representation learning has drawn considerable ...

0 Canjie Luo, et al. ∙

research

∙ 03/14/2022

Hierarchical Memory Learning for Fine-Grained Scene Graph Generation

As far as Scene Graph Generation (SGG), coarse and fine predicates mix i...

0 Youming Deng, et al. ∙

research

∙ 03/13/2022

Training Protocol Matters: Towards Accurate Scene Text Recognition via Training Protocol Searching

The development of scene text recognition (STR) in the era of deep learn...

0 Xiaojie Chu, et al. ∙

research

∙ 07/01/2021

CBNetV2: A Composite Backbone Network Architecture for Object Detection

Consistent performance gains through exploring more effective network st...

0 Tingting Liang, et al. ∙

research

∙ 06/24/2021

MatchVIE: Exploiting Match Relevancy between Entities for Visual Information Extraction

Visual Information Extraction (VIE) task aims to extract key information...

10 Guozhi Tang, et al. ∙

research

∙ 05/23/2021

CMUA-Watermark: A Cross-Model Universal Adversarial Watermark for Combating Deepfakes

Malicious application of deepfakes (i.e., technologies can generate targ...

3 Hao Huang, et al. ∙

research

∙ 04/08/2021

AISHELL-4: An Open Source Dataset for Speech Enhancement, Separation, Recognition and Speaker Diarization in Conference Scenario

In this paper, we present AISHELL-4, a sizable real-recorded Mandarin sp...

0 Yihui Fu, et al. ∙

research

∙ 11/19/2019

Partial AUC optimization based deep speaker embeddings with class-center learning for text-independent speaker verification

Deep embedding based text-independent speaker verification has demonstra...

0 Zhongxin Bai, et al. ∙

research

∙ 01/02/2019

End-to-End Model for Speech Enhancement by Consistent Spectrogram Masking

Recently, phase processing is attracting increasinginterest in speech en...

0 Xingjian Du, et al. ∙

research

∙ 12/08/2015

Deep Speech 2: End-to-End Speech Recognition in English and Mandarin

We show that an end-to-end deep learning approach can be used to recogni...

0 Dario Amodei, et al. ∙

Jingdong Chen

Featured Co-authors

Sign in with Google

Consider DeepAI Pro