Publications | Xin Ma

Yi Wang, Yinan He, Yizhuo Li, Kunchang Li, Jiashuo Yu, Xin Ma, Xinhao Li, Guo Chen, Xinyuan Chen, Yaohui Wang, Conghui He, Ping Luo, Ziwei Liu, Yali Wang, Limin Wang, Yu Qiao (2024). InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation. In ICLR.

PDF Cite Dataset

Xinyuan Chen, Yaohui Wang, Lingjun Zhang, Shaobin Zhuang, Xin Ma, Jiashuo Yu, Yali Wang, Dahua Lin, Yu Qiao, Ziwei Liu (2024). SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction. In ICLR.

PDF Cite Code

Xin Ma, Yaohui Wang, Gengyun Jia, Xinyuan Chen, Ziwei Liu, Yuan-Fang Li, Cunjian Chen, Yu Qiao (2024). Latte: Latent Diffusion Transformer for Video Generation.

Preprint Cite Code Project

Yaohui Wang, Xinyuan Chen, Xin Ma, Shangchen Zhou, Ziqi Huang, Yi Wang, Ceyuan Yang, Yinan He, Jiashuo Yu, Peiqing Yang, Yuwei Guo, Tianxing Wu, Chenyang Si, Yuming Jiang, Cunjian Chen, Chen Change Loy, Bo Dai, Dahua Lin, Yu Qiao, Ziwei Liu (2023). LaVie: High-Quality Video Generation with Cascaded Latent Diffusion Models.

Preprint Cite Code Project

Xin Ma, Xiaoqiang Zhou, Huaibo Huang, Gengyun Jia, Yaohui Wang, Xinyuan Chen, Cunjian Chen (2023). Uncertainty-Aware Image Inpainting with Adaptive Feedback Network. ESWA.

PDF Cite Code

Yaohui Wang, Xin Ma, Xinyuan Chen, Antitza Dantcheva, Bo Dai, Yu Qiao (2023). LEO: Generative Latent Image Animator for Human Video Synthesis.

Preprint Cite Project

Mandi Luo, Xin Ma, Huaibo Huang, Ran He (2022). Style-Based Attentive Network for Real-World Face Hallucination. In PRCV.

PDF Cite

Huanyu Wang, Junjie Liu, Xin Ma, Yang Yong, Zhenhua Chai, Jianxin Wu (2022). Compressing Models with Few Samples: Mimicking then Replacing. In CVPR.

PDF Cite

Xin Ma, Xiaoqiang Zhou, Huaibo Huang, Gengyun Jia, Zhenhua Chai, Xiaolin Wei (2021). Contrastive attention network with dense field estimation for face completion. PR.

PDF Cite

Mandi Luo, Xin Ma, Zhihang Li, Jie Cao, Ran He (2021). Partial NIR-VIS heterogeneous face recognition with automatic saliency search. T-IFS.

PDF Cite

Yuhe Ding, Xin Ma, Mandi Luo, Aihua Zheng, Ran He (2021). Unsupervised Contrastive Photo-to-Caricature Translation based on Auto-distortion. In ICPR.

PDF Cite

Xin Ma, Xiaoqiang Zhou, Huaibo Huang, Zhenhua Chai, Xiaolin Wei, Ran He (2021). Free-form image inpainting via contrastive attention network. In ICPR.

PDF Cite

Gengyun Jia, Meisong Zheng, Chuanrui Hu, Xin Ma, Yuting Xu, Luoqi Liu, Yafeng Deng, Ran He (2021). Inconsistency-aware wavelet dual-branch network for face forgery detection. IEEE Transactions on Biometrics, Behavior, and Identity Science.

PDF Cite

Mandi Luo, Jie Cao, Xin Ma, Xiaoyu Zhang, Ran He (2021). FA-GAN: face augmentation GAN for deformation-invariant face recognition. T-IFS.

PDF Cite