Recent Publication

Quickly discover relevant content by filtering publications.

Trajectory-guided Anime Video Synthesis via Effective Motion Learning

Published in Pacific Conference on Computer Graphics and Applications (PG), 2025

Jian Lin, Chengze Li, Haoyun Qin, Hanyuan Liu, Xueting Liu, Xin Ma, Cunjian Chen, Tien-Tsin Wong

Consistent and Controllable Image Animation with Linear Motion Diffusion Transformers

Published in IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2026, Stars

Xin Ma, Yaohui Wang, Jia Gengyun, Xinyuan Chen, Tien-Tsin Wong, Cunjian Chen

Training-free Stylized Text-to-Image Generation with Fast Inference

arXiv preprint arXiv:2505.19063, Stars

Xin Ma, Yaohui Wang, Xinyuan Chen, Tien-Tsin Wong, Cunjian Chen

Consistent and Controllable Image Animation with Motion Diffusion Models

Published in Computer Vision and Pattern Recognition (CVPR), 2025, Stars

Xin Ma, Yaohui Wang, Gengyun Jia, Xinyuan Chen, Tien-Tsin Wong, Yuan-Fang Li, Cunjian Chen

Consistent and Controllable Image Animation with Motion Diffusion Models

InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation

Published in International Conference on Learning Representations (ICLR), 2024, Stars

Yi Wang, Yinan He, Yizhuo Li, Kunchang Li, Jiashuo Yu, Xin Ma, Xinhao Li, Guo Chen, Xinyuan Chen, Yaohui Wang, Conghui He, Ping Luo, Ziwei Liu, Yali Wang, Limin Wang, Yu Qiao

InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation

SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction

Published in International Conference on Learning Representations (ICLR), 2024, Stars

Xinyuan Chen, Yaohui Wang, Lingjun Zhang, Shaobin Zhuang, Xin Ma, Jiashuo Yu, Yali Wang, Dahua Lin, Yu Qiao, Ziwei Liu

SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction

Latte: Latent Diffusion Transformer for Video Generation

Published in Transactions on Machine Learning Research (TMLR), 2025, Stars

Xin Ma, Yaohui Wang, Xinyuan Chen, Gengyun Jia, Ziwei Liu, Yuan-Fang Li, Cunjian Chen, Yu Qiao

Latte: Latent Diffusion Transformer for Video Generation

LaVie: High-Quality Video Generation with Cascaded Latent Diffusion Models

Published in International Journal of Computer Vision (IJCV), 2024, Stars

Yaohui Wang, Xinyuan Chen, Xin Ma, Shangchen Zhou, Ziqi Huang, Yi Wang, Ceyuan Yang, Yinan He, Jiashuo Yu, Peiqing Yang, Yuwei Guo, Tianxing Wu, Chenyang Si, Yuming Jiang, Cunjian Chen, Chen Change Loy, Bo Dai, Dahua Lin, Yu Qiao, Ziwei Liu

LaVie: High-Quality Video Generation with Cascaded Latent Diffusion Models

Uncertainty-Aware Image Inpainting with Adaptive Feedback Network

Published in Expert Systems with Applications (ESWA), 2023, Stars

Xin Ma, Xiaoqiang Zhou, Huaibo Huang, Gengyun Jia, Yaohui Wang, Xinyuan Chen, Cunjian Chen

Uncertainty-Aware Image Inpainting with Adaptive Feedback Network

LEO: Generative Latent Image Animator for Human Video Synthesis

Published in International Journal of Computer Vision (IJCV), 2024

Yaohui Wang, Xin Ma, Xinyuan Chen, Cunjian Chen, Antitza Dantcheva, Bo Dai, Yu Qiao

Style-Based Attentive Network for Real-World Face Hallucination

Published in Pattern Recognition and Computer Vision (PRCV), 2022

Mandi Luo, Xin Ma, Huaibo Huang, Ran He

Style-Based Attentive Network for Real-World Face Hallucination

Compressing Models with Few Samples: Mimicking then Replacing

Published in Computer Vision and Pattern Recognition (CVPR), 2022,

Huanyu Wang, Junjie Liu, Xin Ma, Yang Yong, Zhenhua Chai, Jianxin Wu

Compressing Models with Few Samples: Mimicking then Replacing

Contrastive attention network with dense field estimation for face completion

Published in Pattern Recognition (PR), 2022

Xin Ma, Xiaoqiang Zhou, Huaibo Huang, Gengyun Jia, Zhenhua Chai, Xiaolin Wei

Contrastive attention network with dense field estimation for face completion

Partial NIR-VIS heterogeneous face recognition with automatic saliency search

Published in IEEE Transactions on Information Forensics and Security (T-IFS), 2021

Mandi Luo, Xin Ma, Zhihang Li, Jie Cao, Ran He

Free-form image inpainting via contrastive attention network

Published in International Conference on Pattern Recognition (ICPR), 2021

Xin Ma, Xiaoqiang Zhou, Huaibo Huang, Zhenhua Chai, Xiaolin Wei, Ran He

Free-form image inpainting via contrastive attention network

Unsupervised Contrastive Photo-to-Caricature Translation based on Auto-distortion

Published in International Conference on Pattern Recognition (ICPR), 2021

Yuhe Ding, Xin Ma, Mandi Luo, Aihua Zheng, Ran He

Unsupervised Contrastive Photo-to-Caricature Translation based on Auto-distortion

Inconsistency-aware wavelet dual-branch network for face forgery detection

Published in IEEE Transactions on Biometrics, Behavior, and Identity Science (T-BIOM), 2021

Gengyun Jia, Meisong Zheng, Chuanrui Hu, Xin Ma, Yuting Xu, Luoqi Liu, Yafeng Deng, Ran He

Inconsistency-aware wavelet dual-branch network for face forgery detection

FA-GAN: face augmentation GAN for deformation-invariant face recognition

Published in IEEE Transactions on Information Forensics and Security (T-IFS), 2021

Mandi Luo, Jie Cao, Xin Ma, Xiaoyu Zhang, Ran He

FA-GAN: face augmentation GAN for deformation-invariant face recognition

Granted Patents

Model training method, map building method and device, CN114972909B
Human face image super-resolution method based on attention mechanism, CN111080513B
Image super-resolution method of adversarial generative network based on fusion mutual information, CN110660020B
Image super-resolution method of deep neural network fusing mutual information, CN110211035B
Attention-mechanism-based image completion method and device, CN112184582B
Cartoon style image conversion model training method, image generation method and device, CN112232485B
Image completion method based on uncertainty estimation, CN112686817B