ICLR

InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation

Published in International Conference on Learning Representations (ICLR), 2024, Stars

Yi Wang, Yinan He, Yizhuo Li, Kunchang Li, Jiashuo Yu, Xin Ma, Xinhao Li, Guo Chen, Xinyuan Chen, Yaohui Wang, Conghui He, Ping Luo, Ziwei Liu, Yali Wang, Limin Wang, Yu Qiao

InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding and Generation

SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction

Published in International Conference on Learning Representations (ICLR), 2024, Stars

Xinyuan Chen, Yaohui Wang, Lingjun Zhang, Shaobin Zhuang, Xin Ma, Jiashuo Yu, Yali Wang, Dahua Lin, Yu Qiao, Ziwei Liu

SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction