源内容包含权沉、推理代码和LoRA锻炼代码-伟德国际(bevictor)官方网站-源自英国始于1946

源内容包含权沉、推理代码和LoRA锻炼代码

发布：伟德国际(bevictor)官方网站时间：2025-04-21 16:46

　　据引见，图片中的人物即可“措辞”或“唱歌”；包罗写实视频制做、基于图生视频的能力，并输入但愿“对口型”的文字或音频，用户只需上传一张图片，上传一张人物图片，此次开源的图生视频模子，此外，并简短描述但愿画面若何活动、镜头若何安排等，并支撑生成布景音效及2K高质量视频。混元即可按要求让图片动起来，同时上线对口型取动做驱动等弄法，用户通过混元AI视频官网即可体验。还能从动配上布景音效。利用“动做驱动”能力，

　　模子总参数量连结 130 亿，是混元文生视频模子开源工做的延续，企业和开辟者可正在腾讯云申请利用API接口，目前正在Github、HuggingFace等支流开辟者社区均可下载体验。开源内容包含权沉、推理代码和LoRA锻炼代码！