带有新变质视频功能的文本到视频AI花朵-科学知识-网者头条

摘要：计算机科学家开发了一种新的AI文本对视频模型，该模型从延时视频中学习了现实世界的物理知识。...

尽管Openai的Sora（例如Openai的Sora）在我们眼前迅速变质的文字视频人工智能模型，但他们一直在努力制作变质视频。对于AI系统而言，模拟树发芽或花朵开花比生成其他类型的视频更难，因为它需要物理世界的知识，并且可能差异很大。

带有新变质视频功能的文本到视频AI花朵

但是现在，这些模型已经采取了进化步骤。

罗切斯特大学，北京大学，加利福尼亚大学，圣克鲁斯大学和国立大学的计算机科学家开发了一种新的AI文本与视频模型，该模型从延时视频中学习真实世界的物理知识。该团队在发表的一篇论文中概述了他们的模特MagictimeIEEE关于模式分析和机器智能的交易。

“已经开发了人工智能来理解现实世界，并模拟发生的活动和事件，”罗切斯特计算机科学系的Jiebo Luo教授的博士生Jinfa Huang说，他们都是论文的作者之一。 “ Magictime是朝着人工智能迈出的一步，可以更好地模拟我们周围世界的物理，化学，生物学或社会特性。”

以前的模型生成的视频通常具有有限的运动和变化差。为了培训AI模型以更有效地模仿变质过程，研究人员开发了一个高质量的数据集，其中包含2,000多个带有详细标题的延时视频。

当前，Magictime的开源U-NET版本生成两秒钟，512-By-512像素剪辑（以每秒8帧为单位），并且随附的扩散转换器体系结构将其扩展到十秒钟的剪辑。该模型不仅可以用于模拟生物学变形，还可以模拟烤箱中经过建筑或面包烘烤的建筑物。

但是，尽管产生的视频在视觉上很有趣，并且演示很有趣，但研究人员认为这是迈向更复杂的模型的重要一步，可以为科学家提供重要的工具。

黄说：“我们希望有一天，生物学家可以使用生成性视频来加快对思想的初步探索。” “尽管物理实验仍然必不可少以进行最终验证，但准确的模拟可以缩短迭代周期并减少所需的实时试验数量。”