谷歌DeepMind推出Genie 2 AI模型:能够创建持续1分钟的游戏世界

时间:2025-01-02 00:04:17
编辑:001资源网

12月5日消息,谷歌旗下人工智能研究机构 DeepMind 发布了一款名为 Genie 2 的新型模型,可通过单张图片和文字描述生成“无限”种类的可玩 3D 世界。作为今年初推出的 Genie 模型的升级版,Genie 2 标志着人工智能在虚拟世界生成领域的一次重大突破。

谷歌DeepMind推出Genie 2 AI模型:能够创建持续1分钟的游戏世界

Genie 2 能够根据用户输入的文本描述和图像,实时生成交互式的三维场景。例如,输入“森林中的可爱人形机器人”,模型便可构建一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作角色在世界中进行跳跃、游泳等互动。

DeepMind 表示,Genie 2 可以生成具有不同视角(如第一人称视角和等距视角)的连贯世界,持续时间长达一分钟,其中大多数持续 10 到 20 秒。

DeepMind 还称,Genie 2 在生成过程中能够模拟物体交互、动画、光照、物理反射以及“非玩家角色”(NPC)的行为。许多生成的场景画质接近 AAA 级别的电子游戏,甚至在物体视角一致性和场景记忆方面表现优异。

与之类似的模型还有李飞飞创立的 World Labs 和以色列初创公司 Decart 的产品,虽然大多数像 Genie 2 这样的模型 —— 也就是世界模型 —— 可以模拟游戏和 3D 环境,但存在伪影、一致性和幻觉相关的问题。例如,Decart 的 Minecraft 模拟器 Oasis 分辨率低,并且很快就会“忘记”关卡的布局。然而,Genie 2 可以记住模拟场景中不在视野范围内的一部分,并在它们再次可见时准确地渲染它们。(World Labs 的模型也可以做到这一点。)

值得注意的是,DeepMind 未详细披露 Genie 2 的训练数据来源,但业内推测其可能包括大量热门游戏的游玩记录。考虑到谷歌可访问 YouTube 海量视频资源,并声称拥有使用其内容进行训练的权利,这引发了外界对该模型是否侵犯知识产权的争议。

目前用 Genie 2 创建的游戏实际上不会那么有趣,因为每隔一分钟左右就会抹去进度。因此,DeepMind 将其定位为研究与创意工具,应用于快速原型设计和 AI 智能体评估等场景。

DeepMind 在其博客中写道:“通过 Genie 2 的泛化能力,概念艺术和手绘草图可以转化为完全互动的环境。这让研究人员能够快速生成多样化的环境,为未见过的任务场景提供评估支持。”

谷歌对世界模型研究的投入在持续扩大。今年 10 月,DeepMind 聘请了 OpenAI 前视频生成项目负责人 Tim Brooks,同时两年前从 Meta 挖来了以开放式实验闻名的 Tim Rocktäschel。

谷歌推出日语版Gemma AI模型:仅20亿参数,适合移动设备运行

近日消息,在东京举行的 Gemma 开发者日活动中,谷歌发布了最新的日语版 Gemma AI 模型。这款模型虽然只有20亿参数,却能展现出与GPT-3.5相当的性能,其紧凑的设计使其非常适合部署在移动设备上。

谷歌推出日语版Gemma AI模型:仅20亿参数,适合移动设备运行

这次发布的 Gemma 模型,在日语处理上表现出色,同时也保持了其在英语上的能力。对于小型模型来说,这一点特别重要,因为在进行新语言的微调时,它们可能会面临 “灾难性遗忘” 的问题,即新学到的知识会覆盖之前学到的信息。但是 Gemma 成功克服了这个难题,展现了强大的语言处理能力。

更值得一提的是,谷歌还通过 Kaggle 和 Hugging Face 等平台,立即发布了模型的权重、训练材料和示例,帮助开发者更快入门。这意味着,开发者们可以轻松使用这个模型来进行本地计算,尤其是在边缘计算应用中,将会带来更多的可能性。

为了鼓励更多的国际开发者,谷歌还推出了一项名为 “解锁全球沟通与 Gemma” 的比赛,奖金高达15万美元。这个计划旨在帮助开发者将 Gemma 模型适配到本地语言。目前,已经有阿拉伯语、越南语和祖鲁语的项目在进行中。在印度,开发者们正在进行 “Navarasa” 项目,计划将模型优化为支持12种印度语言,而另一个团队则在研究通过微调支持韩语方言。

Gemma2系列模型的推出,旨在用更少的参数实现更高的性能。与 Meta 等其他公司的类似模型相比,Gemma2的表现同样优秀,甚至在某些情况下,2亿参数的 Gemma2还能够超越一些拥有700亿参数的模型,比如 LLaMA-2。

开发者和研究人员可以通过 Hugging Face、谷歌 AI 工作室和谷歌 Colab 的免费计划获取 Gemma-2-2B 模型及其他 Gemma 模型,此外,还可以在 Vertex AI 模型花园中找到它们。

相关攻略
相关推荐