标题:Google 文生图 AI Gemini 重塑行业边界:9个案例解析其能力极限
来源:微信公众号:一泽Eze,作者:一泽Eze
引言: Google 终于发布了去年承诺的“可连续对话改图”技术——Gemini 文生图能力。本文将深入探讨这一创新技术,通过9个测试案例,带你全面了解 Gemini 的能力边界。
Gemini 文生图能力总体评价: 1. Gemini(或称 Imagen3)无疑是当前设计行业乃至整个碳基社会最值得关注的文生图 AI。 2. 在自然语言指令理解、材质质感复现、局部细节微调等方面,Gemini 已达到部分生产创作环节的可用水准(尽管某些案例仍有提升空间)。 3. 这项技术几乎可以被称为 AI 的许愿机、超级嘴炮魔法,毫不夸张地说,它甚至能让“快变天了”这样的指令变为现实。
本文将通过以下测试和案例,带你深入了解 Gemini 的能力:
主要测试:挑战 AI 能力边界
主测试 1:简单形体的材质变换、连续微调形态细节,并大幅度改变视角 - 我们首先用一些极具挑战性的案例来测试 Gemini 文生图的能力极限。 - 在第一个测试案例中,我们从简单的正方体开始,观察 Gemini 的表现。 - 整个测试过程流畅连贯,指令理解准确,材质变换自然,基础形态保持不变,甚至还能大幅调整相机视角,添加模特也毫无压力。 - (PS:这个“简单”案例已经超越了其他所有文生图 AI,这不过分吧?)
主测试 2:手绘稿转设计渲染图,顺便拍出产品宣传图 - 在第一个测试的基础上,我们提升到设计生产级别,用一张手绘图作为基础,让 Gemini 完成全流程的产品造型概念设计推敲。 - 这个案例对于许多设计公司来说至关重要: - 这张图已经是最有力的证明,无需过多解读。 - 尽管在实际测试中,产品穿在人身上的效果并不稳定,总会有些许人像与产品的变形。 - 然而,仅从手稿转 3D 产品渲染图这一环节,就能进行局部设计的微调,其水平已远超本科设计专业毕业生的水平(是的,我就是工业设计毕业的)。 - 此外,Gemini 还能在概念设计阶段快速生成模特使用场景图,进一步验证设计方案的效果。 - 值得一提的是,每张图的生成时间不超过 10 秒……这还不够“炸裂”吗?
主测试 3:一次性生成多套不同风格的设计 - 在本文的最后,我们将探讨工业设计领域的应用,并展示更多元的案例,如游戏设计、自媒体应用等。 - 在测试 Gemini 文生图的 4 小时内,我几乎每分钟都在惊叹不已。 - 这个案例进一步模拟了工业设计的造型推敲环节。 - 以前,我们需要在犀牛(一套工业设计建模软件)中花费数天时间建模,然后在 keyshot(一套工业设计渲染软件)中调整材质、打光出图。 - 现在只需 20 秒,Gemini 就能一次性生成 12 张设计图。
主测试 4:抠图、换背景、打光影 - 在完成产品设计后,我们还需要解决最终宣传物料的问题。 - 这时,抠图、换背景、打光影等流程变得至关重要。 - 我们先进行抠图和换背景的测试: - 结果令人满意,背景更换得非常好。 - 接下来,我们看看商业级别的背景合成与打光: - 引用一个 WaytoAGI 上的例子,效果堪称完美。 - 每次只需一句指令,就能在 10 秒内取得相当稳定的结果。即使是复杂的形体打光,也能处理得有模有样。
结语: 经过一系列测试,我们不禁感叹:大碳奸恭迎硅基老爷重塑人类社会。
社区实例一览: - 接下来,让我们看看社区中大家尝试的应用实例,以获得更多启发。 - 更多应用案例包括游戏角色与道具设计、家装设计、创作教育、自媒体内容素材、漫画绘制与改色,以及游戏复杂场景与动作变换预览。
如何使用 Gemini 文生图? 1. 登录 Google AI studio,链接:https://aistudio.google.com/prompts/new_chat 2. 在 Model 中选择 PREVIEW - Gemini 2.0 Flash Experimental(new) 3. 确认选择“Images and text”
参与重塑人类社会的行列: - 好的,现在也和我一起参与到恭迎硅基老爷重塑人类社会的行列吧~ - (Btw:我的一个设计师朋友对此评价:以前我可以假装建模、抠图磨洋工,现在老板只会跟我说赶紧 AI 生产改完发他了。)
免责声明: 本文来自微信公众号:一泽Eze,作者:一泽Eze。本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com。本文来自虎嗅,原文链接:https://www.huxiu.com/article/4062550.html
排版说明: - 每个标题和段落之间使用空行分隔,以增强阅读体验。 - 使用项目符号列举测试案例和应用实例,使内容更清晰。 - 确保所有链接和引用都准确无误。