先做个广告:如需代注册GPT帐号或代充值ChatGPT4会员,请添加站长客服微信:gptchongzhi
,OpenAI今日凌晨重磅推出全新多模态模型GPT-4o,宣布向全体用户免费开放,引发热议,作为原生多模态AI,该模型无需嫁接模块即可支持文本、图像、语音跨模态实时交互,尤其文生图功能能以接近人类理解力完成复杂指令,纠正细节误差,准确率达新高度,其响应速度较前代提升数倍,生成质量更自然流畅,可供用户完成设计创作、数据分析、多语言翻译等多元任务,OpenAI强调免费策略旨在降低AI使用门槛,覆盖办公、教育、创意等领域个人及中小企业需求,此次升级或进一步推动生成式AI普及化应用,标志着多模态技术进入高效协同新阶段。
今日凌晨,OpenAI的直播带来GPT-4o的重大更新,提供文生图原生多模态模型。
目前该模型已经内置到GPT-4o中,也就是说你不用再在Sora中画图了,也不需要用Dallle3了。
GPT-4o图像生成强大的地方主要体现在准确呈现文本、精确遵循提示以及利用 4 o固有的知识库和聊天上下文方面表现出色,包括转换上传的图像或将其用作视觉灵感。
直接看效果:
此次GPT-4o文生图原生多模态模型改进的能力有:
4o 将精确的符号与图像融合在一起的能力将图像生成变成了视觉传达的工具。
这里路标上的文字是没有任何错误的,都是提示词中有提到过。
2.Multi-turn generation 多轮对话生成
由于图像生成现在是 GPT-4 o 本机的,因此您可以通过自然对话来优化图像。GPT-4 o 可以在聊天环境中构建图像和文本,确保整个过程的一致性。例如,如果您正在设计一个视频游戏角色,在您优化和试验时,角色的外观在多次迭代中保持一致。
3.Instruction following 遵循指令
GPT-4 o 的图像生成遵循详细的提示,注重细节。当其他系统只能处理 5-8 个对象时,GPT-4 o 可以处理多达 10-20 个不同的对象。对象与其特征和关系的紧密绑定允许更好的控制。
4.In-context learning 情境学习
GPT-4o可以分析和学习用户上传的图像,将其细节无缝集成到其上下文中,以通知图像生成。
5.World knowledge 世界知识
原生图像生成使 4o 能够将文本和图像之间的知识联系起来,从而产生更智能、更高效的模型。
推荐使用ChatGPT中文版,国内可直接访问:https://ai.gpt86.top
6.Photorealism and style 摄影现实主义和风格
对反映各种图像风格的图像进行训练,使模型能够令人信服地创建或转换图像。
提示词:一只猫看着街道上的一滩水,但它的倒影是一只老虎,两个倒影都被水中的涟漪逼真地扭曲了。
目前,GPT-4o 图像生成已经作为ChatGPT中的默认图像生成器使用了,包括:Plus、Pro、Team和Free版本,Enterprise和Edu版本也会很快推出。同时Sora中也可以使用。
好了,大家可以去试试了。
参考来源:
https://openai.com/index/introducing-4o-image-generation/
—— End ——
关注「AI掘金社」,在新的大时代掘到属于自己的金色价值!