AI新模型可将文本转换为生动的图像

如今人工智能越来越强大，比如可以实现生成音乐、改变图片艺术风格等等。最近，人工智能非营利组织openai发布了一个名为dall-e的神经网络，可以将文本转换成与内容相关的图像。
比如生成下面这些穿着芭蕾舞裙挥舞着光剑的熊猫宝宝：
openai在一篇博文中表示，该系统是具有里程碑意义的gpt-3语言模型的120亿参数版本。
dall-e模型具有多种功能，包括创建动物和物体的拟物化版本，以合理的方式展示相关的概念，渲染文本，以及对现有图像进行转换。
比如在该模型中选定“与猫有关的文本关键词”，同时选择给定的其中一种猫类型，最终系统会自动生成一系列与猫主题有关的图像，并且风格呈现多样化。
训练该模型的数据集主要基于互联网大量文本-图像。这使得它能够通过探索提示的结构来创造出全新的图片。比如生成一些令人印象深刻的地标、位置、杂交动物和不同年代设计的图像。但是openai承认并不是所有的结果都是成功的。
不过，openai承认并不是所有生成的结果都是成功的。该公司表示，dall-e系统有时无法绘制出某些特定的项目，混淆了对象与其特定属性之间的关系。
通常，提示dall-e写的字符串越长，成功率越低。测试中发现，重复部分文本内容，准确率有所提高。
当回答有关地理方面的问题时，比如旗帜、菜肴和当地野生动物，dall-e也经常反映出肤浅的刻板印象。考虑到人们越来越关注人工智能算法偏见的问题，这个缺点尤为明显。
openai表示，它计划分析dall-e等模特的社会影响，但该公司认为，该系统表明“通过语言操纵视觉概念现在已经触手可及。”
感兴趣的小伙伴可以在openai网站上查看更多dall-e模型生成的图像。
责编ajx

AI经历资本寒冬、疫情黑天鹅之后行业回归理性迈向深水区
机器视觉检测对比人工检测的优势
如何测试PAM4信号
汽车启动和停止系统电源方法
光伏综合效率分析解读
AI新模型可将文本转换为生动的图像
关于医疗，我们需要什么样的可穿戴设备
芯盾时代推广零信任标杆应用赋能零信任产业高质量发展
人工智能值得注意的六大领域
一加6T实测：水滴全面屏带来高屏占比，电光紫配色吸睛
插接IDE数据线
AutoSAR CAN通信模式转换的条件有哪些
高端装备制造产业现状分析
2013中国舟山海洋电子信息产业深圳推介会成功举行
辉羲智能完成超5000万美元天使+轮融资
北京人防工程内安装充电桩新规范将正式实施
云从科技与四方联合设立工银金融科技创新平台
TCL华星联合三星电子全球首发57吋Mini LED曲面电竞屏
HEIC是什么格式，安卓电脑如何打开HEIC格式
村田制作所：一枚电子元器件的自我修养