GPT-4多模态模型发布，对ChatGPT的升级和断崖式领先

3 月14日晚，openai 宣布发布 gpt-4。
此次的 gpt4.0 产品具备多模态，相比于 gpt-3.5，gpt4.0 新增视频功能，并且能够适用于所有语言。gpt-4.0 有望加速 aigc 的应用普及，并且在视频内容生成方面大放异彩，aigc 有望步入快速发展阶段，背后大幅增长的训练参数量有望加速 ai 算力的建设以及高速光通信的需求。openai 发布了一项新服务，允许开发人员直接使用 chatgpt，并且将使用价格削减了 90%，此次大规模降价意味着底层技术平台的优化，这也将进一步加速此项技术的大规模商业化进程。
而且 gpt-4 是多模态的，同时支持文本和图像输入功能。此外，gpt-4 比以前的版本“更大”，这意味着其已经在更多的数据上进行了训练，并且在模型文件中有更多的权重，这也使得它的运行成本更高。
gpt-4 在一系列基准测试中的表现优于 gpt-3.5
openai 称它使用了微软 azure 来训练模型，但没有公布有关具体模型大小或用于训练它的硬件的详细信息。
据悉，gpt-4 参加了多种基准考试测试，包括美国律师资格考试 uniform bar exam、法学院入学考试 lsat、“美国高考”sat 数学部分和证据性阅读与写作部分的考试，在这些测试中，它的得分高于 88% 的应试者。
openai 表示，已经与多家公司合作，要将 gpt-4 结合到他们的产品中，包括 duolingo、stripe 和 khan academy。gpt-4 模型也将以 api 的形式，提供给付费版 chatgpt plus 的订阅用户，允许开发者付费将 ai 集成到他们的应用程序中。微软表示，新款的必应（bing）搜索引擎将运行于 gpt-4 系统之上。
一觉醒来，万众期待的gpt-4，它来了！
openai老板sam altman直接开门见山地介绍说：
这是我们迄今为止功能最强大的模型！
有多强？
根据openai官方的介绍，gpt-4是一个超大的多模态模型，也就是说，它的输入可以是文字（上限2.5万字），还可以是图像。
（看图）手套掉下去会怎样？它会掉到木板上，并且球会被弹飞。
甚至只需要简单在纸上画一个网站的草稿图：
拍一张照片上传给gpt-4，它就可以立马生成网站的html代码！
在性能表现上，openai直接甩出一句话：
在各种专业和学术基准上和人类相当！
而且不只是发布gpt-4这么简单，openai这次“啪的一下”把相关“大动作”一步到位了：
chatgpt plus：集成gpt-4的chatgpt升级版
发布gpt-4的api
公布技术论文 * 公开system card
不仅如此，传闻的“必应早就用上了gpt-4”在今天也得到了微软方面的证实：
没错，确实是这样的！
不得不说，自打chatgpt问世以来，微软和谷歌之间打响的数轮科技战役，微软这次又双叒叕赢麻了。
甚至这一次，不少网友都发出了“见证历史”的感慨：
史上最强大模型
正如之前传言，gpt-4确实拥有多模态能力，可以接受图像输入并理解图像内容。
并且可接受的文字输入长度也增加到3.2万个token（约2.4万单词）。
升级之后，gpt-4在各种职业和学术考试上表现和人类水平相当。
比如模拟律师考试，gpt-4取得了前10%的好成绩，相比之下gpt-3.5是倒数10%。
做美国高考sat试题，gpt-4也在阅读写作中拿下710分高分、数学700分（满分800）。
那么gpt-4这些新能力实际用起来是什么样的？技术报告中也给出不少展示。
首先，看图能力可以用来解释表情包、梗图。
提问这张图哪里好笑？gpt-4可以按顺序描述出每一格的内容，并总结出笑点：
用巨大的过时vga接口给小巧的现代智能手机充电。
更进一步，gpt-4可以理解图表中数据的含义，并做进一步计算。
甚至可以直接把论文截图发给它，gpt-4可以按像素处理其中的文字和图片，并给出对整篇论文的总结摘要。
文字输入长度限制的增加，也大大扩展了gpt-4的实用性。
发布会直播上，openai总裁gregman现场表演了一波gpt-4给代码修bug。
出现问题啥也不用想，直接把1万字的程序文档一股脑扔给gpt-4就行。格式也不用管，你只需要ctrl+a、ctrl+c、ctrl+v。
再最后附上出现的问题，在几秒钟内瞬间得到解决办法。
在api方面，gpt-4还开放了一个使用功能，允许修改“系统提示”。
之前chatgpt的回答总是冗长而平淡，这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月”。
现在通过修改这句话，gpt-4就可以展现出更多样的性格，比如扮演苏格拉底。
也可以指定之后所有回答的形式，比如全用json格式。
虽然gpt-4这波能力大升级，但之前chatgpt会出现幻觉、胡说八道的毛病还是没能完全改掉。
从前面的官方示例也可以看出，要想最大程度发挥gpt-4的能力，最好还是用上思维链路提示（chain-of-thought prompt）。
操作起来也非常简单，只需在提问的时候额外提醒ai给出步骤，就能大大提高推理和计算的准确率。
谷歌依旧在跟
就在gpt-4发布前，谷歌方面为了迎战微软，宣布将一系列即将推出的aigc功能，应用到自家产品中。
包括谷歌 docs（文档）、gmail、sheets（表格）和 slides（幻灯片）。
但不同于微软和openai的“发布即可用”，谷歌只会先将docs和gmail中的ai工具，在月底提供给一些“值得信赖的开发人员”。
而其它功能则将是在今年晚些时候向公众开放。
至于具体时间，谷歌方面并没有具体说明。
而外界对此评价是谷歌希望抢先微软原定于本周四的发布。
但从今天的结果上来看，微软依旧提前“抢滩登陆”。
在gpt-4发布之前，便有网友做出了gpt-3和gpt-4参数量的对比图，并猜测gpt-4的参数量将达到100万亿。
这一次亦是如此。
有网友预言，未来gpt-5的参数量，会是这样的：
但无论如何，这一次，我们离真·人工智能，更近了一步。

汽车的蓄电池柱头松动的巧妙处理方法
锁定鲁尔圆锥接头多功能测试仪
粤港澳大湾区最大新型储能电站投运
今日看点丨华为重磅官宣：车BU独立运营，长安入股不超过40%；阿里达摩院确认撤裁量子实验室
博士生David Abel详细整理了一份87页的ICML大会笔记
GPT-4多模态模型发布，对ChatGPT的升级和断崖式领先
管廊巡检机器人的大作用：灭隐患于萌芽
芯片制造应关注功率半导体
bga返修台哪个牌子好_十大bga返修台品牌排行榜
解密海思承载着华为芯片的研发和销售
韩国机器人企业动作频繁意图进军中国市场
泰景信息科技移动电视接收芯片应用于摩比麦斯移动科技的 CDM
linux CPU是这样动态调频
基于MSP430单片机的智能充电照明控制系统设计
改进电源故障保护电路
电动汽车DC/DC转换器的分类和工作原理简析
无人机和漫游者的组合：混合动力无人机设计
Tick-Tock战略或已完蛋，未来的10nm处理器上，英特尔正在考虑放弃核显GPU
新能源汽车正逐渐获得市场的接受，国产品牌争奇斗艳
深兰科技入围“虎嗅·大鲸榜2023工业AI高成长科技公司TOP30”