AI大模型引发算力变革，英特尔与百度联合发起飞桨+文心大模型硬件生态共创计划，加速大模型开发与落地

8月16日，英特尔在wave summit 2023深度学习开发者大会上，携第四代英特尔至强可扩展处理器、英特尔oneapi 和英特尔发行版openvino 等人工智能全栈软硬件解决方案，与众多人工智能专家学者和开发者深入交流，展示了英特尔ai的端到端能力。
同时，英特尔正式宣布与百度联合发起飞桨+文心大模型硬件生态共创计划，双方将共同推进在英特尔硬件上与飞桨+文心大模型的适配。此项计划将进一步拓展双方在大模型领域的合作，并构建更加高效、完整的ai生态，助力大模型的落地应用。
以大语言模型为代表的人工智能技术在全球掀起科技和产业创新浪潮，加速产业升级和经济增长。我们也在积极探索英特尔数据中心gpu 和habana gaudi 2 在大语言模型领域的合作机会，为ai行业创新提供新动力。
—英特尔中国区互联网行业总经理胡凯
飞桨（paddlepaddle）是百度自主研发的中国首个开源开放、功能丰富的产业级深度学习平台，是百度“芯片-框架-模型-应用”全栈技术布局的重要组成部分，与芯片层深度适配与融合优化，并高效支撑以文心一言为代表的文心大模型的生产与应用。当前飞桨已凝聚800万开发者，广泛服务于金融、能源、制造、交通等领域。而文心大模型是百度产业级知识增强大模型，以“知识增强”为特色，引入知识图谱，将数据与知识融合，提升了学习效率及可解释性。
近年来，英特尔与百度飞桨已经进行了长期深入的技术合作，并取得了丰硕成果。从2017年开始，不断拓展双方合作的深度和广度，双方成立了联合技术团队实现英特尔ai加速软件栈与飞桨的持续集成，从硬件上积极适配全系列英特尔至强可扩展处理器ai产品。在软件层面，通过英特尔 oneapi 深度神经网络库 (英特尔 onednn )调用英特尔 avx-512、英特尔深度学习加速（英特尔 dl boost ）、英特尔高级矩阵扩展amx（英特尔advanced matrix extensions）等底层加速技术，对百度飞桨中 nlp，cv 等各类别模型和框架进行了深度优化。例如百度ernie 3.0轻量化版本ernie-tiny 模型，基于英特尔软硬件的联合优化，性能获得了显著的提升。
在大模型方面，英特尔计划推出针对至强可扩展处理器平台高度优化的大语言模型（llm）推理加速引擎。该加速引擎兼容 huggingface 等主流的模型格式，支持opt，llama，chatglm，falcon 等多种主流大语言模型在fp16/bf16/int8数据格式上的推理加速，可以充分利用至强可扩展处理器平台上的底层硬件加速进行加速，同时具有良好的跨节点扩展性，加速英特尔至强可扩展处理器与飞桨+文心大模型的适配，助力ai算力+大模型算法融合发展。
从 2022.1 版本发布开始，英特尔ai推理工具套件英特尔 openvino 也正式直接支持飞桨模型，大大提升了模型在英特尔异构硬件上的推理性能和可用性。英特尔 openvino 与百度飞桨围绕模型构建、优化及部署三个方面的合作不断深入，不仅帮助开发者减少中间环节，还能够让一些大模型在边缘部署成为可能，优化了整个的边缘推理和操作流程。目前，英特尔 openvino 不仅能够支持飞桨模型在英特尔 cpu 和集成显卡上部署、在英特尔独立显卡上部署，还可以通过一行代码支持飞桨模型在多张独立显卡上部署。英特尔 openvino 的最新版本也引入对paddleslim 量化后模型以及ernie tiny 模型的直接支持，以实现在英特尔平台上更优异的性能表现。同时，英特尔 openvino 与百度飞桨持续在社区生态发力，连续三年参与飞桨黑客马拉松，众多pr被合入openvino 主代码，并多次开展各类线上线下研讨会、训练营，与百度飞桨共建ai繁荣生态，为 ai 开发者提供全方位支持。
如今生成式人工智能浪潮迭起，大模型逐渐成为新一轮科技革命和产业变革的重要驱动力量，而超级ai算力+大模型算法是此次变革进程中的基础和核心。英特尔与飞桨+文心大模型将持续携手，聚生态之力，共同打造软硬一体的人工智能大模型平台，为人工智能尤其是大模型的快速发展和应用落地提供坚实的基础。
参考资料：
1 测试配置如下：测试配置 1：处理器：双路英特尔至强铂金 8358p 处理器，主频 2.6ghz，32 核心 64 线程，睿频开启；内存：512gb dram（16x32gb ddr4 3200 mt/s [2933 mt/s])；存储：intel_ ssdsc2kg960g8, intel_ssdsckkb480g8；网络适配器：2x ethernet controller 10g x550t；bios 版本：06.00.01；操作系统版本：ubuntu 20.04.4 lts (kernel：5.8.0-43-generic)；gcc 版本：8.4；英特尔 onednn 版本：2.6；工作负载：paddlepaddle 2.3，ernie-3.0 optimization for int8；

索尼认为PSVR可以做得更好但对PSVR销量满意
为企业数据保驾护航，IBM Storage Defender 正式发布
NVIDIA凭借GPU优势有望在服务器处理器三大芯片中占据其二
维护网络环境从代码开始
Libra稳定币将是数字货币创新的未来
AI大模型引发算力变革，英特尔与百度联合发起飞桨+文心大模型硬件生态共创计划，加速大模型开发与落地
关于机器视觉检测技术
当前安防行业的现状分析
如何制作一个简易的显微镜？
台积电的成功秘诀
肯尼亚航空表示将不会取消其波音737 MAX 8飞机订单
九齐NY8B062D单片机的特征、功能及应用
IO-Link技术与意法半导体NATALE TESTA
自动驾驶系统设计的那些底层软件开发中的重点解读
MOSFET 安全工作区对实现稳固热插拔应用的意义所在
蔚来计划通过AI和机器人降低30%的劳动力以提高效率
亚马逊训练AI重写查询以更好地理解口语
光耦继电器跟固态继电器有什么区别
傅里叶变换（对信号分析）（上）
通信行业深度分析报告

AI大模型引发算力变革，英特尔与百度联合发起飞桨+文心大模型硬件生态共创计划 ，加速大模型开发与落地

AI大模型引发算力变革，英特尔与百度联合发起飞桨+文心大模型硬件生态共创计划，加速大模型开发与落地