近日,在权威财经媒体36氪主办的“wise颠覆·aigc”主题产业峰会上,墨芯人工智能凭借业界领先的ai计算平台,获颁“下一个百亿规模aigc产品”称号,被推举为新一代人工智能领域最具生产力的代表产品。
该奖项由36氪综合行业分析师等专家团分析与调研数据,旨在评估agi时代现象级产品,评出站在热潮的巅峰定义和捕捉新机会的企业。
墨芯荣膺此奖,充分体现出在aigc时代技术优势和巨大潜力,也再度印证了稀疏计算作为趋势性技术的巨大价值获得了广泛关注。
稀疏计算
从根本上解决大模型发展与算力的矛盾
chatgpt等aigc应用的爆发,加速了新的变革机会的到来,带动大模型、芯片等相关的产业链各环节的跃迁。在aigc产业链中,算力作为基础设施,被公认为最具投资价值的赛道。
红杉资本《生成式ai:一个创造性的新世界》指出,生成式ai可能创造数万亿美元的经济价值。chatgpt走红以后,算力的供不应求已成为焦点,ai芯片头部企业创下史上最高单季销量纪录,远超过先前《华尔街日报》估计的销售额,算力市场的需求仍在持续攀升。
在算力提升的各种探索方向上,稀疏计算是业界公认最有前景的的技术:
稀疏模型将取代稠密模型成为主流——已成为业界权威认同的趋势,并得到google,微软,meta,英伟达等巨头的投入。
google的ai负责人jeff dean早已指出:稀疏化是ai模型的发展趋势,“今天的模型是稠密而低效的,pathways(google提出的统一架构)将使它们变得稀疏和高效。” google的moe(稀疏门控的专家混合层)及pathways架构等,都是稀疏计算理念的成果,并在实践中取得比稠密模型更高的效率。芯片巨头英伟达也在其安培架构中首度引入细粒度结构化稀疏,支持2倍稀疏化。
大模型如何实现广泛应用,答案也早由google research与openai的联合论文揭示:《sparse is enough in scaling transformers》。
论文地址:https://arxiv.org/pdf/2111.12763.pdf
稀疏计算被众多巨头看好的原因,正是由于它能从根本上解决大模型发展与算力的矛盾:稀疏计算让大模型既能在参数量上跃升若干个数量级的同时,又不因参数增长而产生过大的计算量,解决了大模型的高算力需求、高功耗、高费用等痛点,带来“多赢”的效果。
有了稀疏计算的加持,业界大模型的部署也能迎来更广阔的施展空间:更多企业、开发者能够基于“用得起”的算力服务,来进行aigc等应用的开发与大模型的行业落地。
墨芯
稀疏计算引领者
此次墨芯登上“下一个百亿规模aigc产品”榜单,正是基于墨芯长期在稀疏计算领域的深耕。aigc时代,墨芯率先以稀疏计算技术、产品与实践的强大实力,成为aigc算力层的中坚代表:
01
创新技术引领
当业界对神经网络高倍稀疏化算法尚停留在研究层面时,墨芯已率先将算法和硬件结合落地,基于软硬协同设计推出首颗稀疏芯片antoumⓡ,实现稀疏神经网络的高模型精度和高硬件利用效率,充分释放稀疏计算的潜力。
antoumⓡ打破业界纪录,成为首颗支持高稀疏倍率的ai芯片:支持高达32倍稀疏张量计算,此前业内主流芯片仅支持2倍稀疏化,antoumⓡ将这一纪录提升了16倍。
02
产品屡破性能纪录
在英伟达、英特尔等巨头云集的国际权威基准测评mlperf中,墨芯连续两届蝉联冠军,并在mlperf inference 3.0斩获双冠:
在开放分区resnet-50赛道中,墨芯s40计算卡以127,375 fps,斩获单卡算力全球第一;
墨芯s30计算卡以4卡383,520 fps算力,获整机4卡算力全球第一。
墨芯计算卡基于12nm的antoumⓡ芯片,性能已战胜4nm工艺产品,站在世界顶尖水平,足以证明稀疏计算的强大优势。
03
产业实践推动大模型应用
基于软硬协同的ai计算平台,墨芯为行业带来高算力、低延时、低功耗的算力解决方案,不仅满足大模型与aigc等应用的海量算力需求,同时破解延时难题,实现推理加速,为大模型在众多行业场景的落地提供算力基础设施。墨芯的ai计算卡产品已实现量产,并在多个领域获得客户认可。
ai 2.0时代已经来临,大模型即将与各行业深度融合,产生更丰富多样的aigc等应用。稀疏计算已站在这场变革之巅,引领算力的进化与发展;墨芯亦将以创新的稀疏计算方案,为大模型应用提供强大动力支撑,为aigc打开更广阔的发展空间,去赋能下一个aigc现象级产品。
怎样做好区块链的“应用题”
WCDMA网络规划及部署原则
换电将会是新能源出租车的解决方案吗
为加大电改力度打赢蓝天保卫战,国家电网组建26家省级综合能源服务公司
可编程USB转串口适配器开发板转UART I2C应用
“下一个百亿规模AIGC产品”揭晓,墨芯人工智能上榜
北斗的定位系统,相比以往的GPS会有哪些变化呢?
谷歌云目标2023年超越微软Azure和亚马逊AWS
FPC覆铜布线有哪些需要关注的点
粤芯半导体二期扩产项目成功签约 新增投资65亿元
华宇电子亮相2022世界集成电路大会
华为mate9和p9的区别,16nm工艺处理器给力升级但mate9曲屏版或跳票
C语言零基础项目:生命游戏!详细思路+源码分享
基于PLC的机器人伺服运动控制系统设计详解
用MDaemon搭建邮件服务器-设置篇
松下进一步增强加码动力电池业务的决心
谷歌发布第三季度财报,总营收461.73亿美元
华为 P20在上海发布 还有全球首款全面屏笔记本
怎么应对刘海屏机型的海报设计
相控阵雷达性能的基石:宽禁带半导体