影响人工智能未来的4个数据中心存储挑战
● 建设新数据中心的成本
● 建设新数据中心需要时间
● 现有数据中心空间不足
● 功率限制
训练人工智能模型会产生巨大的资源消耗,需要大量的资本、时间、空间和电力来部署。最终,人工智能的进步可能归结为解决数据中心短缺的问题。
为什么数据中心对人工智能很重要
数据中心在我们的日常生活中发挥着至关重要的作用,但它们常常被视为理所当然或完全被忽视。每当我们浏览社交媒体、发送消息、在淘宝上订购真空吸尘器或通过银行汇款时,都需要依靠数据中心来处理每一项数字操作。它们是我们it基础设施的基石。
但随着人工智能需求的爆炸式的激增,数据中心的容量正在减少,需求明显超过供应。虽然关于人工智能的讨论主要集中在芯片和chatgpt上,以及人工智能产品将如何增加数十亿美元的收入,但我们应该关注的是回答这样一个问题,当对人工智能的需求超过我们现有基础设施所能支持的水平时,会发生什么?
答案似乎很简单,通过建设更多能力来克服能力不足。然而,在实践中,这变得更加困难。
数据中心短缺的4大原因
随着人工智能的发展,对计算能力的需求呈爆炸式增长,这需要密集、复杂的计算能力来训练。
数据中心行业已经面临满足现有企业数字化转型和公共云使用需求的压力。由于部署新构建的成本和时间都很高,因此数据中心通常是根据预测的需求即时交付来构建的。除了供应已经紧张之外,人工智能的指数级采用还推动了前所未有的需求。
生成式人工智能需要的能力是传统工作负载的五倍。据说chatgpt-4的智力明显更好,需要更多的力量来训练。人工智能的发展竞赛归结为四个关键的供应限制:资金、时间、空间和权力。
1、资本
数据中心的建设成本高昂。一座25万平方英尺的中型数据中心建筑,要花费近5亿美元才能完全建成。
预计对人工智能的需求在数百兆瓦到千兆瓦之间,全部价格将达到数百亿美元。这是一大笔资金。当利率高企,资金难以筹集时,数据中心的价格就会上涨,这使得筹集必要的资金和满足需求变得更具挑战性。筹集所需资金也需要更长的时间,这延长了建设时间,进一步拖慢了一切。
最近,许多传统数据中心提供商因重组或破产而分心或陷入停滞,这进一步挑战了容量的及时交付。数据中心运营商仍然可以利用这些资金来为新容量提供资金,只是不会像零利率时代那么容易。赢家将是那些拥有有效部署资本和有效运营记录的人。
2.时间
建设一个数据中心需要24到36个月的时间。当然,提供商可以同时进行多个项目,但大多数项目仍需要数月至数年才能完成。在当前需求猛增之前,许多项目都是基于更为温和的需求预测而建造的。
最重要的是,该行业仍在努力应对供应链挑战,以提供为现代数据中心供电和冷却所需的机械、电气和冷却系统。这些时间表已从两年前的12至24周缩短至52至80周。
新容量上线需要时间,而且即使上线也可能不够。然而,拥有数据中心下方的房地产并追求多设施园区战略的运营商将最有能力通过控制土地使用和缩短上市时间来快速扩大规模。
3.空间
整个行业剩余的可用空间所剩无几,特别是在拥有任何额外产能的优先购买权(rofr)的客户看到需求增长快于供应的情况下,他们现在正在要求这些选择。
目前,gpu驱动的高性能计算(hpc)集群正在被许多企业采用,以训练人工智能应用,但它们并不是数据中心空间需求的唯一驱动因素。超大规模公共云和传统企业技术部署的自然增长也将继续强劲,这将在未来12到18个月内给供应带来更大的压力。如果我们继续沿着这条道路前进,没有任何出人意料的技术创新。
应对这一挑战的解决方案是数据中心提供商设计新设施,以适应从传统的高架地板、风冷企业应用到板式地板和水冷超大规模云或hpc工作负载的工作负载。这确保了无论上线的容量都可以快速适应市场最关键的瓶颈。
4.能源
一切都与电力有关。这些用于人工智能的高性能计算集群中使用的gpu使用的功率是传统工作负载的五倍。
电力已经供不应求,因为我们已经看到主要的数据中心市场宣布限制提供已经承诺的扩展电力。预计这一趋势将持续下去,需求的增加会给电网带来更大的压力,而向可再生能源的过渡需要时间的调整和完善,将产生更多的瓶颈。
智能数据中心提供商通过提高效率,将多设施园区选址在发电源附近,甚至部署自己的分站,走在了前面。
数据中心短缺持续存在会发生什么?
在研究了这四个领域之后,仍然存在一个问题:“如果我们无法克服这些限制,会发生什么?”其影响既深远又容易被忽视。
首先,它可能会阻碍人工智能应用开发人员部署gpu驱动的hpc集群的速度,这些集群需要训练底层大型语言模型(llm),和/或最终的推理阶段,在那里我们看到对基于这些llm构建应用的访问需求。
它还可能会抑制数据中心容量满足云提供商和正在增加现有工作负载企业的需求的能力。如今每个人都已经依赖这些来为saas应用、社交媒体、视频流、游戏、电子商务以及现代互联世界的便利提供动力,更不用说未来由人工智能驱动的应用了。
聚焦智能电网:变电站智能巡检机器人是什么?
ADO.NET和ASP.NET之间的关键区别在哪
三星S20依然强势,搭载首款骁龙865旗舰
电热丝为什么不会短路
长安福特产品竞争力严重下滑,销量跌去大半
数据中心短缺:人工智能未来的致命阻碍?
三星苹果王者之争,或将因为这个原因一边倒
罗姆汽车级超紧凑MOSFET,采用“可湿性面板成型技术”
估值近20亿美元!盛合晶微拟科创板IPO
如何确保云服务中的数据安全
公牛集团与华为签署战略合作协议,首款支持华为超级快充的公牛电源公布
蜂鸣器发声原理
疫情下的区块链会有怎样的未来
西门子STEP7解密全攻略之 MMC密码破解
美国企业外包策略:惹毛本土员工,乐了亚洲工程师
【虹科动态】虹科测试测量邀您一同回顾北京电子设计创新大会(EDICON China)
HDI盲孔的加工原理 盲孔凹陷度对焊接的影响
2012年中国手机用户将超10亿
在制造业价值链中RPA真的有机会吗?
洞察市场需求,美国高通携手中科创达研发最前沿的AI开发套件