更新时间:2026-01-18 19:45 来源:牛马见闻
Jay 发自 凹非寺量子位 | 公5GW代超算集群Colossus 1从无到有仅用了122天
<p></p> <blockquote id="48HLGH1L">Jay 发]自 凹非寺量子位 | 公众号 QbitAI<br> </blockquote> <p id="48HLGH06">刚刚,[全球首个GW级超算集群<strong>Colossus 2,正式投入运行</strong></p> <p id="48HLGH07">马斯克兴奋喊话:</p> <p></p> <blockquote id="48HLGH1M"><ul>这是全球首个达到1GW的超算集群,4月还将进一步升级至1.5GW。</ul></blockquote> <p class="f_center"><br><br></p> <p id="48HLGH09">网友直呼疯狂:「1.5GW,光是插座估计都得给墙壁装满了。」</p> <p class="f_center"><br><br></p> <p id="48HLGH0B">有了这剂算力强心针,Grok的忠实拥趸已经提前开香槟,开始畅想Grok5的统治时代。</p> <p class="f_center"><br><br></p> <p id="48HLGH0D">但在全网狂欢的背后,更多的人是苦不堪言——</p> <p id="48HLGH0E">2026年夏天,<strong>美国13个州的6700万居民,可能要因数据中心的存在被停电</strong>,没空调吹了。</p> <p></p> <h5>全球首个GW级训练集群</h5> <p id="48HLGH0F">老马的执行力太恐怖了。</p> <p id="48HLGH0G">不靠亚马逊,不靠微软,也没有「星际之门」计划,一己之力于孟菲斯平地建起一座1GW的超级超算集群。</p> <p id="48HLGH0H">前一代超算集群Colossus 1从无到有仅用了122天。</p> <p id="48HLGH0I">它配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。</p> <p id="48HLGH0J">而在此基础上翻了好几倍,功率达到1GW的Colossus 2,只花了仅仅不到一年。</p> <p id="48HLGH0K"><strong>1GW是什么概念?</strong></p> <p id="48HLGH0L">一般来说,1GW可以为75万户家庭供电,轻松供电一整个旧金山。</p> <p id="48HLGH0M">一座核电站的功率差不多也就是1GW。</p> <p id="48HLGH0N">如果按马斯克所说,今年4月份,Colossus 2将升级至1.5GW,最终总装机容量达到2GW,这个数字将与美国大多数主要城市的用电量相当。</p> <p id="48HLGH0O">按照规划,彻底完工后的Colossus 2将内置55张GPU,远超Meta的15万、微软10万,以及谷歌的分布式基础设施。</p> <p id="48HLGH0P"><strong>这庞大的资源,全部为Grok独自享用。</strong></p> <p id="48HLGH0Q">此前,曾有爆料称Grok 5的参数将达到惊人的6万亿左右,是Grok 4的两倍以上。</p> <p id="48HLGH0R">原因便是基于Colossus 2:</p> <p id="48HLGH0S">当时有观点认为Grok 5将在拥有数十万张英伟达GPU的Colossus 2上训练,耗电量约为1GW。</p> <p class="f_center"><br><br></p> <p id="48HLGH0U">如今,<strong>Colossus 2已正式上线,1GW的条件也正正好好满足</strong></p> <p id="48HLGH0V">而随着前段时间xAI E轮融资200亿美元的进账,Grok 5的Scaling筹码还在进一步增加。这意味着更大的模型参数,更快的训练速度、迭代速度,部署速度。</p> <p id="48HLGH10">当OpenAI还在为2027年的算力基础设施发愁时,xAI已经把一座「城市级」AI 工厂开机运行,将Grok 5提前扶上了市场心目中的下一个SOTA。</p> <p id="48HLGH11"><strong>正如网友所说,AI时代,速度就是最强的护城河。</strong></p> <p class="f_center"><br><br></p> <p></p> <h5>居民受不了啦!</h5> <p id="48HLGH13">不过,并非所有人都因这种「速度」受益。</p> <p id="48HLGH14">据《华尔街日报》消息,美国非营利电网运营商PJM,未来可能在极端高温或严寒天气期间,轮流对区域内的居民断电。</p> <p id="48HLGH15">这意味着,美国13个州的6700万人,在今年不得不迎来一个相当难熬的夏天。</p> <p id="48HLGH16">要说清楚这个问题,得先明白PJM是干嘛的。</p> <p id="48HLGH17">PJM,简单来说就是<strong>美国能源系统的交通指挥中心</strong>,它根据实时用电需求,协调发电厂何时增发、何时降载,以维持供需平衡。</p> <p id="48HLGH18">然而,大模型大力出奇迹的竞赛正在破坏这种平衡。</p> <p id="48HLGH19">在数据中心建设热潮推动下,PJM预计未来10年电力需求将以<strong>年均4.8%</strong>的速度增长。</p> <p id="48HLGH1A">对一个多年需求变化不大的系统来说,这样的增速相当罕见。</p> <p id="48HLGH1B">一边需求激增,另一边,供给的增速却相当缓慢。<strong>新建电厂的速度甚至都跟不上老电厂的退役速度</strong>,电网容量面临饱和。</p> <p id="48HLGH1C">供需一旦出现偏差,电网频率就会波动,进而可能损坏发电厂等关键基础设施。</p> <p id="48HLGH1D">为避免这些风险,PJM只能<strong>两害相权取其轻</strong>,通过在用电高峰期轮流停电来卸压。</p> <p id="48HLGH1E">PJM也不是没想过其他办法。</p> <p id="48HLGH1F">去年9月,PJM发布了一系列提议,希望数据中心在高峰时段主动降低用电量,或改从其他渠道获取电力支持。</p> <p id="48HLGH1G">然而,亚马逊、谷歌、微软等几乎都表示了反对,<strong>认为这是对数据中心的歧视</strong></p> <p id="48HLGH1H">值得一提的是,PJM主要负责美国东海岸地区,而xAI的Colossus位于中南部,并不在PJM电网覆盖范围内。</p> <p id="48HLGH1I">同时,为减少对当地电网的冲击,xAI还部署了<strong>168个特斯拉Megapack电池储能系统</strong>,在用电高峰期提供电力缓冲,尽量避免周边居民遭遇停电。</p> <p id="48HLGH1J"><br>[1]https://x.com/MilkRoadAI/status/2012558197240815665<br>[2]https://www.wsj.com/business/energy-oil/power-grid-ai-data-centers-1235f296</p>
Copyright ® 版权 所有:吉林日报
违法和不良信息举报邮箱:dajilinwang@163.com 违法和不良信息举报: 0431-88600010
ICP备案号:吉ICP备18006035号 网络经营许可证号:吉B-2-4-20100020
地址:长春市高新技术产业开发区火炬路1518号 爆料电话:0431-88601901