本周海内外算力板块均出现较大波动,市场情绪普遍回落。我们认为,本次回落主要受全球宏观经济对高风险资产的冲击,叠加GPT4.5不及预期,多方面因素形成共振导致短期跌幅较大。但算力需求释放的逻辑仍未发生动摇,海外需要突破性创新撬动算力需求,国内AI产业起步较晚,基数较低,CQ9电子平台技术支持主要应关注算力产业链边际变化。
美国宏观数据及关税政策预示经济活动回落。根据世界大型企业研究会数据,美国2月消费者信心指数为98.3,显著低于1月的105.3,该数据已连续三个月走低;根据密歇根大学调查,消费者对未来5-10年的长期通胀率预期上修至3.5%,为1995年4月来的最高水平;标普全球的美国2月服务业PMI初值意外从52.9跌至49.7,创2023年1月份以来新低。同时美国关税政策使通胀问题复杂化,美联储利率面临居高不下风险。另外联邦政府降本裁员可能进一步削弱就业数据。多因素共振使得市场认为美国经济增长将发生转变,从而变得高度敏感,避险情绪上升。
英伟达财报超预期,市场产生分歧。周四英伟达发布FY25Q4财报,营收与净利润均超出市场预期,且B系列产能问题已得到解决,并成为公司历史上推广速度最快的产品。但其优异的业绩并未让市场满意,周四当日英伟达股价跌幅达8.5%。尽管相关数据超出市场预期,但超出预期幅度是自2023年2月以来的最小幅度,意味着英伟达的迅猛势头转弱。与此同时,英伟达的盈利上涨幅度也是2022年11月以来最小纪录,市场从坚定选择算力转变为产生分歧。
Deep Seek的出现推动推理端算力需求激增叠加美国进一步加强芯片封锁将加速国产算力加速崛起,市场核心关注各条产业链的边际变化,国产算力多条产业链有望深度受益。数据中心需求抬升将加速老旧数据中心去库存进程,加速机房改造并提高资源利用率;各大企业加速落地大模型并加强推理侧AI的开发,计算量激增导致芯片需求激增,算力租赁相关企业有望受益;IDC加速向AIDC转型,单位功率密度迅速抬升,相关配套如液冷、电源等设备升级将变成必选项,加速换代将产生大量需求,相关企业有望受益此需求。
我们认为,尽管以上多方面因素均使市场情绪低迷,但从根本上来讲,以上事件均并未使AI叙事逻辑发生改变。正如黄仁勋在法说会上表示,AI应用尚处于起步阶段,后续AI Agent、多模态AI的发展仍将保持算力的高需求。目前海内外云厂商均加码投资AI基础设施建设,创新性技术突破的出现将只是时间问题。短期来看,市场对于AI发展前景持摇摆态度也属正常,而长期视角下,只要AI发展的逻辑并未出现动摇、产业发展按照规律持续进行,算力产业链的景气度终将回归。而海外需要突破性创新带动算力需求,国内AI产业起步较晚,基数较低,主要应关注算力产业链边际变化。
周末我们亦反思年后的市场表现,在坚定看好算力板块的同时会更加强调边际定价,重视新兴的成长方向与个股,如威腾电气、美格智能、腾景科技、德科立。同时建议关注相关产业链如数据中心方向润泽科技、万国数据、数据港、光环新网、奥飞数据等,CDN方向网宿科技等。
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。铜链接:沃尔核材、精达股份。算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪、海光信息。液冷:英维克、申菱环境、高澜股份。边缘算力承载平台:美格智能、广和通、移远通信。卫星通信:中国卫通、中国卫星、震有科技、海格通信。IDC:润泽科技、光环新网、奥飞数据、科华数据、润建股份。
运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。
算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。
本周海内外算力板块均出现较大波动,市场情绪普遍回落。周四英伟达发布FY25Q4财报,营收与净利润均超出市场预期,且B系列产能问题已得到解决,并成为公司历史上推广速度最快的产品。但其优异的业绩并未让市场满意,尽管相关数据超出市场预期,但超出预期幅度是自2023年2月以来的最小幅度,意味着英伟达的迅猛势头转弱,周四当日英伟达股价跌幅达8.5%。其他英伟达产业链企业也出现下跌,美光、台积电、AMD、博通分别下跌约6.0%、7.0%、5.0%、7.1%。
我们在坚定看好算力板块的同时会更加强调边际定价,重视新兴的成长方向与个股,如威腾电气、美格智能、腾景科技、德科立。同时建议关注相关产业链如数据中心方向润泽科技、万国数据、数据港、光环新网、奥飞数据等,CQ9电子平台技术支持CDN方向网宿科技等。
本周(2025年2月24日-2025年2月28日)上证综指收于3320.90点。各行情指标从好到坏依次为:上证综指沪深300 万得全A 万得全A(除金融,石油石化) 中小板综创业板综。通信板块下跌,表现劣于上证综指。
从细分行业指数看;卫星通信导航、云计算、物联网、通信设备、运营商、区块链分别下跌3.4%、5.45%、5.53%、6.1%、6.9%、7.0%,表现优于通信行业平均水平;移动互联、量子通信、光通信分别下跌8.13%、8.68%、14.2%,表现劣于通信行业平均水平。
本周,受益于数据中心+算力+完成重整,大位科技上涨55.672%,领涨版块。受益于交换机产品技术优势,共进股份上涨27.945%;受益于固态电源技术突破,南都电源上涨11.882%;天利科技上涨11.682%;大富科技上涨10.084%。
本周海内外算力板块均出现较大波动,市场情绪普遍回落。我们认为,本次回落主要受全球宏观经济对高风险资产的冲击,叠加GPT4.5不及预期,多方面因素形成共振导致短期跌幅较大。但算力需求释放的逻辑仍未发生动摇,海外需要突破性创新撬动算力需求,国内AI产业起步较晚,基数较低,主要应关注算力产业链边际变化。
美国宏观数据及关税政策预示经济活动回落。根据世界大型企业研究会数据,美国2月消费者信心指数为98.3,显著低于1月的105.3,该数据已连续三个月走低;根据密歇根大学调查,消费者对未来5-10年的长期通胀率预期上修至3.5%,为1995年4月来的最高水平;标普全球的美国2月服务业PMI初值意外从52.9跌至49.7,创2023年1月份以来新低。同时美国关税政策使通胀问题复杂化,美联储利率面临居高不下风险。另外联邦政府降本裁员可能进一步削弱就业数据。多因素共振使得市场认为美国经济增长将发生转变,从而变得高度敏感,避险情绪上升。
英伟达财报超预期,市场产生分歧。周四英伟达发布FY25Q4财报,营收与净利润均超出市场预期,且B系列产能问题已得到解决,并成为公司历史上推广速度最快的产品。但其优异的业绩并未让市场满意,周四当日英伟达股价跌幅达8.5%。尽管相关数据超出市场预期,但超出预期幅度是自2023年2月以来的最小幅度,意味着英伟达的迅猛势头转弱。与此同时,英伟达的盈利上涨幅度也是2022年11月以来最小纪录,市场从坚定选择算力转变为产生分歧。
Deep Seek的出现推动推理端算力需求激增叠加美国进一步加强芯片封锁将加速国产算力加速崛起,市场核心关注各条产业链的边际变化,国产算力多条产业链有望深度受益。数据中心需求抬升将加速老旧数据中心去库存进程,加速机房改造并提高资源利用率;各大企业加速落地大模型并加强推理侧AI的开发,计算量激增导致芯片需求激增,算力租赁相关企业有望受益;IDC加速向AIDC转型,单位功率密度迅速抬升,相关配套如液冷、电源等设备升级将变成必选项,加速换代将产生大量需求,相关企业有望受益此需求。
我们认为,尽管以上多方面因素均使市场情绪低迷,但从根本上来讲,以上事件均并未使AI叙事逻辑发生改变。正如黄仁勋在法说会上表示,AI应用尚处于起步阶段,后续AI Agent、多模态AI的发展仍将保持算力的高需求。目前海内外云厂商均加码投资AI基础设施建设,创新性技术突破的出现将只是时间问题。短期来看,市场对于AI发展前景持摇摆态度也属正常,而长期视角下,只要AI发展的逻辑并未出现动摇、产业发展按照规律持续进行,算力产业链的景气度终将回归。而海外需要突破性创新带动算力需求,国内AI产业起步较晚,基数较低,主要应关注算力产业链边际变化。
周末我们亦反思年后的市场表现,在坚定看好算力板块的同时会更加强调边际定价,重视新兴的成长方向与个股,如威腾电气、美格智能、腾景科技、德科立。同时建议关注相关产业链如数据中心方向润泽科技、万国数据、数据港、光环新网、奥飞数据等,CDN方向网宿科技等。
据C114报道,苹果公司2月24日宣布了其有史以来最大规模的投资计划,计划未来四年内,在美国市场投资超5000亿美元,并将为美国带来2万个新的就业岗位。这一新承诺延续了苹果长期投资美国创新与高技能先进制造的传统。
此次投资计划涵盖多个关键领域,包括人工智能(AI)、芯片工程及全美学生与劳动者技能发展等多项计划。
其中,最引人注目的是苹果将与合作伙伴在休斯敦共同建立一座25万平方英尺的先进制造工厂,专注于生产支持 Apple Intelligence 的服务器,这无疑将为苹果在人工智能领域的布局提供强大的硬件支撑。该设施预计2026年投产,可创造数千个就业岗位,此前,相关服务器在美国境外制造。
苹果还将把其美国先进制造基金规模翻倍、在密歇根州开设一所学院以培养下一代美国制造商,并增加在美国的研发投资,支持芯片工程等前沿领域。
这 5000 亿美元的承诺涵盖了苹果与全美 50 个州的数千家供应商的合作、直接就业、Apple Intelligence(苹果智能)基础设施和数据中心、公司设施,以及在 20 个州进行的 Apple TV + 制作。苹果一直是美国最大的纳税企业之一,在过去五年已缴纳超过 750 亿美元的税款,仅 2024 年就缴纳了 190 亿美元。
如今,苹果通过直接雇佣、与美国本土供应商和制造商合作,以及在蓬勃发展的 iOS 应用经济中创造开发者岗位,在全美支持着超过 290 万个工作岗位。
据C114报道,市场调查机构 Canalys 2月25日发布博文,报告称 2024 年第4季度全球AI PC出货量强劲,达到1540万台,占PC总出货量的23%。
苹果公司在 AI 电脑市场占据主导地位,市场份额高达 54%;Windows 10停止支持以及 AI 功能的普及将持续推动市场增长,但美国贸易政策变化带来的不确定性也可能影响市场发展。
细分到品牌方面,苹果在 AI 电脑市场占据领先地位,市场份额高达 54%;联想和惠普紧随其后,各占 12% 的市场份额。苹果 Mac 产品线的旧款机型降价也促进了其在商业领域的市场份额,尤其是在新兴市场。
英特尔、AMD 和高通等芯片厂商都在积极布局 AI 电脑市场,推出不同价位段的产品。戴尔对其产品线进行了品牌重塑,以简化产品命名并突出用户体验。各大 PC 厂商也更加注重 AI 驱动软件的开发和集成。
6.微软开源多模态AI Agent“Magma”:购物时可自动下单,还能推测视频人物行为
据C114报道,微软在官网开源了多模态 AI Agent 基础模型 ——Magma。与传统 Agent 相比,Magma 具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,此外,Magma 还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。
用户可以用 Magma 来自动下电商订单、查询天气;也可以自动操作实体机器人,或者在下真实象棋时获得帮助。
根据官方介绍,Magma 能够帮助 AI 驱动的助手或机器人理解周围环境并采取相应行动。例如,它可以帮助家用机器人学习如何整理以前从未见过的物品,或帮助虚拟助手为不熟悉的任务生成逐步的用户界面导航说明。
Magma 是能够适应数字和物理环境中新任务的 VLA(视觉语言动作)基础模型之一,能够有效地从海量的公开视觉和语言数据中学习知识,从而融合语言、空间和时间智能,应对数字和物理世界中的复杂任务和环境。
7. Akamai被全球最大科技公司之一选为战略云计算提供商,并达成多年期合作,云基础架构服务投入超 1 亿美元
据C114报道,负责支持和保护网络生活的云服务提供商阿卡迈技术公司(Akamai Technologies, Inc.,以下简称:Akamai)(NASDAQ:AKAM)于今日宣布与全球最大的技术公司之一达成了一项多年期战略使用协议。根据交易条款,Akamai 的全栈云计算能力将耗资 1 亿多美元。
客户将能够灵活利用 Akamai 的全部产品组合来管理、分发和保护数据,以增强和改善自身的基础架构服务。
Akamai 首席运营官兼云技术组总经理 Adam Karon 表示:“业务覆盖全球的技术平台需要先进且可靠的云服务。Akamai 提供了客户所需的规模和超低延迟性能,能够确保每一位用户无论身处世界何处,都能获得出色体验。”
Akamai 将在安全的虚拟私有云 (VPC) 环境中部署托管的 Kubernetes 集群,平衡用户流量负载,并在 Akamai 云端应用集成的应用程序和网络安全,从而以更具吸引力的云经济效益实现出色性能。这些功能将有助于确保为用户提供卓越的体验,同时让客户能够在本地管理流量和数据。
据C114报道根据市场研究公司DellOro Group的最新报告,光传输设备市场在2024年第四季度以约45%的环比增长强势收官。然而,由于客户消化过剩库存及宏观经济环境整体低迷,2024年全年市场规模同比下滑13%。
“行业曙光已现。”DellOro Group副总裁Jimmy Yu表示,“光传输设备市场自2023年底进入下行周期,预计将于2025年初走出低谷。2024年第四季度的强劲增长充分表明,光传输设备的供需关系已接近平衡,库存过剩问题基本化解。”
2024年第四季度环比增幅创历史同期新高。除季节性增长显著的中国市场外,几乎所有区域均实现增长,其中北美市场连续三个季度增长,中国以外地区整体环比增长35%。
2023年第四季度开始,客户库存修正已完成。设备供应商反馈显示订单量持续回升,此前库存积压最严重的北美地区光传输业务明显改善。
据C114报道,英伟达2月27日公布了该公司的2025财年第四财季及全年财报。
财报显示,第四财季营收达到393.31亿美元,同比增长78%,环比增长12%;净利润为220.91亿美元,同比大幅增长80%。这一强劲增长主要得益于市场对Blackwell芯片的强劲需求以及AI技术的快速发展。
英伟达CEO黄仁勋在财报中强调,Blackwell芯片的需求远超预期,这得益于推理AI的快速发展。他指出,AI训练能力的提升使模型更加智能,而长时间思考所需的额外算力则进一步优化了AI的决策能力。英伟达已成功大规模推进Blackwell AI超级计算机的生产,并在首个季度实现了数十亿美元的销售额。黄仁勋表示,AI技术正以“光速”发展,代理AI和物理AI的兴起将为下一波AI浪潮铺平道路,并有望彻底改变多个大型行业。
英伟达首席财务官克莱特·克雷斯透露,第四财季公司交付了价值110亿美元的Blackwell芯片,创下了英伟达历史上最快的新产品营收增长纪录。
Blackwell芯片的主要客户为大型云服务提供商,这些客户贡献了数据中心业务约50%的收入。这一数据进一步凸显了英伟达在AI芯片市场的领先地位及其在数据中心领域的强劲竞争力。
DeepSeek-V3/R1推理系统的优化目标是:更大的吞吐,更低的延迟。为了实现这两个目标,Deep Seek使用的方案是使用大规模跨节点专家并行(ExpertParallelism/EP)。首先EP使得batch size大大增加,从而提高GPU矩阵乘法的效率,提高吞吐。其次EP使得专家分散在不同的GPU上,每个GPU只需要计算很少的专家(因此更少的访存需求),从而降低延迟。
但EP同时也增加了系统的复杂性。复杂性主要体现在两个方面:1、EP引入跨节点的传输。为了优化吞吐,需要设计合适的计算流程使得传输和计算可以同步进行。2、EP涉及多个节点,因此天然需要Data Parallelism(DP),不同的DP之间需要进行负载均衡。
由于DeepSeek-V3/R1的专家数量众多,并且每层256个专家中仅激活其中8个。模型的高度稀疏性决定了q其必须采用很大的overall batch size,才能给每个专家提供足够的expert batch size,从而实现更大的吞吐、更低的延时。需要大规模跨节点专家并行(Expert Parallelism/EP)。
Deep Seek采用多机多卡间的专家并行策略来达到以下目的:1、Prefill:路由专家EP32、MLA和共享专家DP32,一个部署单元是4节点,32个冗余路由专家,每张卡9个路由专家和1个共享专家。2、Decode:路由专家EP144、MLA和共享专家DP144,一个部署单元是18节点,32个冗余路由专家,每张卡2个路由专家和1个共享专家。
由于采用了很大规模的并行(包括数据并行和专家并行),如果某个GPU的计算或通信负载过重,将成为性能瓶颈,拖慢整个系统;同时其他GPU因为等待而空转,造成整体利用率下降。因此我们需要尽可能地为每个GPU分配均衡的计算负载、通信负载。
核心问题:不同数据并行(DP)实例上的请求个数、长度不同,导致core-attention计算量、dispatch发送量也不同。
优化目标:各GPU的计算量尽量相同(core-attention计算负载均衡)、输入的token数量也尽量相同(dispatch发送量负载均衡),避免部分GPU处理时间过长。
核心问题:不同数据并行(DP)实例上的请求数量、长度不同,导致core-attention计算量(与KVCache占用量相关)、dispatch发送量不同。
优化目标:各GPU的KVCache占用量尽量相同(core-attention计算负载均衡)、请求数量尽量相同(dispatch发送量负载均衡)。
核心问题:对于给定MoE模型,存在一些天然的高负载专家(expert),导致不同GPU的专家计算负载不均衡。
优化目标:每个GPU上的专家计算量均衡(即最小化所有GPU的dispatch接收量的最大值)。
DeepSeekV3和R1的所有服务均使用H800 GPU,使用和训练一致的精度,即矩阵计算和dispatch传输采用和训练一致的FP8格式,core-attention计算和combine传输采用和训练一致的BF16,最大程度保证了服务效果。
另外,由于白天的服务负荷高,晚上的服务负荷低,因此我们实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。在最近的24小时里(北京时间2025/02/27 12:00至2025/02/28 12:00),DeepSeekV3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美金/小时,总成本为$87,072/天。
以上统计包括了网页、APP和API的所有负载。如果所有tokens全部按照DeepSeek R1的定价*计算,理论上一天的总收入为$562,027,成本利润率545%。
本文节选自国盛证券研究所已于2025年3月1日发布的报告《国盛通信丨算力恐慌下跌后的思考》,具体内容请详见相关报告。