【招银研究

发布时间:2025-02-19 07:54

黄金白银投资需要持续学习和研究 #生活技巧# #理财技巧# #黄金白银#

近期,DeepSeek在2025年科技浪潮中崭露头角,迅速在全球范围内引起了广泛关注。从最初的初步展示,到在多个领域展现出巨大的应用潜力,DeepSeek凭借在生成式人工智能(AIGC)领域的卓越表现,已经成为推动各行业变革的重要力量。

DeepSeek之所以能够引发全球关注,主要有两个原因。首先,它首次使中国在人工智能技术发展趋势中占据了领先地位;其次,它采用开源模式,显著加速了全球大语言模型的升级与迭代,推动了全球人工智能技术的快速进步。

深入探讨DeepSeek对经济的影响变得尤为重要。为此,我们从以下三个方面来分析DeepSeek的效应与未来发展机遇:DeepSeek的发展历程,对科技行业的影响,以及对经济增长的推动作用。

一、DeepSeek的发展历程

DeepSeek由量化投资公司幻方量化的联合创始人梁文峰于2023年7月创立,专注于大语言模型及相关技术的研发。2023年11月,DeepSeek发布了DeepSeek Coder模型,标志着公司在人工智能领域的初步探索。2024年5月,DeepSeek推出了DeepSeek-V2模型,该模型采用MoE架构,显著降低了模型推理成本,引发了业内广泛关注。2024年12月,DeepSeek发布了DeepSeek-V3模型,其性能已接近顶级闭源模型,且模型训练成本创下新低。

2025年1月20日,DeepSeek迎来了发展历程中的重要里程碑,公司正式发布了DeepSeek-R1模型,引发了全球AI领域的强烈反响。该模型在数学、代码以及复杂逻辑推理任务中表现出色,推理过程涵盖了大量的反思与验证,思维链长度可达数万字。

DeepSeek的全球影响力迅速扩展。DeepSeek-R1模型与 OpenAI o1模型在AIME 2024(美国数学竞赛2024)、Codeforce(编程竞赛平台)、GPQA Diamond(高难度通用知识问答)、MATH-500(数学评估)、MMLU(规模多任务语言理解)、SWE-bench Verified(软件基准测试)等测试中不相上下,个别测试能力稍胜一筹。从斯坦福大学到麻省理工学院,DeepSeek-R1迅速成为美国顶尖学者的首选模型。2025年1月31日,英伟达、亚马逊和微软三大科技巨头宣布接入DeepSeek-R1模型。2025年2月,中国的云服务商、手机厂商和应用厂商也纷纷宣布接入DeepSeek-R1模型,向社会提供开放服务。

图1:DeepSeek-R1与OpenAI o1的比较

资料来源:AIPaperAcademy、招商银行研究院

DeepSeek引领了训练模式的创新,改变了传统模型训练过度依赖算力的观念。传统的模型性能提升方法主要通过增加模型参数、扩充训练数据量以及提高计算资源的使用来实现。大规模模型的训练通常包括预训练、监督微调和强化学习三个关键阶段。然而,强化学习流程尚未完全标准化,仍处于初期阶段,具有巨大的技术创新潜力。OpenAI作为行业领先者,虽然掌握了强化学习的创新算法,但其技术细节一直处于保密状态。DeepSeek推动了强化学习的创新变革,在模型训练过程中,省略了传统的监督微调阶段,采用了组相对策略优化(GRPO)强化学习方法,替代了人类反馈强化学习(RLHF)和AI反馈强化学习(RLAIF)等常见的强化学习方法。通过这种基于规则的强化学习训练,DeepSeek-R1的性能达到了与OpenAI的O1模型相当的水平。

图2:DeepSeek采用基于规则的强化学习策略

资料来源:AIPaperAcademy、招商银行研究院

DeepSeek-R1模型在训练和推理成本方面展现出显著优势。根据DeepSeek官方技术报告,DeepSeek-V3模型的训练成本约为550万美元。相比之下,DeepSeek-R1模型在此基础上进行了优化,业界预计其训练成本约为2000万美元。与此相比,OpenAI的o1模型的训练成本尚未公开,但有报道称其训练成本可能达到1亿美元。在推理方面,DeepSeek-R1模型的成本更具优势。DeepSeek-R1每百万输入tokens的成本约为0.55美元,每百万输出tokens的成本约为2.19美元。而OpenAI o1模型的每百万输入tokens的成本约为15美元,每百万输出tokens的成本约为60美元。

图3:模型技术提升带动推理成本持续下降(每百万个tokens)

资料来源:a16z、招商银行研究院

此外,DeepSeek还采用了混合专家模型(MoE)、多头潜在注意力(MLA)、多令牌预测(MTP)和蒸馏(Distillation)等方法,显著提升了模型训练效率,并减少了对计算资源的需求。如果DeepSeek的创新能够有效降低对硬件算力的依赖,那么专注于高效能硬件芯片(如AI ASIC)的厂商可能会逐步成为AI硬件领域的新竞争者,从而挑战英伟达的市场主导地位。据报道,当前已有超15 家的国内芯片厂商支持DeepSeek推理应用,包括华为昇腾、龙芯中科、壁仞科技、海光信息、摩尔线程等公司。

PTX(Parallel Thread Execution)是英伟达GPU编程模型的一部分,DeepSeek将其作为创新工具,优化了模型的训练和推理效率。通过使用PTX,DeepSeek能够提升算法执行性能,并减少对CUDA环境的依赖,这有可能削弱英伟达在GPU计算领域的封闭性生态系统,推动更开放的计算平台竞争。

二、DeepSeek有望推动科技行业的重大变革

回顾科技行业的历史,单位成本的下降通常会促进产品或服务的广泛采用,从而导致总需求的显著增长。例如,“杰文斯悖论”提出,当蒸汽机效率提升时,煤炭的消耗量并未减少,反而大幅增加。另外,半导体行业的摩尔定律见证了电子产品的全球普及。

21世纪初,VMware等公司推出虚拟化软件,预计可以将服务器CPU的利用率从5%提升至80%以上。当时,许多投资者认为服务器CPU市场将停滞不前。然而,服务器的工作负载虚拟化率从2005年的20%增加至2017年的75%,服务器CPU的单位销售额仍继续以每年6%-7%的速度增长。自2016年以来,云计算的爆发使得服务器CPU的增长速度进一步加快。

图4:服务器虚拟化技术带来成本下降和云计算产业爆发

资料来源:Evercore ISI Research、招商银行研究院

DeepSeek的技术进步推动了模型技术的发展,促使科技巨头加速AI领域的竞争。尽管DeepSeek已取得显著突破,但其仍处于大语言模型发展的技术版本阶段。大语言模型领域仍在快速发展和变革,竞争日益激烈,技术不断推陈出新,因此需要持续的研发投入,才能在全球AI竞争中保持领先地位。

DeepSeek-R1模型发布后,亚马逊、微软、谷歌和Meta等科技巨头表示将在2025年继续加大资本支出,投入更多资源于AI基础设施建设。具体而言,亚马逊计划将2025年的资本支出从去年的约830亿美元提高到1000亿美元(同比增长34%),主要用于支持人工智能服务的需求,以及北美和国际部门的技术基础设施建设。微软预计2025年投入800亿美元(同比增长44%),用于AI基础设施,以扩大其全球高性能数据中心网络,满足训练和运行AI模型所需的专用芯片需求。谷歌预计2025年将在资本支出方面投入750亿美元(同比增长43%)。Meta计划2025年资本投入600-650亿美元(同比增长59%),用于推动人工智能战略。

从这些科技巨头管理层的表态来看,高强度的AI资本开支将持续较长时间。Meta的CEO马克·扎克伯格强调,保持在AI领域的领先地位至关重要,并认为如果未来10到15年内投资不足,Meta将面临不利局面。谷歌的CEO桑达尔·皮查伊也表示,谷歌倾向于进行过度投资,以避免错失AI带来的收入机会,即使这存在过度投资的风险。

图5:海外科技巨头资本支出情况

资料来源:高盛、招商银行研究院

中国企业在AIGC领域的投资也呈现出快速增长的趋势。预计中国的AI资本支出将从2022年的128亿美元增加到2027年的400亿美元,年复合增长率为25.6%。以云服务商为例,字节跳动的资本开支预算预计从2024年的800亿元大幅增长至2025年的1500亿元以上,主要用于AI算力采购和IDC基础设施建设。在电信运营商方面,中国移动预计2024年的资本开支将达到1730亿元,其中在算力领域的投入预计为475亿元,同比增长21.5%,占总资本开支的比重提升至27.5%。

图6:中国AIGC市场资本支出预测

资料来源:IDC、招商银行研究院

三、DeepSeek对经济产生深远的影响

作为人工智能领域的重要技术成果,DeepSeek有望对经济产生深远的影响。它有望促进经济整体增长,推动产业结构的优化升级,助力企业提升经营效益,创造新的就业机会。

1、对宏观经济的推动作用

DeepSeek的创新有望推动长期增长。DeepSeek突破了传统产业的边界,促进了资源的优化配置,为经济增长开辟了新的路径。根据IDC的研究,到2030年,与商业相关的AI解决方案每投入1美元,预计将为全球经济带来4.60美元的直接和间接经济效益。预计到2030年,企业在采用AI、将其融入现有业务运营,以及向企业和消费者提供AI产品和服务的支出,将推动全球经济增长4.9万亿美元,累计产生的经济效应将达到19.9万亿美元,占全球GDP的3.5%。

根据彭博情报的预测,AIGC应用市场的规模预计将从2022年的18.6亿美元增长到2032年的6618.14亿美元,年均复合增长率高达80%。在这一市场中,AI广告预计将占据最大份额,而药物研发、网络安全和IT服务市场的增速最快。同时,AIGC在科技领域的投入也将显著增加。信息技术硬件、软件、服务和广告等领域的AIGC支出预计将从2022年的1%增长到2032年的12%。这一增长反映了AIGC在各个行业中的广泛潜力,特别是在加速产品开发、自动化流程和增强决策支持方面的应用。

图7:2022-2032年AIGC应用市场规模

资料来源:Bloomberg Intelligence、招商银行研究院

2、传统产业面临变革

传统科技行业和制造业正迎来全面革新。借助模型压缩技术,汽车、手机、物联网等领域的传统硬件设备将迎来与大模型深度融合的契机。在汽车行业,自动驾驶与路线规划逐渐实现,智能座舱系统通过大模型提供更加人性化的交互体验,从语音控制到智能导航,都能够精准洞察用户需求。在手机行业,智能手机通过接入大模型实现轻量级推理服务,带来更个性化的交互、更智能的任务管理以及实时生成的个性化内容。在物联网领域,智能家居设备能够通过大模型分析用户的生活习惯,实现更精准的场景联动。这种融合将促使传统硬件设备进行全面升级,推动科技制造业向智能化、高端化迈进,成为产业结构调整与升级的关键力量,推动上下游产业链协同发展,创造出更多新的经济增长点。

图8:传统科技行业和制造业引入大模型智能化升级

资料来源:Yole、招商银行研究院

3、新兴产业带来发展机遇

人形机器人和AI Agent等新兴产业正为经济带来前所未有的发展机遇。根据Evercore ISI的分析,过去60年,每隔15至20年,创新积累便会推动科技行业发生重大变革,带来新型硬件的大规模普及。每轮创新带来的新兴硬件数量规模将是上一轮硬件数量规模的10倍,大型计算机每年出货数十万台,小型计算机每年出货数百万台,个人电脑每年出货数亿台,而智能手机的出货量则达到了每年十亿台。

人形机器人正凭借其独特优势,成为潜力巨大的新型硬件。由于外形与肢体结构类似人类,人形机器人能够更自然地融入日常生活场景,完成复杂的互动任务。在功能拓展方面,借助AIGC技术强大的学习和决策能力,人形机器人能够不断优化自身功能,在工业和服务行业中胜任各种需求和个性化服务。从产业带动角度看,人形机器人将催生出庞大的产业链,包括上游的芯片研发、传感器制造,中游的机器人本体制造,以及下游的应用场景开发和运维服务。这些领域将迎来新的发展机遇,推动产业结构优化升级,成为AIGC时代经济增长的新引擎。

AI Agent也有望对传统软件和互联网经济发起颠覆性冲击。2024年,抖音电商的商品交易总额达到3.5万亿元,同比增长了30%。抖音通过短视频平台迅速切入电商市场的成功案例,给我们带来了深刻的震撼。而AI Agent具备强大的自主学习和决策能力,能够根据用户需求自动执行一系列复杂任务,完成从被动执行到主动服务的转变。无论是作为个人生活助理,还是企业日常工作中的支持工具,AI Agent都能够实时分析用户的工作习惯和需求,并定制个性化的生活和商业活动。这一技术的出现可能会颠覆现有商业生态,加速商业市场的洗牌和变革,成为未来软件及互联网经济的重要布局方向。

4、企业经营层面的影响

在企业经营方面,DeepSeek为决策提供了有力支持。企业可以利用DeepSeek对市场数据、消费者行为数据等进行深入分析,掌握市场趋势和消费者需求变化,从而制定更精准的市场策略。在产品研发过程中,DeepSeek可以帮助企业进行市场调研和竞品分析,了解消费者对产品功能和特性的偏好,优化产品设计,提高市场竞争力。在生产环节,DeepSeek的智能化技术可以帮助企业实现生产过程的自动化和智能化控制。通过对企业内部数据的分析,DeepSeek还能够优化管理流程,提升管理效率。

5、就业市场的影响

DeepSeek效应将在就业市场产生深远影响。一方面,重复性和规律性强的岗位面临替代风险,如数据维护、基础客服、基础程序员、简单生产制造岗位等。另一方面,DeepSeek也创造了新的就业机会,尤其是在新兴行业如人形机器人、AI Agent、数据中心等领域。这些领域将需要大量的专业人才。同时,随着技术的变革,劳动者的技能需求也发生了转变,劳动力需提升数字技能、编程能力和数据分析能力,以适应新兴岗位的要求。

中国在互联网用户基础、数据资源、政策支持和产品快速迭代等方面的优势,为DeepSeek等应用的创新提供了良好的发展环境。借鉴移动互联网的发展经验,DeepSeek在产品创新、应用场景拓展以及产业链深度整合将是推动其成功的关键因素。展望未来,DeepSeek等产品有望在更多领域实现突破和应用,持续推动经济和社会的发展。

-END-

本期作者

胡国栋 招商银行研究院 行业研究员

huguodong@cmbchina.com

转载声明:

1、本报告为招商银行研究院已发布报告的公开版本,报告内容均为原创。

2、如需转载,请提前征得本公众号授权。转载时需要保留全文所有内容,请勿对本报告进行任何有悖原意的引用、删节和修改。

3、转载时请注明出处为“招商银行研究院(ID:zsyhyjy)”,并在“原文链接”中保留原始公众号文章链接。

4、授权方式:请参照文末方式联络招商银行研究院。

注意:未经招商银行事先授权,任何人不得以任何目的复制、发送或销售本报告。

招商银行版权所有,保留一切权利。

责任编辑|余然

网址:【招银研究 https://www.yuejiaxmz.com/news/view/782227

相关内容

科技金融推动银行业务创新研究
Z银行西安分行电子设备管理优化的研究
中国研究生招生信息网
a银行一线客服员工压力及其应对策略研究
社交电商视角下的银发族数字生活形态研究
建设银行S分行基层员工工作幸福感提升策略研究
银河征集丨银河书画院与京津冀书画研究院举办迎新春书画展征集启事
【在职考研】四川师范大学在职研究生招生专业目录
研究生
2019银行金融科技系列研修班之开放式银行如何构建专题(北京)

随便看看