1、天风,唐海清,王奕红)L什么是ChatGPT ?ChatGPT近期获得较高的关注度,人们可以与其聊天对话,进行文本互动,那 么什么是ChatGPT呢? ChatGPT是美国人工智能研究实验室OpenAI开发的 一种全新聊天机器人模型,它能够通 过学习和理解人类的语言来进行对话,还 能根据聊天的上下文进行互动,并协助人类完成一系列任务。其中 GPT 指代的是一种模型,其是 “Generative Pre-trained Transformer 生成型预训练 变换模型的缩写,目的是为了使用深度学习生成人类可以理解的 自然语言。目前我们讨论的GPT 一般指的是GPT-3,显而易见,在之前还有 GP
2、T-2和GPTo GPT-3是由人工智能公司OPenAl训练与开发,该模型设计基 于谷歌开发的变换语言模型。GPT-3的神经网络包含1750亿个参数,为有史 以来参数最多的神经网络模型。OpenAI于2020年5月发表GPT-3的论文, 微软在2020年9月22日宣布取得了 GPT-3的独家授权。回顾GPT的发展,GPT家族与BERT模型都是知名的NLP模型,都基于 Transformer技术。GPT,是一种生成式的预训练模型,由OpenAI团队最早 发布于2018年,GPT-I只有12个TranSfOniler层,而到了 GPT-3,则增加 到96层。其中,GPT-I使用无监督预训练与有 监
3、督微调相结合的方式,GPT- 2与GPT-3则都是纯无监督预训练的方式,GPT-3相比GPT-2的进化主要是 数据量、参数量的数量级提升。而InstructGPTGPT3. 5 (ChatGPT的前身)与GPT-3的主要区别在于,新加 入了 RLHF (Reinforcement Learning from Human Feedback, 人类反馈强化学 习),其增强了人类对 模型输出结果的调节,并且对结果进行了更具理解性的 排序。应用Tamer框架,ChatGPT可以比GPT-3更好的理解和完成人类语言 或指令,模仿人类,提供连贯的有逻辑的文本信息的能力。ChatGPT算法成功 的原因:强大
4、的基座模型能力(InStrUetGPT)、大参数语言模型(GPT3. 5)、 高质量的真实数据(精标的多轮对话数据和比较排序数据),以及性能稳定的 强化学习算法(PPo算法)。图7:中国算力发展情况1400.01200.01000.0800.0600.0400.0200.031.70.0 201920202021202220232024百亿亿次浮点运算/秒(EFLOPS) -资料来源:城市大脑研究院微信公众号,IDC,天风证券研究所2. ChatGPT的运行机制OpenAI利用RLHF来训练模型(该方法在训练中使用人类反馈,以最小化无 益、失真或偏见的输出),使用与InStrUCtGPT相同的
5、方法,但数据收集设置 略有不同。通过使用supervised fine-tuning来训练初始模型,将这个新的 对话数据集与InStrUCtGPT数据集混合,并将其 转换为对话格式。方法总体上包括三个不同步骤:1、有监督的调优:预训练的语言模型在少量 已标注的数据上进行调优,以学习从给定的prompt列表生成输出的有监督的 策略(即SFT模型);2、模拟人类偏好:标注者们对相对大量的SFT模型 输出进行投票,这就创建了一个由比较数据组成的新数据集。在此数据集上训 练新模型,被称为训练回报模型(ReWard Model, RM) ; 3、近端策略优化(PPO) : RM模型用于进一步调优和改进S
6、FT模型,PPO输出结果是 的策略 模式。第一步是收集数据,以训练有监督的策略模型。为了创建像ChatGPT 这样的通用聊天机 器人,开发人员是在代码模型而不是纯文本模型之上进 行调优。第二步是训练回报模 型,这一步的目标是直接从数据中学习目标函 数。第三步是使用PPo模型微调SFT模型,这一步里强化学习被应用于通过 优化RM模型来调优SFT模型。3. ChatGPT会提升多少算力?中国算力发展持续快速增长。根据城市大脑研究院,IDC预测,中国智能算力 规模将持续 高速增长,预计到2026年中国智能算力规模将达到1271.4EFL0PS, 22-26年复合增长率 达52. 3%,同期通用算力规
7、模的复合增长 率为18. 5%oChatGPT将需要大量算力和计算资源。根据通信世界数据,ChatGPT的总算力 消耗约为3640PF-days (即假如每秒计算一千万亿次,需要计算3640天), 需要7-8个投资规模30亿、算力500P的数据中心才能支撑运行。ChatGPT 需要TB级的运算训练库,甚至是P-Flops级的算力。ChatGPT包括研发(训 练)和应用(推理),其都需要大量智能计算资源和数 据存储及传输资源。图8: GPT3到GPT4数据大幅增长资料来源:新疆师范大学学报微信公众号,ChatGPT的运行模式、关键技术及:现阶段的ChatGPT是在拥有3000亿个单词的语料基础上
8、预训练拥有1750亿 参数的模型,GPT-4将是一个拥有超过100万亿级别参数的大模型。根据学 术界的既有研究可知,深度神经网络的学习能力和模型的参数规模呈正相关。人类大脑皮层有140多亿个神经细胞,每个神经细胞有3万余个突触,因 此,大脑皮层的突触总数超过100万亿个,神 经细胞通过突触相互建立联 系。一旦GPT-4实现100万亿参数规模,就可以堪比人的大脑,意味着它将 达到与人类大脑神经触点规模的同等水平。下游应用场景有望持续拓展。目前ChatGPT的主要应用场景包括但不限于无代 码编程、小 说生成、对话类搜索引擎、语音陪伴、语音工作助手、对话虚拟 人、人工智能客服、机器 翻译、芯片设计等
9、随着算法技术和算力技术的不断 进步,ChatGPT也有望进一步走向更 先进功能更强的版本,在越来越多的领域 进行应用,为人类生成更多更美好的对话和内容。4.对数据中心的影响未来异构计算或成为主流。在CPU+GPU的异构计算架构中,GPU与CPU通过 PCle总线连接协同工作,CPU所在位置称为为主机端(host),而GPU所在 位置称为设备端(device)。基于CPU+GPU的异构计算平台可以优势互补,CPU 负责处理逻辑复杂的串行程序,而GPU重点处理数据密集型 的并行计算程 序,从而发挥最大功效。AlOO服务器系统功耗明显提升。以NVIDIA的DGX AlOO 640GB为例,其配置了
10、 8片AlOO GPU,系统功耗达到最大6.5千瓦, 未来随着AlOO服务器的应用增多,我们认为或将显著 提升数据中心机柜的功 耗。机柜功率或将迎来大幅提升。通常19英寸机柜和42U机柜是标准机柜,参考 高度1U=4. 445厘米,宽度19英寸约为48.26厘米,英伟达DGX AlOO 640GB宽度上基本约为19英寸,高度上大约为5. 94U,以标准机柜42U为 参考,最大限度可以放下约7台DGX AlOO 640GB服务器(实际需要预留散 热、挪动、走线等的空间),最大功率可达到约45. 5KWo ChatGPT训练将带来 较大的碳排放。ChatGPT是基于GPT-3的一个升级版本,在GP
11、T-3的模型架 构基础上进行了优化并在训练时期增加了强化学习。训练一个GPT-3约消耗 1287 MWh (兆瓦时)的电,相当于排放了 552吨碳,由于强化学习需要额外消 耗的电力,ChatGPT在模型训练阶段所产生的碳排放将大于552吨。图15:冷板冷却示意图CPU冷却剂通道资料来源:CDCC微信公众号,天风证券研究所东数西算下PUE指标严格。随着东数西算的实施,其推出针对上架率、能效指 标作出规范要求,同时如北京、上海等核心区域出台能耗管控指标,有望助力 行业有序发展,也突显出一线地区机柜资源的稀缺性。21年月,贯彻 落实碳达峰碳中和目标要求推动数据中心和5G等新型基础设施绿色高质量发 展
12、实施方案提出,全国新建大型、超大型数据中心平均用电效率降至L3 以下,全国中心节点进一步降至1.25以下,绿色低碳水平达到4A以上。数 据中心基础设施根据冷却方式不同可分为风冷数据中心基础设施和液冷数据中 心基础 设施。风冷方式起步较早,技术相对成熟;液冷方式是近几年因数据中 心散热需求提升而出现的一种新方式,技术尚处于发展阶段。液冷方式分为冷 板液冷和浸没式液冷,浸没式液冷方式又可分为相变浸没式液冷和非相变浸没 式液冷。制冷散热主要方式:目前发展的散热冷却技术主要有风冷和液冷两大类,其中 风冷包括自然风冷和强制风冷,适用的机柜功率密度较低;液冷分为单相液冷 和相变液冷。散热冷却系统所采用的冷
13、却介质、冷却方式不同,移热速率差距 大。传统风冷最高可冷却30 kW/r的机柜,对于30 kW/r以上功率密度的机 柜无法做到产热与移热速率匹配,会使机柜温度 不断升高导致算力下降甚至损 害设备。可以看到,采用AlOO后服务器功率大幅提升,参考上文若采用英伟 达DGX AlOO 640GB服务器,单机柜的功率或将超过30kW,此时更适宜应用液 冷的冷却方案。液冷分为间接液冷、直接单相液冷和直接两相液冷,主要根据 液体与IT设备接触状态来区分。目前而言,普遍应用的是冷板冷却的方式,使用的是液冷和风冷相结合的方 法,对芯片采用液冷,对硬盘等其他电器元件采用风冷,并非严格意义上的单 纯液冷。属于间接
14、液冷的一种方式,冷板能冷却小于45 kW/r的机柜更节能 且噪音小,不需要昂贵的水冷机组,与 纯液冷对比也有一定优势。单相浸没式 液冷制冷效果更强,但难度较高。单相浸没式液冷需要对液冷材料进行筛选(满 足绝缘性强、黏度低、闪点高或不燃,腐蚀性小,热稳定性高,生物毒性 小等性能要求)和IT设备进行设计,但该方式可以实现冷却的传热系数范围 更广。25.0020.0015.0010.005.000.00201920202021营业收入(亿元)归母净利润营业收入增长率 归母净利润1资料来源:润泽科技2021年年报,润泽科技公司公告,天风证券研究所5.重点企业分析5. 1.润泽科技:国内领先的数据中心整
15、体解决方案提供商。润泽科技发展有限公司于2009年 9月在廊坊 经济技术开发区注册成立。自成立以来,公司始终专注于开发及运 营超大规模、高等级、高效高性能数据中心集群。目前润泽科技在廊坊建设运 营的润泽(廊坊)国际信息港数据中心集群,规模位居全国前列,2009年成 立以来陆续启动廊坊A区工程建设,布局长三角、大湾区、成渝经济圈、西 北地区数据中心建设,建设超大规模数据中心产业园区;并与中国电信、中国 联通等电信运营商通过长期合作建立了良好的业务关系,为其提供数据中心整 体解决方案。公司近年收入与利润增速较快,营收有望保持高速增长。营业收入来看,公司 营收全部为数据中心业务收入,2019-202
16、1年营收复合增长率达到43. 89%, 整体营业收入不断增长。2022年Q3实现营收7. 18亿元,同比增长35. 90%o我们认为,随着数据中心行业的快速 发展和公司品牌运营建设能力的 不断增强,公司收入有望持续快速增长。净利润来看,公司2022年Q3净利 润为3. 46亿元,同比增长103. 42%o营业利润为公司利润的主要来源,主营 业务突出,具有良好的盈利能力。我们认为,随着下游客户行业需求的不断增 长和公司数据中心产能的不断提高,公司盈利有望持续提升。具体来看,润泽科技盈利能力的持续提升主要驱动因素如下:1)数字化驱动下 游行业需求快速增长,市场规模不断扩大。一方面,互联网行业客户由
17、于自身 业务发展的需要,对 数据中心资源需求旺盛;另一方面,5G、云计算、大数据 等网络架构的迅速演进和网络应用的不断丰富也产生了大量的数据中心机房和 带宽需求,我国IDC业务市场规模连续高速 增长。2)机柜数量增加产能提 高,数据中心上电率快速爬升。公司投入使用的数据中心共有8栋,高标准 机柜约有46, OOO个(根据A栋完成情况推算)。公司产能的不断提高,适 时的满足了下游客户需求的增长,为企业的盈利能力提供了坚实的基础。同时 截止2020年底,公司整体机柜上电率超过75%,高于同业万国数据、世纪互 联和秦淮数据等公司,具有较强竞争优势,上电率抬升带动IDC收入增加。3)积极拓展优质客户,
18、客户需求不断增长。2018年-2021年10月,润泽科 技前五大终端客户的营收占比分别为92.12%、92. 39% 92. 50%和94. 21%,其 中最大终端客户字节跳动业务占比较高超60%,主要由于其近几年业 务发展较 快,导致其对数据中心需求持续增加。同时与第一大客户中国电信及第二大客 户中国联通保持稳定良好合作关系。润泽国际信息港IlO千伏J23:资料来源:润泽科技公司官网,天风诃优质机柜布局为“核心资产”,机柜规模行业领先。润泽(廊坊)国际信息港 于2010年正式投资建设,润泽国际信息港位于廊坊国家经济技术开发区,地 处京津冀经济圈、环渤海 经济圈的中心。项目规划建设22栋、约1
19、00万平 方米高等级数据中心,可容纳约13万架 机柜。目前已建成投产的机柜数量约 4.5万架,正在建设中5栋数据中心共计约3万架机 柜,润泽(廊坊)国际 信息港A区全面建成后,总建筑面积55万平米,容纳近7万架机柜运营, 单园区规模位居全国前列。该数据中心布局较早,扩容空间充足,可供终端客 户 根据自身业务的迅速发展直接在本地数据中心扩容,承载更多的数据量,为 客户提供优质的服务。复制润泽(廊坊)国际信息港成熟发展模式,全国布局建设五大新数据中心。 2020年开 始润泽科技在长三角、粤港澳大湾区和成渝经济圈布局大数据中心 产业集群。目前长三角平湖润泽国际信息港项目、润泽(佛山)国际信息港、 润
20、泽(惠州)国际信息港、润泽(西南)国际信息港和润泽(兰州)国际信息 港均已动工建设。润泽科技数据中心项目布局均位于大数据中心国家枢纽节 点,符合国家数据中心建设布局,依托廊坊的开发经验在 全国复制推广,区域 优势与规模效应显著。自建电站、自建综合管廊,提供稳定强劲电力引擎。电力供应作为公司数据中 心建设的三 个必要条件之一,润泽科技已在全国布局项目电力供应保障。廊坊 地区除了政府配套的多 路市政供电,2021年公司已投产一座用户自用IlOKV 变电站,2022年开始投建一座220KV变电站。长三角平湖园区2022年7月 已投产一座用户自用HOKV变电站。液冷机柜已有布局。公司已经做了浸没式液冷
21、和冷板式液冷实验机房,其中浸 没式液冷,PUE指标非常好,但是结合用户侧的需求,大规模商用还需要时间 来培养。冷板式液冷是 公司未来的一个主流技术方向,客户对此接受程度较 好,已经开始准备批量交付液冷机房。图25:奥飞数据发展历程20049月金飞Im成立20146月注SP广方现,七务业6月WR广拓修视现密化8月袄国中房证券录至牛身目及牌新三缶H6毗;(百彗翼3月以伍左体票国际IAH) (IS0900120151月 底蹲2015年度中国UX201620174月Ge信投,S馀事认口碰7月 正持2013t广乐咐告同UHm H ( (IS(4月狂Q 2015W凄中掘中心百春品0发7月务三翻!UK69月
22、舒历依*企业0书11月 笠博AAA*示危企业 比书8月公司受在广州乃百餐企业) ”月FW2017年以网佶学!11月 广州金发匐中心AAASK) UQ资料来源:奥飞数据官网,天风证券研究所5. 2.奥飞数据:持续快速发展的IDC领先厂商。奥飞数据成立于2004年9月,是专业的数 据中心业务运营商和通信综合运营企业,已在数据中心领域深耕十数年。近年 来,公司屡获荣誉,并连 续两年获得中国电信年度IDC优秀合作伙伴。2018 年1月,公司在A股创业板上市。公司持续深耕IDC领域,目前已成为行 业领先企业之一,核心机房资产保障发展基础,绑定 大客户快速成长。公司是多家互联网巨头的IDC服务提供商,客户
23、包括搜狐、网易、阿里巴巴、 快手等巨头 公司。奥飞数据具有较强的客户群体,根据奥飞数据招股说明书, 公司2014年开始与UC开展业务关系,同时前五大客户还包括风行、网宿科 技、乐视网,而后2015年搜狐成为 前五大客户之一,同时2015年首先与广 州市百果园网络科技有限公司达成合作,后续又与其关联企业开展了合作,2016年广州百果园成为公司前五大客户之一。2019与2020年 公司继续拓展 强大客户,与快手和阿里巴巴等签订合作协议。目前公司客户阵容强大,持 续 增长的互联网数据存储需求将助力公司业务发展。公司与阿里巴巴、快手以及百度建立了合作关系。公司持续拓展IDC批发业 务,2019年 与快
24、手关联公司北京达佳签订了数据中心模块合同,合同金 额约3.3亿元,之后2020年公司与阿里巴巴建立合作关系,签订合作备忘 录,并于2021年签订合同,金额为5亿元。21年9月与22年2月,公 司与百度先后签署两项合作意向书,就公司廊坊固安数据中心/广州南沙数据 中心项目合作达成意向,两项合同预计总共贡献收入9. 5/10亿元。上 述合同 的签订让公司成功与互联网巨头建立了合作关系,保障了公司未来数年的收 入。公司在全国数据中心布局热点地区具有众多机柜资源,截止2021年末公司在 全国各地接 入了数十个高标准数据中心,机房总使用面积达到125000+平方 米,可提供19900机柜资 源。区域布局
25、涵盖海南自贸区、粤港澳大湾区、长 三角地区、京津冀地区等核心区域。该 类区域机房资源已成稀有资产,公司坐 拥核心区域机房资源具有先发优势与行业核心竞争能力。截至22年5月, 公司在广州、深圳、北京、海口等核心地段均布局了自建与非自建机房,提升 公司IDC服务能力,未来公司仍将大力推动IDC数据中心的建设,完善机房 布局,推 动业绩不断增长。表3:公司主要新能源产品品类型号功率段/电J组串式SPl-B系列3-60kW5(SPI-B-H 系列 集散式100-250kV光伏逆变器SPI-BS系列智能光伏MPPT汇流箱集中式IMW/2MM1500Vdc1500VdcSPI-B-HUD逆变升压一体机智能
26、光伏直流汇流箱光伏电站智能运维光伏配件管理系统分布式能源监控管理系统5. 3.科华数据 科华数据股份有限公司前身创立于1988年,2010年深圳A股上市(股票代 码002335) , 31年来专注电力电子技术研发与设备制造,是行业首批“国家 认定企业技术中心”、“国家火炬计划重点项目”承担单位、国家重点高新技 术企业、国家技术创新示范企业和全国首 批“两化融合管理体系”贯标企业。 公司作为中国极具影响力的高安全数据中心提供商,拥有10年以上IDC行业 运营管理经验,主要客户包括三大运营商、腾讯等大型互联网企业、各大金融 机构、政府机关等。在 金融领域,公司全线入围UPS、微模块总行级选型,护
27、航国有六大银行及兴业银行、交通 银行、招商银行等商业银行,、保险等金融 机构的100多个省级数据中心机房,打造中国金融业首个模块数据中心、高 压直流供电数据中心、集装箱数据中心,及全球首个轨 道机器人巡检数据中 心。同时,公司产品方案入驻腾讯、百度、优酷、科大讯飞等国内大型互联网企 业,中科院超 级计算青岛分中心、国家测绘局、国家工商总局、中国航天二 院、清华大学、中国科学院、中国商飞、平安集团、中冶集团等项目,全面支 撑通信、互联网、政府、金融、教育等行业信息化与数字化建设。根据计世资 讯数据显示,科华数据在2019-2020年中国微模块 数据中心市场份额排名第公司目前数据中心相关收入主要包
28、含:云计算业务、数据中心产品销售,以及 承接数据中心EPC等。公司为用户提供高安全数据中心云基础服务,支撑金 融、互联网、运营商、政府、教育、医疗等行业信息化建设,帮助企业实现云 端迁移。公司凭借专业团队为客户提供从规划、采购、建设、维护、运维多个 维度分析,从而实现全面且合理的成本控制。随着公司自建数据中心建设规模 的扩大,公司数据中心机柜规模稳步上升,截至2022年 半年报,在北、上、 广等地拥有8大数据中心,自持机柜数量3万多个;在全国10多个城市运 营20多个数据中心。公司新能源业务包括储能、光伏等可再生能源应用领域,主要产品包含光伏逆 变器、光伏 离网控制器、储能变流器、离网逆变器等
29、产品及相应配套系统解决 方案服务。目前,公司储能装机量超过LIG肌连续六年入选全球新能源企 业。储能作为综合能源系统的枢纽,是公司新能源业务未来的发展重点,公司 已在发电侧、电网侧、用电侧以及微网储能等领 域进行布局,满足客户及市场 对于稳定、高效、绿色电能的需求。公司在新能源领域进行市场细分,推出针对性解决方案。光伏发电领域,公司 拥有领跑者解决方案、智慧“光伏+”综合解决方案、光伏扶贫电站系统解决 方案等五种方案,和不 同场景、不同规模下光伏发电需求实现对接。以领跑者 方案为例,公司针对水面、平坦地 形、复杂地形三种环境场景推出不同的搭配 方案,缓解地形缺陷对发电效果的不良影响;在储能领域
30、公司立足于用户侧 储能、发电侧储能和微电网系统,覆盖户级、村级、乡镇级、城市级、海岛级 各个规模,具有较好的市场适应能力。资料来源:英维克微信公众号,天风证券5. 4.英维克 温控设备领先厂商,技术积累赋能产品/客户拓展。公司下游行业布局丰富,产 品与服务 广泛应用于数据中心、通信、智能电网、储能电站,新能源车、轨道 交通、冷链运输,智慧教育、家居、医疗等行业,服务如三大运营商、 Sprint,软银等运营商以及腾讯、阿里巴巴、秦淮数据等客户。丰富的下游应 用领域布局助力公司业务持续增长动力强劲。公司产品布局广泛,围绕温控拓 展不同应用系列。英维克产品围绕精密温控节能产品拓展,应用领域包含数据
31、 中心机房、储能、机柜、冷链等。目前公司已基本构建了从热源到冷源的设备 散热全链条的技术平台,并逐渐完善健康环境的多维度空气质量管理的技术平 台,具备针对不同下游细分市场及行业大客户快速提供个性化需求的产品和方 案的能力。推出XGlacier液冷系列产品。公司推出XGlacier全链条冷板式液冷系统, 采用集成冷板式 液冷技术、高效变频水泵、温水冷却技术达到高效制冷效果, 同时充分利用自然冷源,做 到极致节能,CLF低至0.03。该方案适用于集中 式和分布式液冷系统,在2021年实现单 机柜200kW超高功率密度算力服务 器全液冷批量交付,并荣获“数据中心科技成果一等 奖”。推出六大制冷方 案
32、赋能东数西算建设。英维克高效制冷产品和解决方案在“东数西算”多个 集群中已成熟应用,根据各区域枢纽数据中心对PUE的不同需求,在系列数据 中心冷却方案中,精选出6种高效节能方案。六大高效制冷方案因地制宜, 助力机柜能耗的降低,赋能东数西算的建设打造。我们认为英维克凭借全方位 高效率的制冷解决方案,有望在“东 数西算”未来落地建设中广泛应用进一步 提高品牌知名度,提升市场份额。已有丰富的项目经验。英维克的制冷解决方案已在多个节点有项目经验,XFlex 间接蒸发 冷却机组产品已批量应用在河北、山西、北京、张北、深圳等多个数 据中心中;此外宁夏 中卫的美利云项目采用XFlex蒸发冷却系统及XStorm 风墙系统,实现节能减耗,显著提高 能源利用率。