龙志中:2024年是人工智能爆发期
专题:2024中国(guó)AIGC创新发展(zhǎn)论坛
2024年服贸会专(zhuān)题论坛(tán)之一——“2024中国AIGC创新发展论坛”于9月13日-14日在北京举行。曙光云计算集团(tuán)股份有限公司总裁助(zhù)理龙(lóng)志中出席并演讲。
龙志中(zhōng)表示,2024年是(shì)进入到了人工智能的(de)爆(bào)发期(qī)。今年前8个月,在手机移动(dòng)端上(shàng),人(rén)工智能应用收入(rù)与去年相比同比增长了51%,预计今年整个收入会达到33亿美元(yuán)的 规模(mó)。
龙志中介绍,曙光(guāng)一直是一家专注做计算的企业,创立之初到(dào)现在,一直围绕着计算的核心部件,主要产品,以及(jí)计算的基础设施建设 和运营服务,来打(dǎ)造核心(xīn)竞争力。
龙志(zhì)中表示,曙光致力于提供(gōng)解决(jué)方案,以降低使用人工(gōng)智能大模型在算力(lì)方面(miàn)的门槛。具(jù)体来(lái)看,曙光能够提供的助力有三个方(fāng)面:第(dì)一是人工智能相关的核心部件,主 要产品,还有关键的基础设施,包括PUE在1.04以下(xià)的全液冷数据中心。第二是算力中心的建(jiàn)设和运营。目前曙光在(zài)全国(guó)有(yǒu)二十(shí)多个大型的算力中心、智算(suàn)中心、先进计算中心,以及五十多个城市云中心,能够为企业、区域/城市能够提供澎湃(pài)、多(duō)样的算(suàn)力资源。第三是人工智能(néng)的生态,在(zài)目前主流的大模型跟曙(shǔ)光的核心部件,主要产品还有算力平台基本(běn)上都做了适配 ,并且在算(suàn)力(lì)互联网上能(néng)够提供生态合作伙伴的大模型服务。通过接(jiē)入(rù)算力互联网,企业不需要(yào)自己去构建算力基础设施的平台,甚至(zhì)不需要去(qù)部署自(zì)己的大模型,可以直(zhí)接采(cǎi)用多(duō)样的算力服务和大模型(xíng)服(fú)务。
以下为演讲(jiǎng)实录:
龙志(zhì)中:各位专家,各位嘉宾,大(dà)家(jiā)上午好,我是曙(shǔ)光云(yún)的龙志中,今天非常荣幸能够跟各位专家学习AIGC大模型、人工智能(néng)领域最新的前沿理论和成果,也有机会(huì)跟大(dà)家一起探(tàn)讨人工智能(néng)AIGC对于我们(men)今(jīn)天(tiān)以及未来的生活(huó)方式、工作(zuò)模式、创新范式所带来的深远影响。也想借(jiè)这个机(jī)会跟大家(jiā)汇报一下曙光云在企业开发大模型、应(yīng)用大模型的过程当中,能(néng)够为大家提(tí)供哪(nǎ)些助力。
曙光跟(gēn)今天前面分享(xiǎng)的嘉宾所在的企业有所不同,前面这些(xiē)企业更多是在(zài)开(kāi)发大模(mó)型(xíng)或在(zài)做大模型(xíng)应(yīng)用场景(jǐng)侧(cè)的开发,给大家提供的是(shì)大模型本身、大模型应 用,为我们的生活和工作所带(dài)来的便利。曙光相对来讲更偏底层(céng),我们做的是计算 基础设施和(hé)算力服务,也就是说我们为大模(mó)型的(de)开(kāi)发和大模型应(yīng)用(yòng)提供基础设施和算力服务,按照大模型三层架构分类的(de)话,我们是(shì)在上游;从技术架构层次来分的话,我们是在底层。
刚才几位嘉宾都提到,AIGC生成式大模型在这两年,特(tè)别是2022年之后成为一个热词,我们看到的(de)多个榜单(dān)里面,特别是(shì)在2023年度热词榜单里面(miàn)AIGC都是排在前几位(wèi)甚至排(pái)在(zài)首位的(de)。1957年(nián)人类就已经用计算 机生成了历史上第(dì)一首(shǒu)机器创作的音乐作品。直到2022年(nián)11月份,有一个标志性的(de)事件就是OpenAI的GPT,从那个时刻开始人类对(duì)于人(rén)工智能的应用才从传统的“知识(shí)的分类器”进化到“内容的(de)生成器”。
从2023年开始,我们非常明显地可以看到“百(bǎi)模大战”,2023年中国发布的(de)人工智能大模型是300多个,我们也(yě)认为从2023年开始AIGC或者人(rén)工智能大模型开始渗透到我们的工(gōng)作、生活的各个方面。我昨天看到一个新闻,谷歌(gē)的联合创始(shǐ)人谢尔盖退休两年了,现在被AI广(guǎng)阔的前景(jǐng)所吸引,重(zhòng)新回到一线敲代码,他抱怨自己的员工、程(chéng)序员用人工智能写代码(mǎ)的(de)比例太低了。人工智能(néng)除了(le)可以生成图片、生成文字,现在能够(gòu)生成(chéng)音频、视(shì)频、影视作品,能够写代码(mǎ)。
同时,很(hěn)多人之前(qián)查资料,查素材、查(chá)数据的时候用搜索引(yǐn)擎。但现在,我相信(xìn)很多人已经在用Kimi、豆包,取代了以前要(yào)借助(zhù)百度、谷歌所要完(wán)全的(de)相(xiāng)关搜索,甚至知识的提炼和知识的整理工(gōng)作。
2024年是真正进入到人(rén)工智能的爆发期或者(zhě)叫井喷期。今年(nián)前8个月,在手机移动端上(shàng)人(rén)工智能(néng)的应用收入跟去年相比同比增长了51%,预计今年整个收入会达到33亿美元的规模。今天我们也听到了很多人工智(zhì)能头(tóu)部厂商的(de)专家(jiā)给我们带来了最新成果,从(cóng)侧面证明2024年人(rén)工(gōng)智能真正的井喷期已经到来了。
从未来发展(zhǎn)来看,Gartner预测,2027年生(shēng)成式(shì)人工智能市场规模会超1800亿美(měi)元,占(zhàn)全(quán)球整个AI支出的42%。
我(wǒ)们一(yī)直说算力、算法和算料(或(huò)者数据)是人工智能发展的三大要素(sù),从AIGC角度来讲,算力、算(suàn)法和算料也是AIGC发展的三大要素。现在大家有一个普遍共(gòng)识,大模型意味着大(dà)成本,也就是说大(dà)模型是一个非常烧(shāo)钱的生(shēng)意,或者说是一个(gè)非常烧(shāo)钱的游(yóu)戏(xì)。大模型(xíng)厂(chǎng)商的整体运营成本(běn),一般来看分为三部分,第一部(bù)分是用于推理的成本,第二部分用于训练的成本,第三部分是人工成本(就是程序员、管理人员、测试人(rén)员)。中国工程院院士郑纬民教授的测算结果表(biǎo)明,大模型训练中70%的成(chéng)本是(shì)用在算力上,推理过程当中这个比例(lì)就 更高,超过了95%。根据OpenAI2024年的财务预测(cè),预龙志中:2024年是人工智能爆发期计2024年总的运营成本会达到85亿美元,里面15亿美金是人(rén)工成本(běn),就是工(gōng)程师成本,另外70亿(yì)中的30亿是训练成(chéng)本,40亿(yì)是推理的成本,绝(jué)大部分都是用于采购算力。这(zhè)个说明(míng),确实做(zuò)人工智能大(dà)模型(xíng)、做AIGC,算力是我们所有运营成本里面占(zhàn)比最(zuì)大的一块,也是最重要的一块。所以OpenAI的CEO把OpenAI这家公司定义(yì)成了一家硅谷历史上最资金密集型的一个(gè)初(chū)创公司。
我们知道(dào)现(xiàn)在进入(rù)到数字(zì)经济的时(shí)代。国家数据局的刘烈宏局长认为算力就是数字经济时代的新质生产力。有一个指数就叫“计算力指数”,计算力指数平均每增长一个百分点,所带来的数字经(jīng)济和GDP的增长会分别增(zēng)长3.3%和1.8%。目(mù)前的算力市场有几个类型:第一类是通用算力或者(zhě)基础算力,第二类是智能算力,第三(sān)类是高级算力,另外一种算力叫量子算力。
从我们(men)看到的调研机构数据来看,2021年的时候,智能算力在整个中国整体算(suàn)力规模(mó)里的占比已经(jīng)超过了(le)50%,达(dá)到了51%,并且到(dào)2030年的时候这个比例(lì)还(hái)会持续增加(jiā),预(yù)计(jì)会占到整个算力(lì)规模的72%。同时,信(xìn)通院的预测是到2030年的时候,人工智能算力需(xū)求跟18年相比会增加390倍。所以我们讲数据、算法和算(suàn)力是数字经(jīng)济的关键资源,数(shù)据或者算料成为新的生(shēng)产资料,算力成为(wèi)了新(xīn)的生(shēng)产力,或者按照现在的说法成为新(xīn)质生产力,算法成为现在新的生(shēng)产关系。
刚(gāng)才我们(men)讲到(dào)算力,在(zài)整个人工智能的发展过(guò)程当中,算力的(de)需求或者算力所(suǒ)占用的成本应该是非(fēi)常(cháng)高的,超过的50%以上。同时我(wǒ)们(men)可以看(kàn)到(dào),随着(zhe)大模型成(chéng)为AI领域新的开发范式,AIGC对(duì)于训练数据的需求也是呈指(zhǐ)数级增加的。从ChatGPT到谷歌 的switch transformer,模型规模和数据规模是持续巨量增加(jiā)的,可以认为是指数(shù)级(jí)的增加,数据和参数规模在一年之(zhī)内增长了一百倍之多。同时随着(zhe)大模型的参数和所需数据量(liàng)激增,所需要的智能化底座规模也是会越来越大,特别是对于算力的需求更是如此。在小(xiǎo)模型时代,更多是用于图像、语音和文本分析的时代,可能很多时候我(wǒ)们单(dān)机(jī)规模就能满(mǎn)足(zú)我们一般(bān)的需(xū)求。到了以(yǐ)ChatGPT为代(dài)表的文(wén)本大模型时代,参数规模基本上(shàng)超过了千(qiān)亿。所需要的计算集群(qún)或者算力底座的规模也进入千机万卡时代。目前做大模(mó)型竞争,千机(jī)万卡基本成为(wèi)了门槛或者是标(biāo)配。到了多(duō)模态大模型的时代,比(bǐ)如谷歌(gē)的switch Transformer,参数(shù)规模达到了(le)1.6万亿(yì),这种规模大模型需要万(wàn)机十万(wàn)卡规模的集群来(lái)承载。
现在千(qiān)机万(wàn)卡(kǎ)已经成为大模(mó)型厂商的一个(gè)门槛,一个(gè)入门的入场券,但(dàn)其实并(bìng)不是所有的企业要用到大模型都需要(yào)自(zì)己去构建这么(me)大规模的算(suàn)力(lì)底座。AIGC或者(zhě)人工(gōng)智(zhì)能这个领域的三层模型是大家公认的一(yī)个分层模式 。根据企业在这(zhè)个领域里的产业分工,分为上游、中 游和下游。上游就(jiù)是基础设施,包括关核心部(bù)件、主要产品和基础设施的服务,以及预训练模型和数据(jù)的供给。中游就是今天在座很多的AIGC头部企业,在做model as a service,做垂直化(huà)、场景化、个性化的大模型落地。下游就(jiù)是应用(yòng)层,面向企业、面向个人来做内容生(shēng)产(chǎn)、设计、分发等大(dà)模型场景应用。在AIGC的(de)三个(gè)层面,所需要的算力资源规模(mó)、类(lèi)型、获取途径(jìng)是不一样的。
曙光一直(zhí)是(shì)一家专注做计算的企(qǐ)业,创立之初到现在,一直围绕着计算的核心部件,主要(yào)产品,以及计算的基础 设(shè)施建(jiàn)设和运营(yíng)服务(wù),来打造自己的核心竞争力。我们可以看到,目前在人工智能(néng)这个领(lǐng)域所面(miàn)临的挑战或者困境有(yǒu)几个:一个是算力资源(yuán)获取的便利性、普惠性(xìng)、技术架构的开放性(xìng)、算力的(de)融合性以及能耗方面的高开销。
曙光也希望在这些领域(yù)能够给大家(jiā)提供解决方案,来(lái)降低使用人工智能大模型在算力方面的一些门槛。曙光能够提供的助力有三个方面:第一是人工智能相关的核心(xīn)部件,主要产品,还有关键的基础设施,包括PUE在1.04以(yǐ)下的(de)全液冷数据中心。第二(èr)是算力中心的建设和运营(yíng)。目前我们在(zài)全国有二十多个大型的算(suàn)力中心、智算中 心、先进计算中(zhōng)心,以及五十多个城市云(yún)中心,能够为我们的企业、为我们的区域/城市能够(gòu)提供澎(pēng)湃、多样的算力 资源(yuán)。第三是人工智(zhì)能(néng)的生态,在目前主(zhǔ)流的大模型跟(gēn)曙光的核心部件,主要产品还有算力平台基本上都做(zuò)了适配,并且在算力互联网上(shàng)能够提供(gōng)生态合作伙伴的大模型服务(wù)。通过接入算力互(hù)联网,企 业不需要自己去构建算力基(jī)础设施的平台,甚至(zhì)不需要去部署自己的(de)大模型,可以直接采用多样的算力服务和大(dà)模型服务。
一些城市要打造数(shù)字基础设施(shī),来服务于数字化(huà)经(jīng)济发(fā)展(zhǎn),为企业(yè)数字化转型提(tí)供动力。曙光在全国各地建(jiàn)设(shè)运营的数据中心有四大类:先进计算中心,云计算中心(xīn)、智能计算中(zhōng)心、一体化大数据中心节点。这(zhè)些算力基础设施,符合信创要求和标准(zhǔn)来构(gòu)建,采用(yòng)了浸没式的液冷技(jì)术将(jiāng)能耗降到最低。再结合曙光(guāng)本地化专业团队和运(yùn)营服务,可以(yǐ)为我们区(qū)域数字经济发展和企业数字化转型提供动力(lì)。
有些企业希望在通用大 模型或行业(yè)大模型基础之上构建自己企业的大模型应用。曙光也可以提供云数智底座,帮助企(qǐ)业(yè)打造私有的大模(mó)型基础设施。在云数(shù)智底座里(lǐ)面不仅提供AI算(suàn)力、AI储力的基础设(shè)施,还能提供数据平台,数据(jù)平台帮助企业进行数据的(de)全生命周期管理(lǐ),同时为大模(mó)型应用提供优质的和充沛的算料。
人工智能、大模型产业的发展需要(yào)上中下游的协(xié)同努力,曙光也希(xī)望能(néng)够通过“中(zhōng)国科学院人工智能产学研创新联盟”和“光合组织”,作为技术创(chuàng)新和成果转化的平台,作为人工智能产业链上下游产业协作和共同发展的平台。我们(men)也希(xī)望通过我们提供的可信、开放、绿(lǜ)色和普惠的计算基础(chǔ)设(shè)施算力服务,跟在座的企业和业界的同仁一起(qǐ)努力(lì),帮(bāng)助企业在人工智能大模型领域的技(jì)术创新、商业(yè)模式创新和应用创新方面提(tí)供助力(lì)。也希望跟大家共同努力,共创(chuàng)AI产业崭新的未来,谢谢大家。
新浪声明:所有会议实录均为现场速记整理,未(wèi)经(jīng)演讲者审(shěn)阅,新浪(làng)网登载此文出于(yú)传递更(gèng)多信息之目的,并不(bù)意味着赞同其观点或证(zhèng)实其描述。
责任编辑:梁斌 SF055
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了