2024年6月21日,在华为开发者大会2024(HDC 2024)上,华为常务董事、华为云CEO张平安正式发布盘古大模型5.0,在全系列、多模态、强思维三个方面全新升级;张平安还分享了盘古大模型在自动驾驶、工业设计、建筑设计、具身智能、媒体生产和应用、高铁、钢铁、气象等领域的丰富创新应用和落地实践,持续深入行业解难题。

此外,华为诺亚方舟实验室主任姚骏、华为云CTO张宇昕分别就盘古大模型5.0技术解密和华为云全栈系统性创新发表主题演讲,详细解读华为云在AI领域的全栈创新优势。

▲华为常务董事、华为云CEO张平安发布盘古大模型5.0

盘古大模型5.0,在全系列、多模态、强思维三个方面做了全新升级

全系列:盘古大模型5.0包含不同参数规格的模型,以适配不同的业务场景。十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、高效率的推理场景;千亿级参数的Pangu U系列适用于处理复杂任务;万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。

多模态:盘古大模型5.0能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。在图片和视频识别方面,可支持10K超高分辨率;在内容生成方面,采用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行业场景,可生成更加符合物理规律的多模态内容。

动图封面

▲升级后多模态理解能力得到了大幅提升,看得更细致,理解更聪明

动图封面

▲《清明上河图》海量信息中,大海捞针的挑战也能轻松应对

强思维:复杂逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术与策略搜索深度结合,极大地提升了数学能力、复杂任务规划能力以及工具调用能力。

过去一年中,盘古大模型持续深耕行业已在30多个行业、400多个场景中落地

重塑自动驾驶

盘古大模型5.0通过创新的可控时空生成技术,结合场景视频生成、4D BEV视频生成、自动驾驶仿真库及路网信息,能更好地理解物理规律,大规模生成和实际场景相一致的驾驶视频数据,还可以灵活增加控制条件,生成不同路况、不同光照、不同天气的训练视频数据,加速自动驾驶技术的快速成熟。

动图封面

▲生成车身四周,六个摄像头视角的视频,可直接用于自动驾驶训练

动图封面

▲生成晴天,雨天,黑夜的行车视频,让自动驾驶学会应对丰富多样的场景变化

重塑工业设计

以新车造型设计为例,周期一般需要1-2年,盘古大模型可以让汽车的造型设计时间大幅缩短。造型设计师可以将自己的灵感,通过对话、画图与大模型交互,生成3D汽车数字模型,并可进行风格化调整、零部件编辑、颜色更换等。盘古大模型生成的数字模型还可直接输出成3D文件,支持10几种主流格式,设计师可以直接3D打印成样品,减少制作油泥模型的轮次,极大地节省成本和时间。

除了汽车造型设计,盘古大模型还可以用于汽车的工装设计、模具设计,以及电子产品领域的工业设计等。

重塑建筑设计

基于盘古大模型的可控生成能力,只需输入设计的黑白草图,即可生成彩色并带有纹理的建筑群360°实景视频;基于盘古3D重建能力,还可以构建出高真实感的建筑3D模型,将复杂建筑群的概念设计周期从数周缩短到数十分钟,助力建筑师创造出更加出色的建筑作品。

动图封面

重塑具身智能

盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。

重塑媒体内容生产和应用领域

盘古大模型能够将实拍视频快速转换成特定风格的动漫,并保持角色样貌特征前后一致,舞蹈、武打等大运动轨迹也能确保合理一致的视觉效果;能自动将视频译制成不同语言,并保留原始角色的音色、情感、语气;将译制配音、动漫生成等场景的制作周期从月级缩短到天级,大大提升制作效率,作品一次拍摄多元化制作,实现价值最大化。

动图封面

还能通过AI翻译和拟人化语音合成能力,实现AI同声传译,让云会议、视频通话等可以实现母语交流体验。

重塑高铁

全国每天需要检测的动车大概有3.2万节车厢,过去需要大量的巡检工人在凌晨时段去完成,耗时耗力。如今结合盘古大模型和巡检机器人,可精准识别一列动车的3.2万个项点,覆盖8大类、350多种复杂故障,帮助高铁提升运营效率,降低成本,减少人工在凌晨时段去巡检的艰辛作业。

重塑钢铁

以上海宝武钢铁热轧生产线为例,每次调整生产钢板的种类和尺寸,都需要工程师重新调整7道精轧机组的300多个参数,需要耗费约5天的时间。盘古大模型能够对最优参数进行预测,显著降低热轧生产线调优时间,并提高预测精度和钢板成材率。目前盘古大模型目前已在宝钢1880热轧生产线上线,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。此外,盘古大模型还将应用于高炉场景,对炉温、铁水温度、硅含量等炉况进行仿真,从而辅助高炉精准控制,充分利用每一分能源,降低能源成本。

重塑气象

华为云联合深圳市气象局,在分辨率为25公里的全球模型基础上,融合区域高质量气象数据集,升级了分辨率分别为1公里、3公里、5公里的区域预报能力,包含气温、降雨、风速等气象要素。不仅如此,今年华为云还联合天融环境打造了环境大模型,将污染六项的预测准确度全面提升10%以上。

重塑医药

天士力基于盘古大模型打造“数智本草大模型”。一方面基于盘古的L0基础模型,学习训练了4000多万篇文献,尤其是学习了1000多本古籍,从古方古籍和现代文献中总结出知识和经验,可以赋能方剂筛选和优化、提升研发效率,也能辅助医生问诊。另一方面,天士力在盘古17亿化合物的药物分子大模型基础上,增训了350万天然产物分子数据,未来有望更好地优化方剂和发现新药。

华为云对昇腾AI云服务进行持续优化。业界万亿参数模型训练的平均无中断时长约2.8天,昇腾AI云服务可实现40天无中断;业界平均集群故障恢复时间约60分钟,昇腾AI云服务可以缩短到10分钟,同时能将大模型的资源开通时间从月级缩短到天级,加速大模型的开发。

目前昇腾AI云服务已全面适配行业主流的100多个大模型,以云服务的方式协助客户开发,训练,托管和应用模型,打造百模千态的“黑土地”。

大模型训练推理用华为云昇腾AI云服务,澎湃算力,即开即用

华为云CTO张宇昕表示,通过全栈系统性创新,能够让大模型的数据准备、训练、推理、应用实现全流程的高效率和高性能。华为云的全栈系统性创新覆盖了数据中心、云平台架构和基础设施服务,为AI开发提供AI Native的基础设施。

当前云平台在大模型的训练和使用中通常存在“算力墙”“内存墙”“能效墙”等问题。为此,华为云打造了下一代的云基础设施CloudMatrix,改变传统数据中心的架构和算力供给模式,将传统的以CPU为中心的主从架构,演进为多元算力对等全互联架构;并通过高速互联网络协议,将CPU、NPU、GPU等算力资源全部互联和池化,从而把AI算力从单体算力演进到矩阵算力,开启智能算力新纪元。

同时,针对云平台在大模型的训练和使用中存在的“内存墙”问题,华为云正式发布EMS弹性内存存储服务,基于Memory Pooling专利技术,通过显存扩展、算力卸载、以存代算等三大手段来打破内存墙,释放极致算力。

基于新一代云基础设施和EMS弹性内存存储服务、昇腾AI云服务等创新,华为云已经在贵安、乌兰察布和芜湖,构建了三大AI算力中心CloudOcean;同时也在华北、华东、华南等热点区域部署了AI算力资源池CloudSea;还通过华为云CloudLake和CloudPond边缘云平台,将AI算力推到客户身边,提供最低时延的AI训推服务。由此,华为云打造了云、网、边、端协同的AI Native的算力平台,提供给开发者、客户和伙伴使用。

盘古大模型也是基于华为云的AI平台开发。会上,华为诺亚方舟实验室主任姚骏从数据高效、参数高效和算力高效三个方面介绍了盘古大模型5.0的训练过程。

▲华为诺亚方舟实验室主任姚骏,介绍盘古大模型5.0关键创新

同时,华为云对AI开发生产线ModelArts进行升级,在AI开发基础设施和流水线之上,构建了大模型即服务平台ModelArts Studio,提供百模千态的第三方大模型托管服务,支持对大模型定制开发,并提供相应的工具和行业集成套件,让客户可以方便地将大模型与业务系统结合。

除了系统性创新,华为云还将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合,“跳了自己的降落伞”,应用在了华为云CodeArts、DataArts、MetaStudio和GaussDB、云安全等系列云服务的智能化上。将华为云的服务重塑和升级,从而更智能、更高效。

软件开发:华为云通过结合AI Agent能力,将CodeArts软件开发生产线从单点智能升级到项目级智能,大幅提升了问题定位率和项目级问题修复成功率,让开发者能轻松实现项目级智能。

数据治理:华为云将盘古大模型和华为多年数据治理经验相结合,让不熟悉IT技术的业务人员、管理人员可以通过自然语言交互的方式,快速获取需要的数据,形成可视化的图表,直接高效地管数、用数。

数字内容生产:华为云将盘古媒体大模型和华为有着深厚积累的音视频编解码、3D模型物理仿真、图形渲染等引擎能力相结合,一起用于AI内容生成。这样生成的数字内容更符合物理世界的规律,并且可以实现任意时长的实时互动,突破了当前AIGC的局限。

数据库:华为云将产品文档、专家知识、运维经验等数据库专业数据和大模型相结合,构建盘古数据库大模型,让GaussDB数据库在开发、测试、迁移、运维等全生命周期实现智能化,显著提升开发人员和DBA的使用效率。

安全华为云打造了面向安全领域的盘古安全大模型,能够快速、精准地给出安全治理咨询的专业意见,让企业安全更加智能。

华为云是华为公司面向开发者的统一底座,目标打造昇腾、鸿蒙、鲲鹏、GaussDB、欧拉等各项根技术的生态,给广大开发者一个更优的选择。

专属开发空间:为了让开发者更好地学习和使用这些技术,华为云为每个新生态的开发者免费提供一台云主机、一套开发工具和5GB的云存储空间。

专利和科技交流社区:华为在Chaspark网站上提供了开放的专利搜索工具-查思专利,开发者可以免费查询到全球近1.9亿件专利数据,与华为共同进步与成长。

开发者布道师计划:未来3年计划发展超过3000名华为开发者布道师。

技术创新要和行业场景需紧密结合才能真正实现深耕行业,华为云派出500+技术专家深入行业,了解客户需求,解决行业难题。

张平安强调,一直以来,华为云盘古大模型都坚定地聚焦行业,在解难题、做难事的道路上不断攻坚克难,砥砺前行,重塑千行万业。华为云将与所有的客户、伙伴和开发者一起,创新不止,攀登不止,让云无处不在,让智能无所不及,加速千行万业的智能升级。

点击关注,第一时间了解华为云新鲜技术~

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐