摘要:8 月 31 日, HCDG 城市行·北京站——多模态大模型技术与场景化应用技术研讨沙龙圆满举办。

8 月 31 日,由华为云开发者联盟联合华为(北京)虚拟现实创新中心主办的“HCDG 城市行北京站——多模态大模型技术与场景化应用技术研讨沙龙”,在中关村虚拟现实产业园顺利举办。本次活动邀请到了大模型行业专家、技术专家以及优秀的企业代表进行分享,同时邀请了众多开发者到场,围绕多模态大模型技术与场景化应用展开讨论,聚焦 AI 前沿技术,重点关注人工智能的落地实践,一起探寻AI技术边界。

华为云盘古大模型 让视频制作效率提升

此次活动特别邀请到华为云视频生成大模型算法专家王博士亲临现场,专家以《多模态生成大模型技术与场景化应用》为主题,介绍了传统视频生产的流程、情况和难点,而盘古视频生成大模型主要囊括三种行业应用,包括一是自动驾驶,构建面向自动驾驶可控视频生成模型,提升长尾场景的识别效果以及场景泛化能力。二是具身智能,目标是构建具身智能任务执行视频生成模型,实现任务路径,意图预测的视频模拟。三是 3D 视频生成,通过构建工业和建筑场景的视频生成模型,从草图等设计初稿,可控生成对应的设计效果视频进而生成 3D 模型。

华为云视频生成大模型算法专家 王博士

手动实操 理论联系实际,增强感性认识

在手动实验环节,华为云开发者技术服务专家胡子琪、刘宝梁带参与的开发者们体验了 MusicGen 文本生成音乐过程,可以根据文本描述(例如“带有重鼓和合成器垫声的 80 年代驾驶流行歌曲”)生成大约 12 秒的音频。MusicGen 还可以选择性地使用参考音频进行“引导”,如现有的歌曲,在这种情况下,它将试图遵循描述和旋律。MusicGen 使用了 Transformer 架构,能够根据文本提示生成新的音乐片段。与语言模型类似,MusicGen 预测的是音乐片段的下一部分,而不是句子中的下一个字符。这使得它能够生成连贯和结构化的音乐作品。实操过程中,大家纷纷积极互动参与,收获良多。

合作伙伴登台分享,共谋产业发展新蓝海

本次沙龙有幸邀请到了中影年年 AIGC 策划总监魏瑜上台分享,主要介绍了中影年年基于华为云 MetaStudio 数字内容生成平台的应用,其中的数字人基于华为强大的算力和底座支撑,结合中影年年 5000+ 高品质数字角色进行 AI 训练,通过一张照片可快速批量生产数字人,以 AIGC 生产模式实现规模化产出。针对定制化超写实数字人,采用自动化重拓扑和空洞补齐技术,满足超写实纹理和材质,还原真实毛发和现实光影、梯度照明等多种尖端技术。此外,中影开发出智能伴学 AI 等相关产品,引领个性化学习新体验。

中影年年 AIGC 策划总监 魏瑜

一人一台云主机,开箱即用

现场开发者们还体验使用了华为开发者空间云主机。云主机预集成 CodeArts IDE、代码仓及 JDK、Python 等运行时插件,解决本地开发环境中配置复杂、稳定性不足和依赖等问题,为开发者提供性能强大、安全、稳定、高效的开发环境,以及海量的技术赋能课程与专业开发者认证内容,让开发者拥有开箱即用的可延续工作空间。

主题演讲后,在讲解员的带领下,开发者们共同参观了展厅,参观了包括智能数字生态互动缸、无标记点运动采集分析区、数字人体验区、4DVR 过山车、3D 云渲染引擎生态共性技术平台等展区项目。开发者们深入了展区项目的技术原理和应用场景,拓宽技术眼界。大家积极交流心得,分享体验感受,未来华为云 HCDG 将定期组织技术研讨会和技术体验类活动,以激发创新思维和促进技术交流为开发者们提供更好的学习交流平台。

HCDG(Huawei Cloud Developer Group 华为云开发者社区组织),是基于城市圈和技术圈,由开发者核心组自发开展的开放、创新、多元的社区技术交流组织。致力于帮助开发者学习提升、互动交流、挖掘合作,推动技术应用与本地产业结合、数智化转型和开发者文化发展。

点击关注,第一时间了解华为云新鲜技术~

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐