手把手教你炼大模型第2讲：大规模语言模型并行训练系统和算法

ChatGPT为代表的大语言模型为通用人工智能带来了曙光，然而，近年来模型参数量的增加速度远超集群规模和AI芯片的容量增长速度，带来了需求和算力的不匹配。利用有限的集群高效训练大型语言模型，是一个综合性的工程问题，往往涉及模型、并行算法、优化等的综合配合。本期第二讲的主题为：大规模语言模型并行训练系统和算法，任晓哲老师将综合介绍大规模语言模型训练的常见系统级和算法级技术，并通过最新的进展探讨未来

华为云开发者联盟

7人浏览 · 2024-10-29 16:21:41

华为云开发者联盟 · 2024-10-29 16:21:41 发布

ChatGPT为代表的大语言模型为通用人工智能带来了曙光，然而，近年来模型参数量的增加速度远超集群规模和AI芯片的容量增长速度，带来了需求和算力的不匹配。利用有限的集群高效训练大型语言模型，是一个综合性的工程问题，往往涉及模型、并行算法、优化等的综合配合。

本期第二讲的主题为：大规模语言模型并行训练系统和算法，任晓哲老师将综合介绍大规模语言模型训练的常见系统级和算法级技术，并通过最新的进展探讨未来发展的可能。

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

cover

GaussDB高智能--自治运维技术（下）

华为开发者空间

cover

【FAQ】HarmonyOS SDK 闭源开放能力 —Push Kit（4）

华为开发者空间

cover

资源利用率提高30%，揭秘华为云Serverless高效、高密度调度优化原理

华为开发者空间

所有评论(0)

查看更多评论