7月7日,在华为开发者大会 2023 上,华为云盘古大模型3.0亮相。
华为常务董事、华为云CEO张平安介绍道,华为云盘古大模型3.0是一个完全面向行业的大模型系列,包括“5+N+X”三层架构:L0层的基础大模型、L1层行业大模型以及L2层场景模型。
(资料图片)
L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。盘古3.0为客户提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。
L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。
L2层为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。
张平安表示盘古大模型3.0“不做诗只做事”,将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,为行业客户、伙伴及开发者提供更好的服务。据介绍,盘古大模型已在金融、制造、医药研发、煤矿、铁路、气象等诸多行业发挥巨大价值。
在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够精准理解民众咨询意图,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言。盘古政务大模型对超过20万条政务数据进行精调,包括12345热线、政策文件、政务百科等,掌握了丰富的法律法规、办事流程等行业知识。基于盘古政务大模型的小福,在一网通办业务中体现出行业性、专业性、领先性和惠民性。
在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以极大地减少安全事故。
据公开资料,华为盘古系列基础大模型于2021发布,包括NLP、CV和科学计算大模三大基础大模型,后续发布了矿山、药物分子、气象、海浪等行业大模型;2022年4月升级到2.0版本,发布层次化开发方案 ( LO, L1,L2) ,打造工业级盘古大模型。
据了解,基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore,AI开发生产线ModelArts等,为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。
众所周知算力是训练大模型的基础。在本次大会上,张平安宣布单集群2000PFlops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾AI云服务除了支持华为全场景AI框架昇思MindSpore外,还支持Pytorch、Tensorflow等主流AI框架。同时,这些框架中90%的算子,都可以通过华为端到端的迁移工具平滑迁移到昇腾平台。