文章来源:英维塔 NLP大模型缺席,不赶“热点”只谈应用的华为,功夫在“山外”。 在沉寂两年后,华为云官网近期上线了盘古系列AI大模型的最新消息,同时,华为云人工智能领域首席科学家田奇于今日在人工智能大模型技术高峰论坛上介绍了盘古系列大模型的进展及其应用,一时拉高了人们对这次演讲的期待值。 恰是阿里云“通义千问”大模型公布的第二天,一时间业界也有“华为加入大模型之争”的猜测。有了期待值和预期,田奇今日的演讲是否满足了观众的好奇心呢?我们接下来会在文章中回顾华为盘古大模型的前世今生,以及华为在将盘古大模型推向公众视野的演讲中透露了哪些进展。 NLP大模型缺席,何时揭开面纱成谜 盘古大模型的历史至今也才三年时间。2020年11月,盘古大模型在华为云内部立项成功,该模型也完成了与合作伙伴、高校的合作搭建。在开始打造盘古大模型的时候,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。2021年4月,盘古大模型正式对外发布。 华为云官网更新的最新消息显示,华为即将上线的“盘古系列AI大模型”分别为NLP 大模型、CV大模型、科学计算大模型(气象大模型)。国盛证券近期发布的研报中表示,盘古 NLP 大模型是业界首个千亿参数的中文预训练大模型;盘古CV大模型是业界最大 CV 大模型、首次实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上处于业界第一;盘古气象大模型则可提供秒级天气预报,可应用于气象、生物医药等领域。 但在会上,田奇对于NLP大模型仅用一句话带过其应用进展,他表示盘古NLP大模型目前覆盖的智能文档检索、智能 ERP、小语种大模型等落地领域,2022年华为刚交付了一个阿拉伯语的千亿参数大模型。半小时的演讲听下来像做了一套盘古大模型的面试介绍或者入职第一个月的职业规划,让人感觉“能摸到头脑,但是不多”。有网友对没有盘古大模型的演示表达了强烈的不满,但既然演讲中NLP大模型并非主角,那行业大模型当场演示确实有些强人所难。也有网友吐槽“都是些之前老的to B的东西重新拿出来简单介绍了一下”。 作为盘古系列大模型中最受关注的大模型,与ChatGPT等外国同类AI模型相比,盘古NLP大模型更注重针对中文语言的优化,该模型采用了深度学习和自然语言处理技术,并使用了大量的中文语料库进行训练。在应用方面,盘古大模型可以应用于智能客服、机器翻译、语音识别等多个领域,提供AI技术支持。 从参数与数据堆量来看,百度大模型的参数为100亿,而GPT-3达到了1750亿,GPT-4尚不明确。根据前段时间华为发表的论文数据判断,华为PanGu-Σ大模型参数最多为1.085万亿,基于华为自研的MindSpore框架开发。PanGu-Σ大模型在对话方面,回答更贴近主题,也更准确。在参数角度,盘古大模型可能已经接近 GPT-3.5 的水平。 文章来源:英维塔 转载声明: 本文为转载发布,仅代表原作者或原平台观点或立场,不代表我方观点。亚太菁英传媒及旗下澳洲门户网(ozportal.tv)仅提供信息发布平台,文章或有适当删改。对转载有异议和删稿要求的原著方,可联络info@ozportal.tv。 |