腾讯发布超千亿参数规模的混元大模型

2023-09-07 13:01:29夏侯邦舒
导读 【网盟资讯】9月7日消息,2023年以来,全球AI大模型持续升温,中国尤其掀起了一场激烈的“千模大战”,各大科技巨头争相投入研发。在今日举...

【网盟资讯】9月7日消息,2023年以来,全球AI大模型持续升温,中国尤其掀起了一场激烈的“千模大战”,各大科技巨头争相投入研发。在今日举行的2023腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生正式发布了备受瞩目的腾讯混元大模型。

腾讯混元大模型,作为腾讯自主研发的全链路大语言模型,其庞大的参数规模超过千亿,预训练语料更是高达2万亿tokens(大语言模型文本单位)。这一大模型不仅具备出色的中文创作能力,还在任务执行和复杂语境下的逻辑推理方面表现出色。

根据ITBEAR科技资讯了解,腾讯混元大模型已在腾讯内部多个业务和产品中进行了广泛测试,包括腾讯云、腾讯广告以及微信搜一搜等领域。同时,它也为不同产业场景提供了服务,客户可以基于API调用混元,也可以根据自身需求构建专属的行业大模型。

这一大模型在处理超长文本时表现出色,通过位置编码的优化,大大提升了对长文本的处理效率和性能,同时结合指令跟随的优化,使生成的内容更符合字数要求。

值得一提的是,腾讯混元大模型还具备识别“陷阱”的能力,通过强化学习方法,能够拒绝回答那些难以回答或无法回答的问题,特别是在涉及安全诱导类问题时,拒答率提高了20%。

另外,微信已经上线了“腾讯混元”公众号和“腾讯混元助手”小程序。尽管“腾讯混元助手”小程序目前仍处于内测阶段,只有受邀用户可以体验,但它被设计成一款智能对话的助手,可以回答各种问题,同时还能处理各种任务,如知识获取、数学问题解决、翻译、提供旅游攻略和职业建议等。这一举措将为用户提供更丰富的AI应用体验。

免责声明:本文由用户上传,如有侵权请联系删除!