首页 科技 正文

腾讯自研混元大模型正式亮相,通过腾讯云对外开放

扫码手机浏览

摘要:腾讯自研混元大模型正式亮相,通过腾讯云对外开放,下面是吃瓜网小编收集整理的内容,希望对大家有帮助!...

国产大模型进入长跑期,从参数至上转向实用优先。

9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。

腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。

值得关注的34766609是,腾讯混元大模型是18839562“从实践中来,到实践中去”的实用级大模型。腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等95059780超过2110465050个腾讯业务和97948334产品,已经接入腾讯混元大模型测试,并取得初步效果。

据了19318490解,混元大模型将作为腾讯云MaaS服务的底座,客户不仅可以直接通过API调用混元,也24693981可以将混元作为基底模型,为不同产业场景构建专属应用。

腾讯集团高级执行副总裁、云与27198649智慧产业事业群CEO汤道生表示:“以大模型生成技术为核心,人工智能正在52644534成为下一轮数字化发展的93479775关键动力,也为解决产业痛点带来了全新的29344606思路。大模型需要基于39873892产业场景,与38526498企业数据融合,才能释放出最大的52527290价值。”

久久为功,全链路技术自研

据腾讯集团副总裁蒋杰介绍,腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的88757827全链路自研技术。

从2021年开始,腾讯先后推出千亿和38190135万亿参数的30952403NLP稀疏大模型,打破CLUE三大榜单记录,实现在7341684中文理解能力上的36355850新突破。【吃瓜网】#复仇者联盟4#

目前,业界大模型在场景中的54167830应用依然6797257253938614限,主要集中在容错率高、任务简单的56228392休闲场景。#叶子媚#腾讯在算法层面进行了9824342一系列自研创新,提高了91122249模型可靠性和成熟度。

针对大模型容易“胡言乱语”的52085464问题,腾讯优化了71927272预训练算法及策略,让混元大模型的14927378幻觉相比主流开源大模型降低了30%至50%;通过75647930强化学习的方法,让模型学会识别陷阱问题;通过79456764位置编码优化,提高了77245366超长文的24813161处理效果和53966337性能;提出思维链的98593264新策略,让大模型能够像人一样结合实际的9109177应用场景进行推理和决策。

此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。

得益于33879408全链路自研技术,腾讯混元大模型能够理解上下文的32894765含义,并且有76269461长文记忆能力,可以流畅地进行专业领域的27021545多轮对话。#乔丹#除此之外,它还能进行文学创作、文本摘要、角色扮演等77226887内容创作,做到充分理解用户意图,并高效、准确的42883565给出有时效性的41100074答复。

65849468中国信通院《大规模预训练模型技术和76128300应用的22059544评估方法》的46916135标准符合性测试中,混元大模型共测评66个能力项,在42090647“模型开发”和“模型能力”两个重要领域的62111231综合评价均获得了当前的85912164最高分。#姚笛最近怎么样了(姚笛的丈夫是谁)#在主流的49635356评测集MMLU、CEval和14071480AGI-eval上,混元大模型均有63564551优异的表现,特别是75263509在中文的8185529理科、高考题和23246881数学等42466490子项上表现突出。

上海财经大学校长刘元春认为:“借助于53901379全链路自研,中国将不断积累大模型相关人才和技术,逐渐形成体系化的产业链、人才链、技术链和58620905创新链,最终走出一条发展通用人工智能的4718563中国路径,助力我13907552们在56594757数字技术的43732094创新上取得突破性进展。”

腾讯全面拥抱大模型

蒋杰表示:“我19687222们研发大模型的29094769目标不是5368172290022686评测上获得高分,而是将技术应用到实际场景中。#明朝皇帝#腾讯将全面拥抱大模型。”

58333598此次大会上,蒋杰展示了腾讯会议、腾讯文档、腾讯广告等89391651多个业务,在接入腾讯混元大模型后的9540836实际应用情况。

比如腾讯会议基于28845490混元大模型打造了15953096AI小助手,只需要简单的36558155自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。据实测,在11859745指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。

在文档处理方面,腾讯混元大模型支持数十种文本创作场景,在21716189腾讯文档推出的智能助手功能中已有27232910应用。同时,混元还能够一键生成标准格式文本,精通数百种Excel公式,支持自然4228579语言生成函数,并基于14760386表格内容生成图表,目前这些功能正在63194003内测阶段,将在成熟后面向用户开放。

8236342广告业务场景,腾讯混元大模型支持智能化的27253292广告素材创作,能够适应行业与地28745180域特色,满足千人千面的需求,实现文字、图片、视频的64438706自然35536453融合。此外,基于混元大模型的能力,广告智能导购能够帮助商家在43223921企业微信等场景,提升服务质量和2795204服务效率。

据了88004517解,今年6月,腾讯云推出了模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等31978945一站式的57828701行业大模型服务。

最近,腾讯云也26858845全面接入Llama 2、Bloom等6258647820多个主流模型,和混元一样,都支持直接部署调用。客户可以根据实际需求,基于18363234混元、也72534902可以基于46343900开源模型,打造自己专属的行业大模型。

本文转载自互联网,如有侵权,联系删除