11月5日消息,腾讯腾讯今日宣布推出业界参数规模最大、发布效果最好的开源开源MoE大语言模型Hunyuan-Large。
Huanyuan-large模型的模型总参数量为389B、激活参数为52B、腾讯训练token数量为7T、发布最大上下文长度为256K、开源词表大小为12.8w。模型
在技术创新方面,腾讯Hunyuan-large通过高质量的发布合成数据来增强模型训练,弥补了自然数据的开源不足。
其中,模型该模型预训练支持处理高达256K的腾讯文本序列,大幅提升了长文本上下文的发布处理能力,能够更高效地完成长文本任务。开源
据了解,Hunyuan-large在CMMLU、MMLU、CEva1、MATH等多学科综合评测集上表现优异,在中英文自然语言处理、代码生成、数学运算等9大能力维度中全面领先,超越了Llama3.1和Mixtral等一流开源模型。
此外,腾讯还宣布将推出自研的长文评测集“企鹅卷轴(PenguinScrolls)”,以填补行业在真实长文评测集上的空白。
企鹅卷轴基于公开的金融、法律、学术论文等长文本构建,文本长度从1K到128K不等,覆盖深度阅读理解和长文推理任务。
顶: 161踩: 9
腾讯发布开源MoE大语言模型Hunyuan
人参与 | 时间:2024-12-26 23:01:13
相关文章
- 一加Ace 5系列今天发 李杰:尽最大努力给到满意价格
- 《丧尸围城 豪华复刻版》正式发售 steam综合评价“多半好评”
- 策略游戏《The House of Hamelin》Steam页面开放 不支持中文
- 蹇韬:最大的梦想是进国家队 一个球队在赛季中遇到挫折很正常
- 10年狂赚2.4亿!欧洲新贵崛起:意甲第1欧冠前16,冲击3冠
- 马雷斯卡:切尔西值得更多,大部分时间我们都掌控了比赛
- [流言板]俊男靓女!国王老板女儿安佳丽IG晒和兰姆亲密合照官宣恋情
- 离谱罗马诺:特朗普胜选HWG!皇马球迷:他能打右后卫吗
- iPhone 17错失最先进的2nm制程:台积电明年就要量产
- 决定冠军+降级的补赛?海港补赛2
评论专区