您当前的位置:首页 >> 设计动态

通义千问720亿参数模型宣布开源,部分性能胜过闭源GPT-4

2024-02-05 12:17:44

新浪网科技讯 12月1日早晨死讯,阿里云记事千问720亿变量数学方法Qwen-72B如今宣布源代码。该数学方法基于3T tokens提高效率数据训练,在10个权威基准系统设计里夺得源代码数学方法最优成绩,在大多系统设计里胜过闭源GPT-3.5和GPT-4。

在直译任务上,Qwen-72B在MMLU基准测试拿到源代码数学方法最高分;里文任务上,Qwen-72B在C-Eval、CMMLU、GaokaoBench等基准得分胜过GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH系统设计里断层式反超其他源代码数学方法;标识符明白方面,Qwen-72B在HumanEval、MBPP等系统设计里的观感逐年提高,标识符能力有了质的洗练。

据介绍,Qwen-72B可以处理方式多于32k的长文档回传,在长文档明白测试集LEval上拿到了胜过ChatGPT-3.5-16k的特性。研发团队建模了Qwen-72B的指令遵循、辅助工具使用等技能,使之能更好;也里下游应用集成。比如,Qwen-72B改装成了强大的系统指令(System Prompt)能力,其他用户先用一句提示该词就可定制AI帮手,要求大数学方法扮演某个剧情或者执行特定的完全恢复任务。

随着Qwen-72B的源代码,记事千问还源代码了18亿变量数学方法Qwen-1.8B和扬声器大数学方法Qwen-Audio。至此,记事千问合共源代码18亿、70亿、140亿、720亿变量的4款大母语数学方法,以及感知明白、扬声器明白两款多蕴涵大数学方法。(文猛)

新冠复阳后吃什么药好得快
胃反酸可以吃金奥康吗
怎么治疗类风湿
骨质疏松的治疗
经常腹泻该怎么治疗
相关阅读
友情链接