新经济视界|国产大模型加速迭代 性能逼近甚至赶超GPT-4 鍥戒骇澶фā鍨嬪拰gpt4瀵规瘮 鎴戝浗澶фā鍨嬩笌gpt4鐨勫樊璺濇湁澶氬ぇ
admin
2024-05-09 13:58:51
0

来源:封面新闻


封面新闻记者 欧阳宏宇

继文心、星火之后,又一中国造大模型性能赶超GPT-4。

5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo。据阿里云智能集团首席技术官周靖人介绍,在中文语境下,文本理解、文本生成、问答建议、闲聊对话和安全风险等多项能力上赶超GPT-4。

据了解,相比通义千问2.1版本,通义千问2.5在理解能力、逻辑推理、指令遵循、代码能力上均得到提升。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo。同时,通义千问最新开源的1100亿参数模型在多个基准测评,超越Meta的Llama-3-70B。

国产大模型技术爆发一年多,在全球范围内也从曾经的追赶者到如今的并行者甚至引领者。清华大学基础模型研究中心联合中关村实验室在上月底发布的报告显示,在语义理解、阅读理解等能力上,文心一言4.0已超过GPT-4 Turbo。科大讯飞也在今年初透露,讯飞星火V3.5整体已经接近GPT-4水平,尤其在数学、语言理解、语音交互能力超过GPT-4 Turbo。

在大模型投入上,中国的大模型公司取得重大突破,背后是基于各种预训练模型框架和开源项目,各种模型如雨后春笋般诞生。不过,在业内人士看来,和国外大模型相比,国内的大模型发展起步晚一些。加上高性能算力的限制和数据质量的差距等,国内研发的大模型无论规模还是核心能力,与世界先进水平还存在一年左右的差距。

据上海人工智能实验室评测,虽然国产大模型在中文场景下国内最新的大模型已展现出独特优势,尤其在语言、知识维度上接近GPT-4 Turbo的水平;但在金融、工业等要求可靠的场景落地需要的关键能力上相比于GPT-4还存在差距。

“国内大模型要整体赶超GPT-4 Turbo等国际顶尖的大模型,在复杂推理、可靠地解决复杂问题等方面,仍需下大功夫。”上海人工智能实验室领军科学家林达华指出,这关系到落地应用时大模型的可靠性,比如,随着大模型进入商用,在金融场景下若要分析公司财报,甚至是工业领域分析技术文档,数学等方面的计算能力就会成为一个壁垒。

相关内容

热门资讯

【看表情包学Linux】进程地...   🤣 爆笑教程 👉 《看表情包学Linux》👈 猛...
育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
编译原理陈火旺版第三章课后题答... 下面答案仅供参考! 1.编写一个对于 Pascal 源程序的预处理程序。该程序的作用是...
MacBookPro M2芯片... MacBookPro M2芯片下如何搭建React-Native环境目录软件下载环境配置 目录 写在...
Android studio ... 解决 Android studio 出现“The emulator process for AVD ...
pyflink学习笔记(六):... 在pyflink学习笔记(一)中简单介绍了table-sql的窗口函数,下面简单介绍下...
创建deployment 创建deployment服务编排-DeploymentDeployment工作负载均衡器介绍Depl...
gma 1.1.4 (2023... 新增   1、地图工具    a. 增加【GetWorldDEMDataSet】。提供了一套 GEO...
AI专业教您保姆级在暗影精灵8... 目录 一、Stable Diffusion介绍    二、Stable Diffusion环境搭建 ...
vue笔记 第一个Vue应用 Document{{content}}{{...
Unity自带类 --- Ti... 1.在Unity中,自己写的类(脚本)的名字不能与Unit...
托福口语21天——day5 发... 目录 一、连读纠音 二、语料输入+造句输出 三、真题 一、连读纠音 英语中的连读方式有好几种...
五、排序与分页 一、排序 1、语法 ORDER BY 字段 ASC | DESC ASC(ascen...
Linux系统中如何安装软件 文章目录一、rpm包安装方式步骤:二、deb包安装方式步骤:三、tar....
开荒手册4——Related ... 0 写在前面 最早读文献的时候,每每看到related work部分都会选择性的忽略&...
实验01:吃鸡蛋问题 1.实验目的: 通过实验理解算法的概念、算法的表示、算法的时间复杂度和空间复杂度分析&...
8个免费图片/照片压缩工具帮您... 继续查看一些最好的图像压缩工具,以提升用户体验和存储空间以及网站使用支持。 无数图像压...
Spring Cloud Al... 前言 本文小新为大家带来 Sentinel控制台规则配置 相关知识,具体内容包括流控...
多项目同时进行,如何做好进度管... 多项目同时进行,如何做好进度管理? 大多数时候,面对项目进...
ATTCK红队评估实战靶场(二... 前言 第二个靶机来喽,地址:vulunstack 环境配置 大喊一声我...