新经济视界|国产大模型加速迭代 性能逼近甚至赶超GPT-4 鍥戒骇澶фā鍨嬪拰gpt4瀵规瘮 鎴戝浗澶фā鍨嬩笌gpt4鐨勫樊璺濇湁澶氬ぇ
admin
2024-05-09 13:58:51
0

来源:封面新闻


封面新闻记者 欧阳宏宇

继文心、星火之后,又一中国造大模型性能赶超GPT-4。

5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo。据阿里云智能集团首席技术官周靖人介绍,在中文语境下,文本理解、文本生成、问答建议、闲聊对话和安全风险等多项能力上赶超GPT-4。

据了解,相比通义千问2.1版本,通义千问2.5在理解能力、逻辑推理、指令遵循、代码能力上均得到提升。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo。同时,通义千问最新开源的1100亿参数模型在多个基准测评,超越Meta的Llama-3-70B。

国产大模型技术爆发一年多,在全球范围内也从曾经的追赶者到如今的并行者甚至引领者。清华大学基础模型研究中心联合中关村实验室在上月底发布的报告显示,在语义理解、阅读理解等能力上,文心一言4.0已超过GPT-4 Turbo。科大讯飞也在今年初透露,讯飞星火V3.5整体已经接近GPT-4水平,尤其在数学、语言理解、语音交互能力超过GPT-4 Turbo。

在大模型投入上,中国的大模型公司取得重大突破,背后是基于各种预训练模型框架和开源项目,各种模型如雨后春笋般诞生。不过,在业内人士看来,和国外大模型相比,国内的大模型发展起步晚一些。加上高性能算力的限制和数据质量的差距等,国内研发的大模型无论规模还是核心能力,与世界先进水平还存在一年左右的差距。

据上海人工智能实验室评测,虽然国产大模型在中文场景下国内最新的大模型已展现出独特优势,尤其在语言、知识维度上接近GPT-4 Turbo的水平;但在金融、工业等要求可靠的场景落地需要的关键能力上相比于GPT-4还存在差距。

“国内大模型要整体赶超GPT-4 Turbo等国际顶尖的大模型,在复杂推理、可靠地解决复杂问题等方面,仍需下大功夫。”上海人工智能实验室领军科学家林达华指出,这关系到落地应用时大模型的可靠性,比如,随着大模型进入商用,在金融场景下若要分析公司财报,甚至是工业领域分析技术文档,数学等方面的计算能力就会成为一个壁垒。

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
JAVA多线程知识整理 Java多线程基础 线程的创建和启动 继承Thread类来创建并启动 自定义Thread类的子类&#...
【洛谷 P1090】[NOIP... [NOIP2004 提高组] 合并果子 / [USACO06NOV] Fence Repair G ...
国民技术LPUART介绍 低功耗通用异步接收器(LPUART) 简介 低功耗通用异步收发器...
城乡供水一体化平台-助力乡村振... 城乡供水一体化管理系统建设方案 城乡供水一体化管理系统是运用云计算、大数据等信息化手段࿰...
程序的循环结构和random库...   第三个参数就是步长     引入文件时记得指明字符格式,否则读入不了 ...
中国版ChatGPT在哪些方面... 目录 一、中国巨大的市场需求 二、中国企业加速创新 三、中国的人工智能发展 四、企业愿景的推进 五、...
报名开启 | 共赴一场 Flu... 2023 年 1 月 25 日,Flutter Forward 大会在肯尼亚首都内罗毕...
汇编00-MASM 和 Vis... Qt源码解析 索引 汇编逆向--- MASM 和 Visual Studio入门 前提知识ÿ...
【简陋Web应用3】实现人脸比... 文章目录🍉 前情提要🌷 效果演示🥝 实现过程1. u...
前缀和与对数器与二分法 1. 前缀和 假设有一个数组,我们想大量频繁的去访问L到R这个区间的和,...
windows安装JDK步骤 一、 下载JDK安装包 下载地址:https://www.oracle.com/jav...
分治法实现合并排序(归并排序)... 🎊【数据结构与算法】专题正在持续更新中,各种数据结构的创建原理与运用✨...
在linux上安装配置node... 目录前言1,关于nodejs2,配置环境变量3,总结 前言...
Linux学习之端口、网络协议... 端口:设备与外界通讯交流的出口 网络协议:   网络协议是指计算机通信网...
Linux内核进程管理并发同步... 并发同步并发 是指在某一时间段内能够处理多个任务的能力,而 并行 是指同一时间能够处理...
opencv学习-HOG LO... 目录1. HOG(Histogram of Oriented Gradients,方向梯度直方图)1...
EEG微状态的功能意义 导读大脑的瞬时全局功能状态反映在其电场结构上。聚类分析方法一致地提取了四种头表面脑电场结构ÿ...
【Unity 手写PBR】Bu... 写在前面 前期积累: GAMES101作业7提高-实现微表面模型你需要了解的知识 【技...