国产大模型:今天起,我们100万tokens只需1元! 一百多国产模型 tokens大模型
admin
2024-05-14 22:18:30
0

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

昨天刚刚在顶会ICLR作为特邀演讲(Invited Talk)中“国内唯一”的大模型玩家智谱AI,今天又放出了一个好消息:

现在我家的大模型开放平台,1元=1000000 tokens!



具体而言,这次价格调整的对象,是智谱AI的GLM-3-Turbo

之前:0.005元 / 千tokens现在:0.001元 / 千tokens

换算一下,就是1元=1000000tokens;而同样是百万tokens,ChatGPT的价格是这样的:



什么概念呢?

相当于花1元钱就能写1万条小红书(以350字计算)。

这个大动作,一下子就让智谱AI成为入门级里最便宜的那一个;而且它还特别提供用户tokens优惠计划:

开放平台新注册用户获赠从500万tokens提升至2500万tokens(包含2000万GLM3-Turbo和500万GLM4)。

除此之外,GLM-3 Turbo Batch批处理API进一步便宜50%——0.0005/千 tokens。



值得一提的是,这不是智谱AI第一次对价格进行调整。

早在去年10月份,它就面向开发者把调用API的价格砍掉了一个数量级。

不过有一说一,如果说大模型是AIGC时代的“商品”,那么性价比必然是一个硬指标。

所以智谱AI,用起来又如何呢?

价格便宜了,能力还上去了

没错,除了价格调整的消息之外,智谱AI官方还表示:

包括GLM-3 Turbo在内的GLM系列将迎来更新,正在部分开放测试中,即将和广大开发者和应用者见面。



至于目前的效果,我们在智谱AI大模型MaaS开放平台便可以直接体验一番。

例如在“体验中心”,我们可以先将模型设置为GLM-3-Turbo,然后问它一个专业且复杂的问题:

请你作为一名经济学的资深教授,帮助我解决一些写论文问题。我是一名经济学的学生,我想写一篇论文方向是人工智能与经济学的论文,但我不知道具体的选题方向。你能结合研究热点,给我一些有思想有深度、提供新知的选题吗? 请注意,你的回答禁止出现经济学、人工智能与经济学等词语。



不难看出,在特定领域中,GLM-3-Turbo的能力是可以做到合格上岗。

而这在智谱AI大模型MaaS开放平台还只是“开胃菜”一般的存在,主打的就是一个方方面面

多模态大模型GLM-4就是其中之一,他可以在不牺牲任何NLP任务性能的情况下,实现视觉语言特征的深度融合。

并且已经在10余个国际标准图文评测数据集上取得SOTA。

多模态理解方面,GLM-4可以看复杂图片并回答做多种视觉问题:



代码能力方面,也可以让它用Python画一个爱心:



烧“脑”的逻辑推理也不在话下:



而具体到性能指标,打开方式是这样的:

在上海人工智能实验室发布的大模型开源开放评测体系司南(OpenCompass 2.0)中,GLM-4 综合排名第二,仅次于GPT-4 Turbo 。在清华SuperBench大模型综合能力评测框架中,GLM-4与国际一流模型水平接近。

除了通用大模型之外,智谱AI的开放平台还提供术业有专攻的大模型的能力。

例如用户可以调用第二代CodeGeeX代码大模型,作为一个AI编程助手,可以实现代码生成与补全、注释生成、代码翻译等任务:



更高阶的能力,比如在IDE里针对具体代码做问答,CodeGeeX代码大模型也是可以实现:



在图像生成领域,智谱AI的开放平台在未来还将提供了CogView模型的API。

用户不仅可以用简单的自然语言Prompt来生成高质量图片:



还可以对特定图片进行“以文改图”



除了在上述大方面的能力之外,智谱AI的开放平台在细节上针对“定制化”和“本地化”也是下足了功夫。

提供了可以完成用户意图理解、复杂指令规划以及自由调用GLM生态中多种模型能力的工具集。



不过最重要的一点是,智谱AI的开放平台在操作上也是极其的简单——就是调用一个API的事儿。



大模型,开始卷“普惠”

从上述种种能力和操作上的展示来看,智谱AI正在释放一种大模型要“卷”的新信号——普惠

首先,最为直接的就是价格调整策略。

普惠的一个前提就是调用API的价格要做到够亲民,唯有如此才能够把市场打出去;这一点在国外大模型玩家们博弈过程中便有过体现。

在法国Mistral AI推出Mistral Large之际,它便用比GPT-4更便宜的API接口价格的“姿势”入局,在大模型性价比上给了OpenAI不小的冲击。

加上微软当时还入股了Mistral AI,不仅给钱还给算力,一度被传为“微软钦点的OpenAI备胎”。

聚焦国内,正如我们刚才提到的,智谱AI在去年10月便已经调整过一次价格,而就在上个月,阿里云也官宣核心产品大规模调整,为的也是提升市场的渗透率。

是颇有一种“得市场者得天下”的感觉了,而且就目前使用情况来看,也是得到了市场不小的认可。

据智谱AI官方数据显示:

截止目前,用户数有数十万的企业和开发者,并且在持续快速增长,过去的半年每日tokens消耗增长超过一百倍。
官方开发的三个调用工具,网页检索、函数调用以及知识库,自从 1 月上线以来调用次数已经超过3亿次。

对此,“红衣大叔”周鸿祎也给出了他的评价:



其次,在卷价格的背后,还需得有实力上的底气,毕竟对于性价比这事,“性”字是在排在“价”字之前的,只有好用才会有人买账。

在这一方面,讲真,智谱AI也是有够卷的;单是从今年的发展进程来看,智谱AI在大模型上的新研究、新进展就没有停过。

先后在 LLM、多模态、长文本、对齐、评测、推理加速、Agent 等大模型的方方面面都做出了诸多成果:

2月6日:发布让多模态模型具有操作链的CogCOM3月8日:发布更快、更精细的文生图模型CogView33月30日:提出了Pre-training Loss作为语言模型“涌现能力”的指标4月3日:在 GLM-4 中融入了RLHF技术4月4日:提出自动网页导航的Agent,AutoWebGLM

不仅如此,就在昨天ICLR 2024的特邀演讲环节中,智谱AI针对通往AGI的道路规划,也亮出了自己的“三步走”——分别是发布GLM-4.5、引入GLM-OS以及GLM-zero。

总而言之,现在大模型公司要卷的不能再只是技术实力了,市场占有率、价格等因素也逐渐成为了关键的考量因素,由此方可形成普惠的一个闭环:

大模型需要用户的使用→得到反馈后优化→性能和收益的增长可让大模型更优惠→再吸引更多人来用。

不过有一说一,大模型们开始卷谁更“快、好、省”,用户们是真的赚到了。

相关内容

热门资讯

【看表情包学Linux】进程地...   🤣 爆笑教程 👉 《看表情包学Linux》👈 猛...
育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
编译原理陈火旺版第三章课后题答... 下面答案仅供参考! 1.编写一个对于 Pascal 源程序的预处理程序。该程序的作用是...
MacBookPro M2芯片... MacBookPro M2芯片下如何搭建React-Native环境目录软件下载环境配置 目录 写在...
Android studio ... 解决 Android studio 出现“The emulator process for AVD ...
pyflink学习笔记(六):... 在pyflink学习笔记(一)中简单介绍了table-sql的窗口函数,下面简单介绍下...
创建deployment 创建deployment服务编排-DeploymentDeployment工作负载均衡器介绍Depl...
gma 1.1.4 (2023... 新增   1、地图工具    a. 增加【GetWorldDEMDataSet】。提供了一套 GEO...
AI专业教您保姆级在暗影精灵8... 目录 一、Stable Diffusion介绍    二、Stable Diffusion环境搭建 ...
vue笔记 第一个Vue应用 Document{{content}}{{...
Unity自带类 --- Ti... 1.在Unity中,自己写的类(脚本)的名字不能与Unit...
托福口语21天——day5 发... 目录 一、连读纠音 二、语料输入+造句输出 三、真题 一、连读纠音 英语中的连读方式有好几种...
五、排序与分页 一、排序 1、语法 ORDER BY 字段 ASC | DESC ASC(ascen...
Linux系统中如何安装软件 文章目录一、rpm包安装方式步骤:二、deb包安装方式步骤:三、tar....
开荒手册4——Related ... 0 写在前面 最早读文献的时候,每每看到related work部分都会选择性的忽略&...
实验01:吃鸡蛋问题 1.实验目的: 通过实验理解算法的概念、算法的表示、算法的时间复杂度和空间复杂度分析&...
8个免费图片/照片压缩工具帮您... 继续查看一些最好的图像压缩工具,以提升用户体验和存储空间以及网站使用支持。 无数图像压...
Spring Cloud Al... 前言 本文小新为大家带来 Sentinel控制台规则配置 相关知识,具体内容包括流控...
多项目同时进行,如何做好进度管... 多项目同时进行,如何做好进度管理? 大多数时候,面对项目进...
ATTCK红队评估实战靶场(二... 前言 第二个靶机来喽,地址:vulunstack 环境配置 大喊一声我...