2024年的百度大模型,离「钱」越来越近 2024年的百度大模型,离「钱」越来越近
admin
2024-03-23 19:19:57
0


大模型谈钱,不寒碜。

前些日子朱啸虎和杨植麟的隔空对话,代表了技术派和市场派的两种观点。朱啸虎不看好大模型创业,认为现阶段大模型公司缺乏场景和数据,估值过高,且面临开源模型的竞争,投资风险大。他更倾向于投资能快速商业化、变现的应用层项目。

杨植麟坚定看好大模型创业,认为这是未来十年唯一有意义的事,并将其视为一个结合科学、工程和商业的系统,需要长期投入和坚持,最终目标是实现AGl。

虽然两者观点看起来针锋相对,但有一点并不冲突,不论是在通向AGI的过程中“沿途下蛋”,还是现在就投资能看到产出的大模型应用公司,今年大模型的商业化,一定是离钱越来越近。

若论国内对大模型商业化最热衷的企业,百度一定是其中之一。据此前报道,2024年百度创始人李彦宏在百度智能云方向的OKR就是,跑通以大模型为核心智能云发展路径,并且在收入和利润方面都有要求。

百度智能云是百度AI能力的输出口,海外市场大模型与云服务结合得比国内更紧密,这也是百度智能云希望努力的方向。

3月21日,百度智能云千帆大模型平台就一口气发布了5款新模型,包括3个轻量级大模型、2个垂直场景大模型,并且千帆ModelBuilder以千帆AppBuilder也同步升级。钛媒体App了解到,百度后续还将发布大模型应用产品,譬如销售、客服、办公等产品。

可以说,目前百度大模型商业化只有一条主线,让尽可能多的一部分人先用大模型,由此改变自己的产品和面向客户的服务。

大模型落地“值不值”

初期大模型的火热,未必能转化为实实在在的订单,在大模型技术和产业的高速发展期,有些厂商已经被历史的车轮碾过,但却丝毫不起一丝波澜。

“惨烈,我觉得是很惨烈,从去年到现在有很多基础模型厂商参与到市场竞争,也有很多的企业资金链受到了一些挑战,也反映出新技术发展过程中的一些矛盾。”百度智能云AI与大数据平台总经理忻舟说道。

这其中一个很重要的因素,就是大模型供需之间的错位,大量企业没有掏出真金白银,而是处在观望阶段。从企业使用大模型的角度,主要关注三个因素,一是效果好不好,二是成本是否足够低,三是效率,因此多数企业并不关心大模型或者小模型,只会结合自己的预期评估大模型落地到自己的场景“值不值”。

百度也提出了自己“效价比”的理念,除了极少的大客户对大模型有极致的效果追求,更多的企业和机构往往要综合考量大模型的使用效果、性能以及成本,即“效价比”


面向大模型如何落地,业内想了各种各样的技术方法,比如RAG、插件、MoE、小型化、大小协同等等各种各样的问题,轻量级模型就是公认的“效价比”突出的方案。

“业界也逐渐形成一个共识,模型不见得是参数规模越大越好。在很多实际的场景当中,用小尺寸的专家模型也能够达到我们通用大模型的效果,小尺寸专家模型的推理成本会更低,更便宜。”百度副总裁谢广军表示。

他还提到,本次发布的三款模型都是开发专家模型的基座模型,主要面向两个场景:一是客户、合作伙伴结合自己的数据,去做垂类场景模型。二是百度也会基于这些小的基座模型,去开发第一方的行业垂类场景模型,比如做教育行业的教辅答题和解题,可以用一个小尺寸的模型加上一些数据,精调出一个效果很好的解题助手模型。

“3+2”,5款新模型

一月初,OpenAI发布了多款新模型,价格下降,性能提升,百度本次也是同样的策略,百度智能云千帆ModelBuilder发布了包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内,参数量由大到小的三款轻量级大模型。千帆ModelBuilder的概念就是生产平台,提供整个模型训练的工具链,让模型开发变得更简单。

对于轻量级模型,谢广军表示,基座模型本身的效率一定要好,百度基于文心大模型的技术领先优势积累,再把尺寸做小,模型的效果就会做得很好,在很多场景它能够达到大模型的效果。

同时,百度发布的轻量级模型具备再生产能力,比如支持post-pretrain、sft、lora精调能力,基座模型加上精调数据来达到垂直场景下的效果,同时成本更低。


具体来看,ERNIE Speed在推理场景下拥有最高128k的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,同时,针对特定场景可以将ERNIE Speed作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。

ERNIE Lite的参数量则更小,更适合搭载在低算力的AI加速卡上处理推理任务,作为ERNIE-Bot-turbo模型的升级版,ERNIE Lite在情感分析、多任务学习、自然推理等场景下的应用效果提升了20%,推理调用成本大幅下降了53%。

参数量最小的ERNIE Tiny则主打极致低成本、低延迟,可用于检索、推荐、意图识别等高并发、低延时等应用场景中,在某对话推荐业务场景中,精调后的ERNIE Tiny在搜索引擎推荐词激发环节,相比ERNIE 3.5,对话轮次增长了3.5%,成本下降了32%。

此外,百度智能云千帆ModelBuilder还推出了ERNIE Character和ERNIE Functions两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如游戏NPC、客服对话等)和工具调用场景(对话中使用外部工具、调用业务函数等)中的使用需求。

结合企业实际使用大模型的过程,有些企业起初就用最好的模型看最好的效果,再决定投入的资源程度。有些场景需要快速验证,企业可以先上轻量级模型,轻量级模型总结一句话——“轻归轻,可破冰”,在一些场景下完全可用,作为大模型落地的先锋军。

对于注重私有数据的企业和行业,私有数据跟大模型结合也可以先用轻量级模型,不管是知识资产还是数据分析,都可以跑出效果。

“把大模型应用,喂到企业嘴边”

千帆大模型平台上的客户需求主要分为三种,第一类是在AppBuilder开发应用;第二类,直接调用百度的基座模型的,比如直接调用文心4.0、 3.5版本;第三类是生产模型,客户数据和百度基座模型结合做一个新的垂类模型。

AppBuilder去年年底推出,从应用的视角让开发者能够便捷地开发基于大模型的AI原生应用,百度第一方也做了非常多的AI原生应用,也是基于这套平台做的,本次AppBuilder也进一步升级,进一步降低应用开发门槛。

升级后的AppBuilder开放的工具组件多达55个,包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI能力组件,也包括搜索等百度特色的业务组件、和多场景的第三方API工具,另外还提供了 RAG(知识检索问答)、GBI(生成式数据分析)等根据典型应用场景深入调优的高级能力组件。


在组件之上,千帆AppBuilder推出的Agent(智能体)应用框架,具备精准的任务自主规划能力,对多种应用工具的自动编排准确率超过90%。AppBuilder还支持开发者接入自定义工具,实现更复杂场景应用的需求定制。

谢广军介绍,AppBuilder分两个形态,一个是代码态,百度提供SDK,甚至提供底层的组件和能力,这种是大B端的场景下的典型客户画像。另一个是零代码态,以小企业、个人开发者为主,现在零代码态开发者的数量比较多,百度这两条路都要走。

根据百度智能云公布的数据,千帆大模型平台已经服务8万企业用户,累计帮助用户精调1.3万个大模型,帮助用户开发出16万个大模型应用,自2023年12月以来百度智能云千帆大模型平台API日调用量环比增长97%

大模型未来一段时间还会不断快速演进,百度AI团队主抓基础模型,智能云团队主抓商业落地,构成了百度自己的大模型商业落地模式。

(本文首发钛媒体APP 作者|张帅,欢迎添加作者mr3right爆料、交流)

相关内容

热门资讯

育碧GDC2018程序化大世界... 1.传统手动绘制森林的问题 采用手动绘制的方法的话,每次迭代地形都要手动再绘制森林。这...
编译原理陈火旺版第三章课后题答... 下面答案仅供参考! 1.编写一个对于 Pascal 源程序的预处理程序。该程序的作用是...
MacBookPro M2芯片... MacBookPro M2芯片下如何搭建React-Native环境目录软件下载环境配置 目录 写在...
Android studio ... 解决 Android studio 出现“The emulator process for AVD ...
pyflink学习笔记(六):... 在pyflink学习笔记(一)中简单介绍了table-sql的窗口函数,下面简单介绍下...
创建deployment 创建deployment服务编排-DeploymentDeployment工作负载均衡器介绍Depl...
gma 1.1.4 (2023... 新增   1、地图工具    a. 增加【GetWorldDEMDataSet】。提供了一套 GEO...
AI专业教您保姆级在暗影精灵8... 目录 一、Stable Diffusion介绍    二、Stable Diffusion环境搭建 ...
vue笔记 第一个Vue应用 Document{{content}}{{...
Unity自带类 --- Ti... 1.在Unity中,自己写的类(脚本)的名字不能与Unit...
托福口语21天——day5 发... 目录 一、连读纠音 二、语料输入+造句输出 三、真题 一、连读纠音 英语中的连读方式有好几种...
五、排序与分页 一、排序 1、语法 ORDER BY 字段 ASC | DESC ASC(ascen...
Linux系统中如何安装软件 文章目录一、rpm包安装方式步骤:二、deb包安装方式步骤:三、tar....
开荒手册4——Related ... 0 写在前面 最早读文献的时候,每每看到related work部分都会选择性的忽略&...
实验01:吃鸡蛋问题 1.实验目的: 通过实验理解算法的概念、算法的表示、算法的时间复杂度和空间复杂度分析&...
8个免费图片/照片压缩工具帮您... 继续查看一些最好的图像压缩工具,以提升用户体验和存储空间以及网站使用支持。 无数图像压...
Spring Cloud Al... 前言 本文小新为大家带来 Sentinel控制台规则配置 相关知识,具体内容包括流控...
多项目同时进行,如何做好进度管... 多项目同时进行,如何做好进度管理? 大多数时候,面对项目进...
ATTCK红队评估实战靶场(二... 前言 第二个靶机来喽,地址:vulunstack 环境配置 大喊一声我...
【MySQL基础】3—多表查询 ⭐⭐⭐⭐⭐⭐ Github主页👉https://github.com/A-BigTr...