国内大模型迎来中场战事
2023-05-28 10:06:18 来源:未央网
文/于惠如
【资料图】
由互联网和科技界掀起的大模型浪潮,迎来了新战事。
自今年3月以来,国内已有超过20家企业入局大模型赛道。从百度“文心一言”、阿里“通义千问”的发布,到360“红孩儿”、商汤“日日新”、网易“玉言”、科大讯飞“星火”、昆仑万维“天工”等的推出,再到腾讯“混元”、京东“ChatJ”、华为“盘古”等的预告。互联网巨头、科技公司纷纷秀出“肌肉”,谁也不想在这场大模型混战中掉队。
而在这场狂奔中,大模型的发展阶段已经从“通用”迈入“垂类”。
算力、大规模数据、高成本人才成为大部分企业入局通用大模型的拦路虎。但深度定制、广阔的场景应用等诉求,催生了国内垂直领域大模型的开发。
近两个月来,不少医疗、金融、教育、绘画等行业内拥有用户数据积累的中小型企业,已开始基于国内外大模型“底座”,训练适配自身的垂类模型。同时,已发布通用大模型的公司,也推出了针对特有行业的模型。
如果说通用大模型是大模型发展的初期阶段,那么垂直场景应用则可以视作其“中场战事”,在该阶段,应用与场景先行,倒逼垂直领域的大模型飞跃发展,并率先在不同产业中实现了落地价值。
1. 路线分化
短短两个月,分化已经出现。
在5月23日举办的文心大模型技术交流会上,百度智能云AI与大数据平台总经理忻舟介绍:“文心千帆大模型平台,是百度提供给客户的企业级大模型生产平台,不但提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链。”
即文心千帆可以文心一言为核心,提供大模型服务,帮助客户改造产品和生产流程;企业也可以在文心千帆上基于任何开源或闭源的大模型,开发自己的专属大模型。
多位接受全天候科技采访的业内人士认为,当前国内大模型赛道主要包括三类:一类对标GPT的通用大模型,聚焦基础层的公司;一类是在开源大模型基础之上训练垂类大模型,聚焦垂直行业的企业;另一类则是专注具体应用的纯应用公司。
“刚开始大家是一窝蜂扎进通用大模型,现在分化已经出现,不管是分化到具体行业的,还是不做研发直接调用接口做产品运营的,这个趋势是越来越清晰了。”前金山软件副总裁兼人工智能事业部负责人、现AI领域创业者李长亮告诉全天候科技。
通用大模型面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功的且可对外商业化输出的通用大模型大模型,要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性等核心优势。
在百度智能云副总裁朱勇看来,基础模型(通用大模型)的公司可能“只有那么几家”,但是上面会长出很多专业领域的大模型。
“训练一个基础模型,成本是非常高的,做一个千亿级的大模型,需要单机群万卡以上的算力。”朱勇说,从国内外来看,真正做通用模型的公司并没有那么多。相反,训练领域(垂类)模型所需要的代价和资源远远小于从零开始做通用模型。
因而,从商业逻辑的角度来看,大部分公司不具备做通用大模型的能力,巨头更适合做通用大模型,拥有丰富场景数据积累的公司更适合做垂域模型。
垂类大模型以深度解决行业需求为主,即企业在自己擅长的领域训练适合自己的“产业版GPT”。这类大模型生成的内容更符合特定垂类场景的需求,质量更高。
当前,已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。比如,彭博社根据自身丰富的金融数据资源,基于GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。
除了上述两种常见的模式,目前国内大模型创业赛道上还有一种专做应用的公司,它们没有研发团队,从现有大模型调用接口,做产品和运营。
2. 通用 VS 垂域
布局通用大模型的巨头,需要的是生态。所以百度、阿里都希望成为“大模型的底座”去赋能行业与企业。但并不是所有企业都有这样的能力。
“现有大模型的算力和能耗挑战会促使很多工作向领域专用化、轻量化的大模型方向发展,特别是金融、教育、医疗、交通等领域,大量的工作在试图降低大模型的成本。”在日前举行的第六届数字中国建设峰会上,中国科学院自动化研究所副所长曾大军表示。
相比通用大模型需要高昂的开发训练成本,基于开源模型进行垂类模型开发可兼顾开发成本和数据安全。
事实上,挑战之外,实际的场景需求也加快了大模型垂类化的过程。
“中国擅长商业模式、应用上的创新。”一位AI领域创业者说,与此同时,国内不乏AI模型的落地场景、丰富的数据,以及追风口的热情。因而,短短两个月时间,大模型领域化的发展飞速。
以百度文心千帆这个“AI大模型底座”为例,当前正在共同测试研发的企业通常来自信息化和技术普及率较高的行业,如金融行业、能源行业、泛互联网行业等。
“垂类模型是在通用大模型基础上训练的,撇开通用大模型的话,是不存在垂类模型的。”忻舟说,垂类模型强调领域的know-how,对于特定领域来说,需要针对该领域的任务做指令学习。
行业不同,场景不同,指令学习的区别也极大。比如,泛互联网行业更关注营销、推荐的效果,金融更领域更关注风控、可信、以及营销的效果。
在李长亮看来,垂类大模型与通用大模型最大的区别在于:垂类大模型在资源投入、成本投入等方面的要求下降了,但额外要求是行业known-how,即对这个行业的knowledge要求提高了。
表现在数据方面,在特定的垂直领域,企业拥有私有数据,这是别的企业花钱也买不到的核心竞争力和天然优势。
表现在算力上,通过通用大模型微调实现的垂类大模型相较通用大模型是“几何级别的下降”。
根据国金证券的测算,在模型微调阶段,由于训练量级较小,仅为万级,相关的算力成本相比之下可忽略不计。
以斯坦福大学于2023年3月发布Alpaca为例,这是一个基于LLaMA-7B基座,应用5.2万指令对模型微调训练而来的对话类语言模型。该模型基于8块A100微调,微调时长3小时,算力成本不超过300元。
当然,并不是所有企业都可以在通用大模型的基础上做微调。
以百度文心千帆为例,要在该平台上通过微调做自己的大模型需具备两个条件:企业有没有高质量的数据存下来;能否将自身业务根据对生成式AI的理解变成高质量的数据,变成指定数据做指定微调。
换言之,落地在企业端,那些有海量行业数据、懂行业know-how的企业,做成垂类模型的机会更大。
“因为有专业的数据、有行业know-how,结合不同类型的领域模型,这些领域模型将来会非常繁荣,支撑上层非常繁荣的领域应用。”朱勇说。
3. “两条腿”走路
“GPT+行业专家系统”的模式产生了新的垂直领域大模型。
大模型最大的价值在于革新商业模式,改造商业组织的每一个环节,进而起到降本增效的效果。这也是企业纷纷入局大模型的原因所在。
而Meta旗下LLaMA模型等大模型的开源为垂类模型的发展装上了加速器。
公开信息显示,LLaMA基于通用领域的开源数据集进行训练,训练数据涵盖40种语言,包含约1.4万亿Tokens。LLaMA模型一经发布就对外完全开源,吸引了广大AI开发者。
作为完全开源的领先模型,LLaMA具备高度的灵活性、可配置性和泛化能力,可以作为垂类AI模型的通用基座。
尽管LLaMA模型参数量较小,但性能丝毫不逊色于PaLM、GPT-3等大语言模型。并且较小的参数规模显著降低了LLaMA模型的落地部署和二次开发难度。
“基于LLaMA这种开源模型,我们喂自己的数据,慢慢调试,就能调试出我想要的效果来。”一位AIGC领域的创业者告诉全天候科技。
全天候科技了解到,当下不少企业采用的是“两条腿走路”的策略,即:一边接入大模型API,一边在开源模型上炼模型,两者构成反馈链,加速各自能力的提升,打造创新闭环。
“调用API接口也是一个获取数据资源的有效手段。”李长亮说,这部分数据将来可能在企业训练模型的时候起作用。
在不少业内人士看来,对于各行各业来说,垂直大模型是一种全新的生产力,各个行业的垂直领域大模型对所在行业可能产生重大甚至是颠覆性的影响。
值得一提的是,在一级市场上,专注于垂类大模型的创业公司也是投资机构眼中的“宝藏”。
在不久前召开的2023中国投资年会上,天堂硅谷高级合伙人王伟将“垂直领域大模型,掌握行业数据、懂行业Know-how的项目”列为其重点投资布局的领域之一。
“全天候科技”(微信ID:iawtmt,网址:www.awtmt.com)是华尔街见闻旗下发起的科技新媒体,致力于帮助投资者理解科技。授权请联系出处。
标签:
相关阅读
- (2023-05-28)国内大模型迎来中场战事
- (2023-05-28)亳州列入2023中央财政支持试点项目,珍宝岛助力“药都”高质量建设
- (2023-05-28)焦点要闻:孝义:蔬菜大棚 育苗忙
- (2023-05-28)意甲最新积分榜:国米3-2锁定欧冠席位,罗马7轮不胜无缘争四
- (2023-05-28)【天天新视野】建筑施工企业会计核算与纳税、财务报表编制实务
- (2023-05-28)拜仁联赛11连冠历年积分榜领先优势:本赛季0分,12/13赛季25分|焦点观察
热点推荐
- (2023-05-28)国内大模型迎来中场战事
- (2023-05-28)亳州列入2023中央财政支持试点项目,珍宝岛助力“药都”高质量建设
- (2023-05-28)天天快看点丨汤唯和梁朝伟演的什么电视
- (2023-05-28)焦点要闻:孝义:蔬菜大棚 育苗忙
- (2023-05-28)队列队形变换示意图_队列队形变换设计图
- (2023-05-28)意甲最新积分榜:国米3-2锁定欧冠席位,罗马7轮不胜无缘争四
- (2023-05-28)37 岁生日的想法_男性普通朋友送什么生日礼物最好看
- (2023-05-28)【天天新视野】建筑施工企业会计核算与纳税、财务报表编制实务
- (2023-05-28).dat如何打开(dat如何打开)_全球滚动
- (2023-05-28)拜仁联赛11连冠历年积分榜领先优势:本赛季0分,12/13赛季25分|焦点观察
- (2023-05-28)塑料发黄怎么处理变白色_塑料发黄怎么处理变白
- (2023-05-28)新消息丨广告公司如何给自己做广告?
- (2023-05-28)西村里香资源下载_西村里香
- (2023-05-28)全国首富排名_全国首富 世界快讯
- (2023-05-28)锤炼监测队伍 提升保障能力——江西省工信厅组织开展2023年全省无线电监测技术演练活动
- (2023-05-28)意媒:多特有意引进米林科维奇,将与曼联&纽卡&米兰&尤文竞争 即时看
- (2023-05-27)全球热讯:5.26围棋赛事:韩国围甲季后赛崔精再次“白赢”,朴廷桓率队晋级
- (2023-05-27)天天视讯!多恩传节译3:罗家蹲坦诚心路,福美凤为兄分忧
- (2023-05-27)孙颖莎完胜早田希娜,国乒锁定德班世乒赛女单冠军!-报道
- (2023-05-27)当前讯息:塞尔达传说王国之泪巧克高达怎么打[多图]
- (2023-05-27)水电工证报考条件 水电工证
- (2023-05-27)数智赋能门产业创新发展 世界视讯
- (2023-05-27)2023河南·宝丰魔术大会异彩纷呈_焦点报道
- (2023-05-27)跨越时空的团圆
- (2023-05-27)让“烟火利州”更有生机 观点
- (2023-05-27)“跑遍辽宁”马拉松系列赛暨2023营口·鲅鱼圈马拉松赛开赛
- (2023-05-27)深圳市龙华区“直播带岗”产业园正式启动,快手快聘助力高质量就业 世界新要闻
- (2023-05-27)世界报道:孜然牛肉炒面,有没有很饿?
- (2023-05-27)大灯会眨眼带电也安全 沃尔沃EX90静态体验_今日报
- (2023-05-27)胜宏科技:"仿真人型机器人PCB"研发项目已完成 环球关注
- (2023-05-27)【当前独家】中工国际:公司管理层在"中国—中亚五国"峰会期间参与了系列商务活动
- (2023-05-27)华峰超纤:威富通是微信支付的首批签约受理机构-天天讯息
- (2023-05-27)建科院:公司有参与深圳市政管网的相关技术服务工作|新动态
- (2023-05-27)当前热门:华亚智能:公司具备为光刻机提供精密金属结构件的加工技术能力
- (2023-05-27)王曼昱为何4-0爆冷丢冠?马琳责任很大,利好陈梦,肖战爱莫能助 天天聚看点
- (2023-05-27)泰酷辣!全国40余家主流网络媒体记者为重庆科创职业学院30周年校庆送祝福 环球最新
- (2023-05-27)直面长城比亚迪之争 常压油箱如何实现排放达标|当前资讯
- (2023-05-27)豆鼓怎么焖猪肉?|全球观焦点
- (2023-05-27)与吴晓波商榷:不要指望房地产来救内需_热点评
- (2023-05-27)打美白针皮肤发黄是什么原因(皮肤注射美白针有用吗)
- (2023-05-27)【天天时快讯】一起来看流星雨快乐大本营念菜谱_一起来看流星雨快乐大本营
- (2023-05-27)snapbridge官网下载(snapbridge电脑版下载) 每日关注
- (2023-05-27)全球快消息!西安出发高铁两小时旅游路线_从西安出发省外三日游
- (2023-05-27)洪江市沙湾乡中学:开展“防性侵”“防欺凌”护航青春专题讲座
- (2023-05-27)为了“虫口夺粮” 这群博士给虫子拍“写真”进行“虫脸识别”
- (2023-05-27)“老字号”王老吉助“荔”乡村振兴 环球通讯
- (2023-05-27)年内赛道股大面积表现不佳,投资者布局需关注重仓股“抱团指数” 每日看点
- (2023-05-27)专升本专业有哪些(专升本专业)
- (2023-05-27)从9500岁植物中探寻人类长寿的“两个秘密”_全球时讯
- (2023-05-27)【天天快播报】拼多多重提“面对恶意攻击,也要坚持善意解读”
- (2023-05-27)环球热点!30分钟英文缩写_30英文
- (2023-05-27)盛屯矿业(600711)2名股东合计质押1535万股,占总股本0.48%
- (2023-05-27)世界最新:将6月21日首发 全新丰田埃尔法谍照曝光
- (2023-05-27)怎么写introductory paragraph_怎么写introduction?
- (2023-05-27)骄阳 | 中特估杀跌动能相对有限
- (2023-05-27)股海听萧 | 躺平也不是什么坏事
- (2023-05-27)世界实时:新疆2023年二级建造师准考证打印时间考前一周
- (2023-05-27)余杭中泰开展美丽河湖“综合查一次”行动
- (2023-05-27)长城汽车:新能源产品释放矩阵动能,“生态出海”模式叠加开启上涨新周期
- (2023-05-27)甘州区甘浚镇中心学校开展《信访工作条例》宣传活动
- (2023-05-27)天天看点:“AI换脸”调查:“丢脸”同时暗藏“丢钱”风险 券商提示警惕高仿真诈骗手段
- (2023-05-27)当前速讯:5月26日机构席净卖出 买入16股
- (2023-05-27)互联网平台开展金融业务的政策框架与边界
- (2023-05-27)唐山港(601000)5月26日主力资金净买入2556.73万元
- (2023-05-27)考不上好高中怎么办_孩子考不上高中怎么办
- (2023-05-27)纽约金价26日上涨_新动态
- (2023-05-27)用电高峰提前 多地“双管齐下”备战保供
- (2023-05-27)世界消息!意媒:欧冠决赛结束后,国米将官宣与恰尔汗奥卢续约3年
- (2023-05-27)最大的骄傲_对于最大的骄傲简单介绍 今日热门
- (2023-05-27)吴谢宇案将于5月30日上午宣判 视讯
- (2023-05-27)最“卷”电商节来袭!|环球热议
- (2023-05-27)新动态:石蕊遇酸变红是什么反应_石蕊遇酸
- (2023-05-27)每日消息!ST华铁:公司目前暂不存在相关的债务危机和经济纠纷
- (2023-05-27)满意率超99%!小米13 Ultra站稳高端:雷军摆庆功宴
- (2023-05-27)【大美乡村流量“密码”】天津“新农人” 将“乡味”送至天南海北_环球最资讯
- (2023-05-27)中国十大卫浴品牌排行榜2022 中国十大卫浴品牌排行
- (2023-05-27)何洛洛为什么改名_何洛洛为什么放弃高考 全球今亮点
- (2023-05-27)高中绝对值不等式公式总结大全_高中绝对值不等式公式 全球微速讯
- (2023-05-27)最美教师|周娜:让青春在明媚的春天绽放
- (2023-05-27)世界实时:公诉热巴原型是谁
- (2023-05-27)工程质检合同范本(精选24篇)
- (2023-05-26)全球速递!三峡旅游(002627.SZ):公司目前正开展的并购重组项目和非公开发行募资的投资项目,均为旅游产业投资项目
- (2023-05-26)全球观焦点:上高街道网格员拾金不昧传递正能量
- (2023-05-26)蛇鼠两端_关于蛇鼠两端的介绍
- (2023-05-26)他为何要对着列车敬礼?|新动态
- (2023-05-26)欧洲天然气需求暗淡 但新兴市场却在抢购廉价液化天然气|世界滚动
- (2023-05-26)环球热点评!风华高科:公司高端电容项目三期已于今年3月进入试生产阶段
- (2023-05-26)兆龙互连:公司800G产品具有低功耗、高速率,散热好等特点
- (2023-05-26)新乡市凤泉区开展“美好生活•民法典相伴”主题宣传系列活动
- (2023-05-26)烟尘线:扩大寻找宜居行星的新方法 最资讯
- (2023-05-26)环球看热讯:今年首个超强台风来了!对闽清的影响是……
- (2023-05-26)章鱼和鱿鱼有什么区別
- (2023-05-26)每日消息!兰生股份:公司拥有一定规模的金融资产 为将来的业务开拓及兼并收购奠定了良好的基础
- (2023-05-26)东瑞股份:公司目前供港澳业务是以活大猪出口-环球头条
- (2023-05-26)天天资讯:拼多多Q1净利润环比回落,加大投入优化平台生态,加快高质量转型
- (2023-05-26)环球新动态:招商蛇口携手中核汇能打造产业园区高质量发展标杆
- (2023-05-26)宋城演艺:佛山项目填补了广东省的文化剧目空白 公司有信心将佛山项目做好 天天速讯
- (2023-05-26)中国十大品牌卫浴有哪些牌子_中国十大品牌卫浴
- (2023-05-26)利物浦无缘欧冠,萨拉赫发文:我完全崩溃了,这绝对没有任何借口-热头条
- (2023-05-26)完美世界:公司的版号申请工作在正常推进中