一文读懂ChatGPT的工作原理:大语言模型是个啥?它到底咋工作的?
2023-06-19 11:31:03 来源:博客园
继AI绘画后,ChatGPT横空出世。聊天、翻译、文案、代码……ChatGPT的功能如此强大,以至于连马斯克都认为“我们离强大到危险的AI不远了。”
(资料图片)
想要了解ChatGPT是什么,需要关注它背后的GPT模型。GPT模型是一个由OpenAI 训练的大语言模型。
一、大语言模型是什么?
大语言模型(Large Language Model)是指在海量文本数据上训练,通过无监督、半监督或自监督的方式,学习并掌握通用的语言知识和能力的深度神经网络模型。
从下图中,我们不难看出,这些大语言模型的参数计数都是数千亿:
换个容易理解的说法,“读书破万卷,下笔如有神”在一定意义上反映了大语言模型的运作模式。在海量文本数据上训练是读了万亿书籍,吸收了大量的知识,在此基础上就可以按照用户的需求进行回答、创作、总结与分析。
大语言模型在经过特定训练后可以为企业带来意想不到的可能性:
1、减少人工劳动和成本 | 大语言模型能够让企业在发展过程中实现自动化,如顾客服务、内容创作、欺诈检测等,这不仅能够降低人力与时间成本,还能将员工从高重复度的工作中解放出来,从事更需要人类专业知识的重要工作。 |
2、提高客户满意度 | 基于大语言模型的聊天机器人不仅能够为客户提供全天候的服务,还能通过处理大量的数据来了解客户的行为和偏好,从而提供个性化服务。 |
3、提供决策的准确性 | 大语言模型对大量数据的处理,能够让企业迅速从复杂的数据集中提取需求,从而提高运营效率,更快地解决问题,并做出更准确的商业决策。 |
4、提高任务的准确性 | 大型语言模型能够处理大量的数据,这导致预测和分类任务的准确性提高。这些模型利用这些信息来学习模式和关系,这有助于它们做出更好的预测和分组。 |
但我们不得不承认大语言模型同样存在着一些弊端:
1、认知范围有限 | 大语言模型的能力受限于它们的文本训练数据,这意味着它们无法理解训练数据以外的文本,如调休。它极有可能接触到虚假信息、种族、性别和性的偏见等文本训练,这会导致大语言模型产出种族主义或性别歧视的评论。 |
2、输入token有限 | 每个大语言模型的内存是有限的,所以它只能接受一定数量的token作为输入。例如,ChatGPT的限制是4096个(大约3000个词),如果超过这个限定,GPT就无法对输入作出反应。 |
3、系统成本高 | 大型语言模型的开发和训练都需要大量投资,包括计算机系统、人力资本和电力。据估计,ChatGPT10轮的训练,仅电费成本就高达1200万人民币,这并不是随便一个企业能够承担得起的。 |
4、泛化能力弱 | 泛化能力指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出。大语言模型虽然可以在多个任务上表现出色,但是它们也容易受到输入的影响而输出不合理或者错误的内容。 |
在了解了大语言模型后,我们距GPT的工作原理又进了一步。
二、GPT背后的应用逻辑
GPT的全称是“Generative pre-trained transformer”,翻译一下就是“基于Transformer的生成式预训练模型” 。让我们把这些词拆分来看:1)“Generative”
“Generative”指这个模型具备生成自然语言文本的功能。也就是说,这个模型能够生成一段内容,还能让你看懂。比如给它几个关键词,能够通过这些关键词自动生成一段话或者一篇文章。当然,可能有人会说“之前那个狗屁不通生成器也能读,那他们的区别在哪里?”实际上,“狗屁不通(GPBT)”只是一个文本生成器,对文本的连贯性和含义要求并不高;而GPT生成的内容则有着高连贯性和可读性的要求。 所以大家会发现,先不说GPT生成的内容能不能解决实际问题,至少读起来是合情合理的。2)“pre-trained”
“pre-trained”意为“预先训练好的”。一般来讲,在应用这种技术时,会需要先将大量的文本数据输入到模型中训练,让模型在一定程度上掌握了语言的语法规则和表达方式,这个提前输入进行训练的过程就被称为预训练。我们也可以将上述过程简单粗暴地理解为“题海战术”。想想我们在各类学习中,经常通过题海战术对题目类型、考察的基础知识以及逻辑进行深入了解,才能在面对新的题型时,通过调用自己所学的知识交出相对合理的答卷。同样,GPT也是在这种“题海战术”中杀出重围的。3)“transformer”
最后说到“transformer”,这是Google 的研究者在《Attention Is All You Need》中提出的概念,我们可以先将它简单理解为“转换器”。Transformer的基本原理是Encoder(编码)和Decoder(解码),也就是先将输入的内容转换为计算机能理解的内容,再将计算机理解的内容转换为我们人类能理解的内容。但在语言转化的过程中,还会出现一个问题:歧义。我们生活中也会有很多出现歧义的情况,比如“我买了一斤苹果”和“我买了个苹果新产品”。那么问题来了:大家怎么判断这两句中的苹果指的是某种水果还是某个电子设备?答案估计也没啥争议:结合苹果旁边的“一斤”和“新产品”就能确定在不同上下文中的“苹果”代表了什么含义。而GPT能够理解我们输入的内容,关键也在于此。Transformer在编码和解码的基础上,引入了“Multi-headed Attention(多头注意力)”的概念。多头注意力就是为了让模型在处理输入输出的内容时,更关注内容中的某个或某几个词语,并对它们进行加权处理,从而推断其准确含义,实现上下文学习。用一句话总结上面讲的内容,就是“GPT能读懂你说的话了”。既然懂了提问的内容,那接下来GPT又是怎样回答出你想要的答案的呢?前面我们讲了GPT是“预先训练好的”,所以当它理解了你想要什么之后,便会自动选择当下最适合的一个内容,然后不停地再输入、输出,最终生成一段完整、具有高匹配度的内容。例子:请给我描述一个西瓜第一次输入:请给我描述一个西瓜输出:西瓜第二次输入:请给我描述一个西瓜:西瓜输出:西瓜是第三次输入:请给我描述一个西瓜:西瓜是输出:西瓜是一种……第N次输入:……输出:……最终呈现以下内容:GPT就是通过这种不断地“输入-匹配-选择-输出-再输入”的过程,和我们进行问答的交互。而被我们熟知的 ChatGPT则是基于GPT模型调整而成的对话生成模型,在本质上,其工作原理和GPT是相同的。
三、如何让ChatGPT不说废话?
那么,理解了ChatGPT及GPT模型的运行方式,它就能真正为我们所用吗?答案显示是否定的。很多人会抱怨,它的回答很空泛,有时甚至会出错。
当然,人工智能可以理解人类的语言,但可能还不能精准理解人类的目的,所以成功的人机交互才会得到我们想要的答案,也就是说GPT这类模型就像我们的宠物一样,能够听懂我们说的话,但前提是我们需要跟它“好好说话”。
来看一个例子:请介绍一下华山。(PS:本文所有问答,均来自禅道的OpenAI插件:神奇小海螺)
从上面两个图片中可以发现,我们的提示词不同,小海螺给出的回答也不同。那我们应该如何提问?这里引用常青老师总结而成的一个提示词模板(亲测非常有效):(指路公众号:常青说)通过这个技巧,我们现在可以改一下上面的提示词:
“假如你是一名导游,现在你要带一个10人的旅游团前往华山,请给一份华山的讲解词。请注意,因为旅游团中有小朋友,所以讲解词请用生动有趣的内容组织,最好还能加一些故事和例子。”
很明显,这样一问,小海螺就能给出比较符合我们要求的回答。如果还想让它的回答更精准,那就需要继续再补充其他的细节啦。
总之,我们期待着人类对自然语言的处理技术达到一定程度时,这些人工智能的回复质量能带给我们更大的惊喜;在另一方面,对于它们的回答,我们也要有基础的辨别能力。
罗翔老师曾说:“人跟人工智能最大的不同,在于人除了有理性还有感情。我们永远不用担心它会取代我们,因为我们是人,是万物之灵。”所以,我们不仅要把ChatGPT一类的人工智能应用到极致,充分去拥抱它,还要训练自己作为人类原生的、不依赖任何工具的基础能力、思维能力以及创新能力。
标签:
相关阅读
- (2023-06-19)一文读懂ChatGPT的工作原理:大语言模型是个啥?它到底咋工作的?
- (2023-06-19)天天信息:防汛四级应急响应,范围扩展至8省份
- (2023-06-19)世界即时看!小肚子疼是什么原因引起的(小肚子疼怎么回事)
- (2023-06-19)“杨梅自由”?有人狂吃2斤后进了抢救室!这类人千万小心_每日观点
- (2023-06-19)大电流系统和小电流系统的区别(大小电流电力系统发生故障后电压电流的变化)
- (2023-06-19)重庆解放碑威斯汀酒店所在地公开拍卖 ,起拍价10.38亿元 环球即时看
热点推荐
- (2023-06-19)一文读懂ChatGPT的工作原理:大语言模型是个啥?它到底咋工作的?
- (2023-06-19)全球速读:走入欧洲第一步,“氢能第一股”的最新合作!
- (2023-06-19)天天信息:防汛四级应急响应,范围扩展至8省份
- (2023-06-19)微资讯!晨光生物:公司从事的业务属于天然植物提取物细分领域 处于快速发展阶段
- (2023-06-19)差异化优势+全渠道布局 七鲜618订单量同比增长44%
- (2023-06-19)安徽美利信智能科技有限公司一期项目开工仪式圆满举行-每日短讯
- (2023-06-19)长青科技:公司子公司目前拥有的软件著作权17项
- (2023-06-19)天天滚动:通光线缆:公司控股子公司德柔电缆目前已完成小批量机器人控制电缆和机器人线束产品的销售
- (2023-06-19)环球热点!新美妆贴金“内耗”,李佳琦“坐庄”稳赚
- (2023-06-19)网店购物流程交易流程(凡客诚品购物流程)_环球热资讯
- (2023-06-19)世界即时看!小肚子疼是什么原因引起的(小肚子疼怎么回事)
- (2023-06-19)中国电信国际公司与沙特电信公司签署合作备忘录
- (2023-06-19)“杨梅自由”?有人狂吃2斤后进了抢救室!这类人千万小心_每日观点
- (2023-06-19)环球今日讯!公告速递:中加优享纯债债券基金暂停大额申购业务
- (2023-06-19)大电流系统和小电流系统的区别(大小电流电力系统发生故障后电压电流的变化)
- (2023-06-19)俄罗斯能源部长:俄向巴出口石油 用友好国家货币交易
- (2023-06-19)再添重器!我国首艘全新智能浮式生产储卸油装置成功交付
- (2023-06-19)每日关注!大庆油田薄储层井震融合高精度预测技术国际领先
- (2023-06-19)焦点精选!石勘院牵头启动中国工程院页岩油项目
- (2023-06-19)今日聚焦!塔里木油田超深层流体相态分析填补国内空白
- (2023-06-19)观察:沃森生物:公司新冠变异株mRNA疫苗对主要新型冠状病毒VOCs均具有一定的交叉中和能力
- (2023-06-19)今天起腾讯等24只港股可用人民币购买!券商:有利于提升港股流动性、推进人民币国际化_环球即时看
- (2023-06-19)视点!苏试试验:公司目前在手订单充足 主要实验室均已投入使用
- (2023-06-19)东南网架:与日托光伏在绿色建筑一揽子解决方案与集成服务等业务上保持合作关系 全球独家
- (2023-06-19)环球实时:实力“摘星”,中银主题策略再次斩获明星基金奖!
- (2023-06-19)通讯!未央本周回顾:央行连续下调7天期逆回购利率和MLF利率 多家股份制银行下调存款利率
- (2023-06-19)光大阳光车主白金卡:打造一站式汽车服务生活圈
- (2023-06-19)股东创业融资策略:期限转换下的短债长投|天天短讯
- (2023-06-19)高校“热心”的就业服务,一些学生为何不买账? 天天报道
- (2023-06-19)揭秘制剂标准化生产流程 郑州仙佑打造健康未来
- (2023-06-19)重庆解放碑威斯汀酒店所在地公开拍卖 ,起拍价10.38亿元 环球即时看
- (2023-06-19)镜观中国
- (2023-06-19)做儿童重症监护病房的“代理妈妈”
- (2023-06-19)绝世而独立什么意思(绝世而独立) 天天热资讯
- (2023-06-19)前沿资讯!镇江特产是什么
- (2023-06-19)武汉市气象台发布暴雨红色预警
- (2023-06-19)企业网络设计_企业网络名片
- (2023-06-19)契阔谈宴的读音是什么_契阔谈宴的意思是什么_全球报资讯
- (2023-06-19)总裁空降直播间引爆618大促能量,火星人集成灶快手GMV超1500万-今日关注
- (2023-06-19)大宗商品迎来普涨,油价迎来难得喘息之机 环球信息
- (2023-06-19)海上石油加工厂交付!中国制造究竟有多牛?一图看懂
- (2023-06-19)10万吨石油!“人民币支付”_当前滚动
- (2023-06-19)美国新概念飞行器X-66A试验机,想开创客机新时代?
- (2023-06-19)华南领先的聚苯乙烯高分子新材料生产企业—仁信新材开启申购
- (2023-06-19)京东集团CEO许冉详解未来20年“35711”梦想路线图_世界热文
- (2023-06-19)京东20年老友汇聚 京东集团CEO许冉详解未来20年“35711”梦想路线图
- (2023-06-19)集团司库及财务公司行业发展论坛 | 软通动力与华为云携手 共促GaussDB数据库蓬勃发展
- (2023-06-19)环球报道:爱旭股份获第二届国际绿色零碳节“绿色可持续发展贡献奖 ”
- (2023-06-19)文博日历丨2000多年前的嫁妆什么样?
- (2023-06-18)快资讯丨最新!胡兵已与东航和解!此前50万积分突然被全部清零
- (2023-06-18)世界短讯!三峡船闸通航20年累计货运量达19.1亿吨
- (2023-06-18)【天天播资讯】神界原罪2石像鬼迷宫装备获得位置 神界原罪2石像鬼迷宫有什么
- (2023-06-18)淘天刘博:今年618,用户、商家规模、成交三项指标,全面正增长|全球新资讯
- (2023-06-18)天天热文:破地之埂 更破心之“埂”
- (2023-06-18)当前快播:山东郯城2只“鸟类大熊猫”东方白鹳现身觅食
- (2023-06-18)人地两不闲 四季都赚钱
- (2023-06-18)世界快看:中国最美公路——独库公路库车段发车仪式举行
- (2023-06-18)“温度+速度”打造硬核营商环境 观天下
- (2023-06-18)手机版我的世界里的龙蛋怎么孵化_我的世界手机版龙蛋怎么孵化视频
- (2023-06-18)天天热议:歌曲搜索app 歌曲搜索引擎
- (2023-06-18)硬核科技论|别被洗脑 双电机有时候并非你所想 焦点速看
- (2023-06-18)奥飞娱乐:未涉及算力相关领域业务 热资讯
- (2023-06-18)我爱我家:2022年一年以内应收账款坏账准备计提比例为2.99%
- (2023-06-18)顺发恒业:公司与英伟达并无合作关系 天天报资讯
- (2023-06-18)天键股份:目前公司与华为没有业务往来
- (2023-06-18)每日消息!南王科技:公司目前尚未与苹果业务合作
- (2023-06-18)今日热文:不会下课!沃勒尔:就算输哥伦比亚,弗里克也会继续当德国主帅
- (2023-06-18)蓄能充电 冰城公安打通新警成长“快车道”
- (2023-06-18)暴雨黄色预警继续 贵州湖南安徽江苏等地部分地区有大暴雨
- (2023-06-18)董宝珍:银行正处于大级别行情周期当中,银行股超过15倍市盈率就不再持有
- (2023-06-18)热点追踪 | 减持背后的弦外之音
- (2023-06-18)即时:端午节粽子大数据发布: 肉粽要压过甜粽 肉粽占比增1倍 在北方增长明显
- (2023-06-18)【全球时快讯】暴雨黄色预警继续 贵州湖南安徽江苏等地部分地区有大暴雨
- (2023-06-18)拼拼有礼案件最新进展_拼拼有礼 全球新视野
- (2023-06-18)总裁空降直播间引爆618大促能量,火星人集成灶快手GMV超1500万
- (2023-06-18)聚焦IPO丨贝克制药IPO前夕大股东低价退出,与大客户兼供应商交易真实性待考
- (2023-06-18)天天热点!聚焦IPO丨下周新股发行数量锐减,金杨股份、明阳电气业绩波动较大
- (2023-06-18)【环球聚看点】下周共有逾50家公司限售股陆续解禁
- (2023-06-18)奥飞娱乐:已推出王者峡谷抱抱系列盒蛋等产品
- (2023-06-18)自然资源部印发通知要求 稳妥有序落实耕地进出平衡 严控新增城镇建设用地|环球实时
- (2023-06-18)real school下载_real school 世界热点
- (2023-06-18)第二届重庆长寿中匈皮划艇邀请赛鸣枪 多国选手同场竞技_全球热讯
- (2023-06-18)世界快播:《闪耀的她》开播,秦岚王阳吻戏多多
- (2023-06-18)充提差是什么意思_ctc是什么意思
- (2023-06-18)八字案例(10)大禹风水
- (2023-06-18)世体民调巴萨会员今夏引援投票:基米希居首,B席第三_每日视点
- (2023-06-18)工伤赔付遇困境?工会调解员助职工拿到2.8万元
- (2023-06-18)opporeno10如何开微信美颜 世界热消息
- (2023-06-18)父亲节,我花300做一桌菜,老婆掀了桌子带女儿离开,说要离婚
- (2023-06-18)讳输棋 讳
- (2023-06-18)极兔速递赴港IPO:2022年实现扭亏为盈,中国区包裹量市占率达到10.9%
- (2023-06-18)滚动:关于簪花的古诗有哪些 关于水浒传的诗句有哪些
- (2023-06-18)浙江哪里的生蚝批发最便宜|环球时讯
- (2023-06-18)防汛四级应急响应 最新
- (2023-06-18)美司法部:市警局系统性问题导致弗洛伊德之死
- (2023-06-18)科曼:欧国联三四名决赛荷兰想赢,意大利缺席世界杯但仍是强队|当前速讯
- (2023-06-18)环球热讯:京东618“最多数量商品”订单:采购60万颗焊钉
- (2023-06-18)马云杭州现场观看阿里全球数学竞赛决赛:要给热爱数学的人们带来新乐趣
- (2023-06-18)京沪二手房挂牌量攀升,有业主降价百万卖房,还有中介为压价招聘群演
- (2023-06-18)中国贸促会会长任鸿斌:中国全年经济增长有望达5.2% 天天播资讯