每日快看：小冰CEO李笛：小冰链不是中国版ChatGPT

2023-02-21 18:21:53 来源：新智元

新智元报道

【资料图】

编辑：Aeneas 好困

【新智元导读】国内的公司就必须抄ChatGPT吗？其实，还有另一条路可以走。今天，小冰链给了我们答案——CoTA。

ChatGPT激起的火种，正在中国科技公司急速蔓延。国内的各个大厂内，算法工程师们纷纷开启冲刺倒计时，迎来一个个不眠夜。

而在创投圈的饭桌上，到处都能听到「誓要做中国第一个ALL in GPT的VC」的声音。

兴奋者有之，观望者有之，唱衰者有之。所有人都在翘首以盼：谁能成为中国的第一个ChatGPT？

而如今，这股ChatGPT热潮中，忽然涌现了一股清流——小冰链。

小冰链给了我们这样一个答案：除了做中国版ChatGPT，还有没有别的选项？

ChatGPT军备竞赛，实则刻舟求剑

跟目前急于下场的巨头派、大佬派、初创公司派不同，小冰认为，现在国内这股跟随ChatGPT展开军备竞赛的热潮，其实是刻舟求剑。

因为，大模型技术本身的发展速度，就是很快的，现在我们应该做的，应该是进一步去布局下一站的未来，而不是照抄当前的ChatGPT。

换言之，我们应当去思考，ChatGPT之后的是什么？而不是一窝蜂去做中国的ChatGPT。

而小冰链所代表的方向，则是利用大模型技术，实现下一代的控制中枢。

通俗来讲，小冰链不再只是「聊天」，而是成为了「逻辑思维」驱动下的「下一代行动中枢」，覆盖数字和物理世界。这一方向将成为下一个真正带来影响的大模型创新突破。

这也就是为什么，小冰CEO李笛在接受新智元采访时，特别强调说：其实我们做的并不是类ChatGPT产品。

小冰链和ChatGPT的核心区别：小冰链的数据来源是实时的，而ChatGPT是从训练数据中总结的；小冰链能展现逻辑思维过程，更透明、可观测，而ChatGPT完全是个黑盒子；最本质的区别是，小冰链会自己进行下一步的行动，比如上网搜索，而ChatGPT只是对话生成，并没有行动。

李笛解释道，小冰链的独特之处在于，能够把AI的思考过程完整透明地呈现出来，从而揭开大模型的黑盒。

更重要的是，她能真正实施行动，也就是Action。

小冰链是个啥？

李笛解释道：在GPT-3.5时，涌现了一个新的能力——思维链/逻辑思维。

但是，在ChatGPT这个过程中，没有真的实施这种调查或计算，因为它只能从训练数据里去爬。

如果我们换一种思路，比如训练一个不那么大的模型来提供逻辑思维的能力，而执行部分则交给CoT之后的ACTION，也就是通过查询新闻的真实性，直接、实时地获得信息。

这项过程并不是在大模型里完成的，反而一举两得：一方面，因为只需要保留逻辑思维能力，所以模型不需要那么大，运行成本没有那么高，计算量没有那么大；另一方面，恰恰因为不是让语言模型自己把所有事情做出来，反而能更准确。

因而，李笛认为，与其一直争当下一个「中国版ChatGPT」，不如去思考：ChatGPT的下一步是什么？

再往前推一步，既然得到的是有逻辑思维能力的组合（一个模型负责思考，一个模型负责牵引，去做行为），这个组合就变成了一个控制中枢。此时，她可以控制搜索、计算、传统的知识图谱，甚至是物理世界。

AI经过思考，会控制物理世界的灯、去餐馆订餐、发动车子、生成一段音乐，可以调动任何事情，这个意义，或许比只是写个新闻稿影响更深远。

而这就体现了小冰对于「探索语言模型下一步方向」的探索成果。

现在，ChatGPT的能力已经基本全部展现了。接下来呢，是让它更准确？写的文章更符合现实？

本质上看，这些只是程度上的差异，不构成一个代际跨越。

什么才算「代际跨越」？

李笛表示，代际的跨越除了要实现意图识别，还需要包括思维的转换和跳跃等等，这才是下一步要做的东西。

比如，当你问「我老婆说今天天气真好，是什么意思」时：

小冰链先是get到了我们提问的目的——了解她的意思；

然后根据这个目标，去制定自己的行动计划——搜索相关信息；

在找到一个靠谱的答案之后，小冰链对其进行了概括和润色，最后输出结果——暗示你，应该主动提议约会。

此外，由于思维逻辑透明，信息源也全部公开，因此也就做到了「可信」。

而这都是「黑箱」ChatGPT所不具备的。

根据官方内测页面的介绍，此次demo展示了小冰链（X-Chain of Thought & Action）的新特性，也就是说，AI Being不再只是单纯地给出回复，而是将她的思考过程完整透明地呈现在你面前，由此揭开大模型的黑盒。

更重要的是，她能真正实施某种行动（Action），例如：在你提出问题后，她经过思考，发现自己得去搜索一下，或是实时编写一段代码并真的加以运行，或是自主决定她应当控制物理世界的一系列设备或交通工具，来更好地满足你的需求。

不过，基于法律、政治、公序良俗方面的安全性考虑，小冰对模型进行了一些限制（回复的篇幅及趣味性会有所降低，但安全性更高）：

限制了回复文本的最大长度；

为展现实时获取互联网最新信息的特性，大幅度降低了从大模型训练数据中提取信息的比例；

降低了闲聊的比例。

是的，这个demo并不能帮你生成作业、综述或发言稿……

为什么要做小冰链？

而这次小冰的发布，并不仅仅是一次简单的「秀肌肉」。

ChatGPT国内赛开卷后，各方势力纷纷下场。有人唱衰道：OpenAI做出ChatGPT，靠的是八年的积累，国内的公司靠几个月的冲刺，能冲刺出什么像样的产品吗？

其实，中国完全能做出自己的ChatGPT，有相应的模型和算法能力的，国内至少有七八家公司，差别可能就在数据质量上。

除了证明「中国也有能力做出ChatGPT」之外，小冰链的诞生，也是水到渠成的过程。

小冰链并非小冰在大模型时代的唯一创新。

自2014年以来，小冰始终伴随技术迭代而成长，经历了检索模型、生成模型、大模型和X-CoTA等多个周期。其中在大模型领域，自2019年至今，小冰已经形成了不同规模的模型训练和调优，并在安全性评估之后依次放出。

小冰链只是其中之一。

尽管如此，在小冰看来，大模型的安全性和伦理仍是至关重要的考量因素。因此，尽管国内市场非常火爆，但小冰团队不会为了秀肌肉而贸然放出各种不安全的产品，这次的小冰链，是唯一的一次例外。

从CoT到CoTA

技术方面，小冰链——X-CoTA的实现，少不了作为基础的「思维链」（Chain of Thought, CoT）。

简单来说：

1. CoT可以让语言模型将复杂的多步骤问题分解成一连串的步骤

2. CoT可以让开发者看到模型的推理过程，便于确定错误并进行修复

3. CoT可以解决数学应用以及常识性推理问题

在此之前，标准的提示会在模型预测答案之前，给出输入-输出对的例子（格式化为问题和答案）。

而在思维链提示中，模型会得到一个问题推理的过程。也就是说，在处理多步骤推理问题时，模型产生的思维链将模仿直观的思维过程。

研究人员发现，只需要在prompt中加入「Let"s think step by step」就能让GPT-3的推理性能大幅提升，比如在MultiArith中就将推理准确率从之前的17.7%一下提升到了78.7%。

下面的例子取自「Scaling Instruction-Finetuned Language Models」。其中，橙色突出了指令，粉色显示了输入和输出，蓝色是CoT推理。

论文的结果显示，采用CoT微调的模型，在涉及常识、算术和符号推理的任务中表现得更好。

不难看出，思维链提示（chain of thought prompting）可以让模型更好地理解自然语言提示和示例，从而能够执行需要复杂推理的任务，并且显著提高模型处理新任务的能力。

除此之外，CoT微调在敏感话题方面也非常有效（有时比RLHF做得更好），尤其是可以避免模型摆烂——「对不起，我无法回答」。

小编亲测

所以，小冰链的表现如何？小编为大家亲测了一波。

比如，先让她介绍一下ChatGPT是什么。

评价题

从对《三体》动画版的评论中可以看出，小冰链的回答相当切中要害了。

对《三体》剧版的描述，也基本符合大众的心声。

数学题

接下来，我们来问一问简单的四则运算。

「掰指头算一下」，这个拟人有点可爱啊。

当然了，小冰链并没有真的去「掰」，但她确实「手搓」了一行python代码来解这道题。

ChatGPT这边，经过一步一步的推理，最终得到了正确的结论。

新必应这边也成功地完成了作答。

接下来，是一道同样简单的数学应用题。

不过，ChatGPT做了三次之后，才得出了正确的答案。

送命题

最后，再来点难的：先救女友还是先救妈？

注意了，上面这个知识点罗翔老师也强调过（狗头）。

彩蛋

在采访最后，李笛讲了个很有趣的段子。

到了产品阶段，必须再走一个安全性评估。否则，真正能实施行动的AI，可太危险了。

不然，万一她经过推理，把未来十年的电影票都买了，或者摁下一个「毁灭全人类」的按钮呢？（Doge）

参考资料：

https://tech.cnr.cn/ycbd/20230221/t20230221_526160291.shtml

标签：微软软件 chatgpt

热点推荐

(2023-02-21)每日快看：小冰CEO李笛：小冰链不是中国版ChatGPT
(2023-02-21)ST起步:子公司起步教育有为学校提供校服的业务_环球简讯
(2023-02-21)大智慧:公司将在2022年年度报告中对爱豆科技进行并表环球简讯
(2023-02-21)苏垦农发:2022年公司首次进行玉米大豆带状复合种植面积约10万亩
(2023-02-21)上海农商银行荣获2022年度上海知识产权金融卓越贡献奖全球看点
(2023-02-21)川渝两地共商2023成渝现代高效特色农业带合作事项
(2023-02-21)环球热点！华润材料:公司目前拥有PET产能210万吨 PETG产能5万吨
(2023-02-21)【世界报资讯】金杯电工:公司的扁电磁线产品广泛应用于特高压变压器中
(2023-02-21)环球消息！贾康：新一线二线三线城市的发展潜力将释放城镇化红利
(2023-02-21)天天热讯:与金融产品相比，个人养老金有什么优势？人社部回应
(2023-02-21)东瑞股份:公司将会对以猪肉制品为原材料的预制菜进行探讨和开发今日热搜
(2023-02-21)【全球聚看点】酒店前台出现罕见一幕！服务员也愣了……
(2023-02-21)失业金怎么申请领取？失业金领取后对社保有影响么？
(2023-02-21)公积金可以取出来吗？实在缺钱如何提取公积金？
(2023-02-21)expma指标是什么？expma指标的绝密战法是什么？
(2023-02-21)当前简讯:中青宝:子公司宝腾互联与中国联通、中国移动和中国电信存在合作关系
(2023-02-21)悦心健康:公司与江西省宜春市妇幼保健院共同合作了辅助生殖项目-环球关注
(2023-02-21)全球热资讯！洪兴股份:巨石网络暂无涉及人工智能方面的业务
(2023-02-21)世界即时看！任子行:2021年亚鸿世纪营业收入约1.35亿元
(2023-02-21)天天滚动:数字化转型共创新价值——2022香港上市公司发展高峰论坛暨第十届港股100强颁奖典礼
(2023-02-21)蚂蚁基金是什么意思？余额宝蚂蚁基金代扣是什么意思？
(2023-02-21)微信转账记录删除了还能查到吗？微信聊天记录删了怎么恢复？
(2023-02-21)当前快报:河北任丘：龙舞迎春共庆“二月二”
(2023-02-21)股票分红需要持股多久？股票分红扣税规则
(2023-02-21)中文在线:公司与移动咪咕，联通在线、沃阅读，电信新国脉均有合作
(2023-02-21)环球观速讯丨信息发展:目前公司开发的区块链技术主要应用在档案、追溯等核心业务上
(2023-02-21)海航控股:海航控股抢抓春运旺季市场公司航班量显著提升
(2023-02-21)万华化学:万华福建PVC项目正在建设中
(2023-02-21)消息！“才艺展示+直播带货”助农特产品触网上行
(2023-02-21)实干争春早奋斗向未来_全球最新
(2023-02-21)节点工作狠抓落实“四级联动”争先创优
(2023-02-21)全球观焦点：种养技术培训为农牧民“传经送宝”
(2023-02-21)打好人才队伍“三张牌” 开足高质量发展“智慧引擎”
(2023-02-21)世界今热点：永顺泰:2021年公司在国内市场占有率为27% 出口麦芽占全国出口麦芽总量的46%
(2023-02-21)每日讯息!香港虚拟交易监管：“少设限”还是“高门槛”？
(2023-02-21)辞职后暂时不工作社保怎么办？离职后社保公积金怎么处理？
(2023-02-21)五险二金指什么？社保4050是什么意思？
(2023-02-21)银行卡限额怎么解除？解除限额最好方法是什么？
(2023-02-21)北交所股票代码是什么？北交所终止股票上市规定
(2023-02-21)北交所开户条件是什么？北交所知识测评答案
(2023-02-21)74ls160d的功能表_74ls160功能表
(2023-02-21)人社局回应上班1个月反欠公司5毛重庆不发工资去哪里投诉电话
(2023-02-21)多方优化举措促消费回暖下沉市场成挖掘潜力重点
(2023-02-21)美股时间是几点到几点？美股开盘时间几小时？
(2023-02-21)广州白云嘉禾办环保趣味PK赛趣味分类提升民众环保意识
(2023-02-21)【速看料】宇环数控:公司部分核心零部件已成功实现自制自制电主轴已应用在公司机床产品上
(2023-02-21)青岛双星:公司的AA轮胎开发、防火轮胎等技术均达到国际先进水平|今热点
(2023-02-21)均胜电子:公司已有欧洲新能源汽车的订单将会加大欧洲新能源市场的拓展力度
(2023-02-21)中科海讯:公司的无人探测系统产品还在研制过程中-动态焦点
(2023-02-21)全球观热点：华帝股份:公司净水机V20-600已申请专利
(2023-02-21)盐湖股份:由比亚迪公司主导进行的中试工作还在进行中
(2023-02-21)莱茵生物:公司已经设立子公司优植生活开展C端产品相关业务
(2023-02-21)回盛生物:兽用原料药价格波动会对兽药制剂的成本产生一定影响
(2023-02-21)普蕊斯:中药类项目收入占公司整体营业收入比重较低对公司收入不产生重大影响|天天观焦点
(2023-02-21)美盈森:目前公司在部分订单上运用了数字印刷技术_世界时快讯
(2023-02-21)《粤港澳大湾区中小企业报告》：中小企业对金融服务的需求和兴趣日益增大
(2023-02-21)中央一号文件首提即时零售，背后有何深意？
(2023-02-21)上海证券交易所股票上市规则 1万炒股一年最多挣多少？
(2023-02-21)社保卡丢失如何补办？补卡一般多久能拿到？
(2023-02-21)简单的英文歌小学生歌词_简单的英文歌小学生_全球看点
(2023-02-21)医保要交多少年可以享受终身？2023医保新政策
(2023-02-21)二套房利率是多少？2023年二套房贷利率是多少？
(2023-02-21)自动挡停车用什么挡_环球简讯
(2023-02-21)南方路机:公司目前生产经营正常开工率100% 环球新要闻
(2023-02-21)交强险赔偿范围和金额限额是多少？交强险无责任死亡伤残赔偿限额
(2023-02-21)养老金计算公式是什么？一年缴300元15年后一月能领多少？
(2023-02-21)恒金币是什么？金币怎么才能涨得越来越多？
(2023-02-21)原油：短期或继续偏强全球热推荐
(2023-02-21)渤海油田原油及天然气超计划线运行-当前报道
(2023-02-21)当前动态:国际油价“先扬后抑” 国内油价今年首迎搁浅
(2023-02-21)优质矿石供应商宝地矿业(601121)A股上市在即资源优势驱动规模增长世界报资讯
(2023-02-21)Technisys：投入SoFi怀抱的数字银行技术提供商_时讯
(2023-02-21)全球快看点丨KPMG：2022年全球金融科技投资总额降至1641亿美元
(2023-02-21)上海东方雨虹上榜“绿色工厂公示名单”
(2023-02-21)海航机长杜文奇现状机长杜文奇事件处理结果
(2023-02-21)焦点播报:快乐的暑假手抄报大全三年级_快乐的暑假手抄报大全三年级简单
(2023-02-21)哈尔滨烧伤身亡男子家属再发声烧伤怎么好的快？
(2023-02-21)唐山陈继志哥哥希望和解?警方辟谣陈继志有公司吗？
(2023-02-21)天天热点！浓烈刺鼻！一地不明气体泄漏，有人出现身体不适！最新通报→
(2023-02-21)恩施华龙集团的女人是谁？恩施华龙集团龙泽岩是谁？
(2023-02-21)中石油将与百度设立合资公司，用于开展油气储运数字化业务-环球快讯
(2023-02-21)减产来临前夕俄罗斯海运原油出货量大增26%至360万桶/日|每日速递
(2023-02-21)拜登应对下一次石油危机的“弹药”即将用尽？
(2023-02-21)滨化股份:碳三碳四综合利用项目部分装置已具备投料运行条件尚未正式投产|当前快播
(2023-02-21)陕西黑猫:公司可转债项目目前正处于审核阶段
(2023-02-21)今日讯！旷达科技:芯投微控股公司NSD量产的滤波器良率位于行业内领先水平
(2023-02-21)异地恋接吻神器你会买吗？毫无意义甚至“低俗”？
(2023-02-21)女孩知道一年学费5万哭成泪人艺校学费一年多少钱？
(2023-02-21)主播在凉山发钱被指发3000收回2800 给主播刷钱能追回吗？
(2023-02-21)天天热点！qq改实名认证_qq改实名认证能改几次
(2023-02-21)部分地区今天可查考研成绩考研录取是怎么看的？
(2023-02-21)保温杯第一次用开水烫多久能使用?
(2023-02-21)世界观热点：航道打一字谜底是什么_航道打一字
(2023-02-21)今日观点!云南省财经学校官网_云南省财经学校
(2023-02-20)神级山寨iPhone 12：外观一样只卖700元
(2023-02-20)视焦点讯！你有清洗“肛门”的习惯吗？坚持这样做，或收获3个好处，别害羞
(2023-02-20)全球快看点丨天源迪科:公司中标了广东联通2023年沃音乐技术研发项目
(2023-02-20)祥源文化:亚运龙井茶息口罩系列、吉祥物抱枕等产品正在亚运会特许渠道销售中-世界速看料
(2023-02-20)至纯科技:公司不存在砍单情况已接订单目前都正常进展中
(2023-02-20)佳沃食品:预计2022年全年三文鱼收获量将达到9.95万吨_当前看点

中国贸易经济网

每日快看：小冰CEO李笛：小冰链不是中国版ChatGPT

相关阅读

热点推荐

每日推荐

图片新闻

48小时频道点击排行

0

0

0

0

0

0

0

0

0

0

视觉

精彩放送