记者看出了ChatGPT的知识盲区 竟然是《狂飙
发布日期: 2024-07-31    作者: 通知公告

  央广网北京2月8日消息(记者卜叶 黄昂瑾)最近,一款新聊天工具ChatGPT火了,可以聊天、写作、编程、翻译,还可以质疑和拒绝你的要求。自2022年11月底推出以来,ChatGPT慢慢的变成了历史上增长最快的消费者应用程序之一。ChatGPT的狂飙突进引来谷歌、百度等众多互联网巨头的跟进,马斯克还在社会化媒体发文感慨:“很多人疯狂地陷入了ChatGPT循环中”。

  央广网记者2月7日下午登录OpenAI官网体验,超高的人气使得网页不断提示过载,ChatGPT还写诗、编笑话为等待的“顾客”解闷儿。

  国内某高校计算机专业教授试用后和记者说,“感觉语言流畅度还行,属于大众比较能接受和理解的那种智能”。

  网友体验后感慨“太夸张了这个AI,真的和以往用的都不一样”“我感觉ChatGPT是我用过最聪明的智能机器人,其回答内容的行文风格是最像人的,结构清晰,有条理”,有的网友还做了一番比较,自己写的文章还没有ChatGPT好。不过,还有网友说,“这个还不错,但是它真的会胡编”“你得到的答案可能听起来非常权威,但很可能是完全错误的”。

  近日,在国内某互联网公司工作的小光(化名)告诉央广网记者,他通过公司内网的代理接口试用了ChatGPT这款产品。“我现在的浅度体验感受是,它能说些人话,也能做些基本对话,属于乍一看挺能唬人的,但是仔细看内容是比较容易发现问题。”

  2月7日,在接受央广网采访过程中,小光围绕近期备受观众追捧的反黑刑侦剧《狂飙》进行了提问,几轮问答下来,ChatGPT几乎都是“答非所问”。

  当输入问题“能用200字评价一下电视剧《狂飙》吗”,约半分钟后,ChatGPT出现了一段回答,对了解这部电视剧内容的用户来说,从回答的第一句话便能看出问题:“《狂飙》……描述了一名即将被发光的音乐家的穿越路程。”且不说语句是否通顺,其对于该电视剧的主体内容的描述就有极大的偏差。

  为了让问题更有明确的目的性,小光再次输入“能用200字评价一下张颂文主演的电视剧《狂飙》吗”,ChatGPT回答道:“《狂飙》是一部以80年代社会风貌为背景……《狂飙》中,张颂文扮演的范友角色,让观众看到一个青春、热血、充满了许多活力与勇气的形象,他站在青春的角度去看待病毒社会,做出了可嘉的努力,他的作为激发了观众的正能量”。事实上,在《狂飙》中,张颂文饰演的角色名为高启强,是一个从倍受欺负的鱼贩子逐渐偏离正途、最终成为当地黑恶势力头目的角色。

  类似地,小光在先后输入“能否用200字评价一下张颂文主演的电影《伟大的胜利》”和“怎样评价肖申克的救赎这一部优秀的电影”时,两次回答中都出现了对张颂文所饰角色的介绍,后者的回答称:“《肖申克的救赎》是一部将灵魂拷问和精神解放结合到一起的著名电影,其中张颂文饰演的安迪·格兰特是一位具有坚韧不拔的精神和非凡智慧的囚犯……”

  如何形容ChatGTP此次实现的应用?网友笑评,“一个死记硬背者所能达到的顶峰”。为此,华数机器人副总经理冯小童告诉央广网,ChatGPT所采用的底层逻辑并非新技术,ChatGPT在新知识、新创造方面的能力稍弱,发散性、逻辑性不是特别好,但在基于人类反馈的强化学习方面有所创新,通过人工智能建模,让机器人的知识、认知等与人类同步。可以说,建模的逐渐完备,“聊天”场景的引入,让这一技术更有趣、生动的同时更富吸引力。

  据了解,ChatGPT主要是基于人类反馈的强化学习技术(RLHF)和预训练语言模型(PLM)两大技术结合实现。PLM是在大规模语料库上以自监督方式来进行预训练的语言模型,而全新引入的RLHF技术则是一种将模型与人类的意图进行同步的学习策略,其设计思路是通过收集人类对于特定任务的合理反馈,学习拟合人类反馈的奖励模型,结合强化学习进行迭代,最终实现通用模型对特定任务的掌握。

  “‘模仿学习+强化学习’的变革性学习范式是ChatGPT成功的关键。”中国科学院自动化研究所研究员王金桥说。

  王金桥介绍,ChatGPT目前为止仅支持文本到文本的自然语言生成的方式,即人类提供文本输入,ChatGPT提供对应回复,而浏览器通常能够给大家提供图片等多样化查询功能,以及图、文、音视频等多模态形式的对应回复;此外,ChatGPT的回答通常比较单一、普适化,在目标问题不是特别明确的情况下并不一定使用户得到满足的搜索需求,也没办法提供多样化选择供用户进一步明确需求,离传统浏览器功能还有一定距离。

  冯小童表示,尽管现阶段ChatGPT只能基于知识库做一些常规的文学创作等,但毋庸置疑的是ChatGPT在替代浏览器方面展现出强大潜力,并且随技术的发展ChatGPT有望替代一部分浏览器。

  面对ChatGPT的爆火,北京大学信息科学技术学院教授黄铁军表示,此前行业内也推出过微软小冰、Siri等聊天程序。但直到现在,计算机还不能像真人一样聊天。ChatGPT的走红不完全是技术因素,ChatGPT第一次让人类感受到AI在互动交流、文案撰写方面达到了跟人类接近的水平,这就吸引了慢慢的变多的人进行尝试。

  王金桥告诉央广网,ChatGPT的突然爆火实际上标志着智能计算范式的彻底改变,敲开了通用AI的大门。近年来,以GPT-3、ChatGPT为代表的大模型技术所取得的显著成果表明,增大模型规模和数据规模是突破现有人工智能技术应用瓶颈行之有效的方法。ChatGPT的成功标志着从以专用小模型训练为主的“手工作坊时代”到以通用大模型预训练为主的“工业化时代”的AI研究范式转变。

  他认为,这一转变具有十分重要的意义。通过先进的算法架构、可能多的数据,汇集大量算力,集约化的训练模式,由此得到的通用大模型可在大范围的应用场景下通过极低代价的模型微调实现高性能的任务适配,使人工智能技术的先进能力更好、更有效地应用到各个场景里面,从而大幅度的降低开发成本,加速产业高质量发展。“ChatGPT的出现为AI产业注入了新的活力,同时也极大促进了通用AI的发展。”王金桥说。

  冯小童认为,一直以来,产学研用都在寻找人工智能新的突破口、增长点,ChatGPT非常关注是AI发展的必然结果。对行业来说,ChatGPT的走红既是一种助力也是一大挑战,一方面它有望为社会带来一场变革,另一方面人类与科技的关系需要去平衡。

  ChatGPT的爆火,也促使众多互联网巨头纷纷宣布了其聊天机器人推出计划。

  据报道,谷歌2月6日透露计划推出一款聊天机器人Bard。Bard是基于对话应用语言模型(LaMDA)的实验性人工智能程序,将与OpenAI开发的人工智能服务ChatGPT形成直接竞争。

  面对国际领域的投资热情,国内也不甘示弱,百度版ChatGPT“文心一言”3月份完成内测并向公众开放。2月7日,三六零在投资者互动平台表示,公司计划尽快推出类ChatGPT技术的demo版产品……

  黄铁军表示,聊天机器人的底层技术并非新技术,大家目前集中在体验上下功夫,这也是ChatGPT最大的创新处。他提醒,先发者有先发优势,同时市场容量有限,就像搜索引擎一样,全世界范围内使用频率高的搜索引擎只有为数不多的几个,经过竞争可能只有屈指可数的大模型生态生存下来,支撑纷繁多样的应用蓝海,包括场景+聊天机器人、应用+聊天机器等,例如养老场景下聊天机器人发挥陪伴、照拂作用,办公软件与聊天机器人技术的融合让办公更高效……