ChatGPT技术探索52:什么是ChatGPT“幻觉”

随着人工智能技术的快速发展,国内外的ChatGPT正在不断提升其生成文本的能力。然而,像所有技术一样,ChatGPT和其他先进人工智能技术也存在缺陷和局限性刷。本部分我们将讨论ChatGPT 的“幻觉”现象,即生成文本时出现的无中生有现象,并探讨其可能存在的问题和解决方法。其目的是通过全面分析这些问题和面临的挑战,为大规模对话语言模型的未来发展提供有益见解,同时帮助读者更好地了解这些模型,以便更好地研究和使用它们,从而为生活和工作带来便利。

ChatGPT 的“幻觉”现象是一柄双刃剑。幻觉(Hallucination)是自然语言生成领域的一个术语,是指模型生成了看似合理但实际上并不存在的文本片段,这些文本片段可能包含虚构的信息、不一致的逻辑甚至是毫无意义的话语。此术语原本是心理学领域的专有名词,用于描述一种特殊类型的知觉体验,即在没有外部刺激的情况下,清醒个体的虚假感觉。简单来说,幻觉是一种不

真实的虚幻感知。机器容易生成流畅但缺乏真实性的文本,这种现象与心理学中的幻觉极为相似,因此研究人员也将其命名为“幻觉”。

以GPT为代表的神经语言模型所生成的文本非常容易出现幻觉。有报道称ChatGPT在生成的文本中大约有15%至20%的内容存在幻觉。幻觉的存在严重影响依赖自然语言生成的下游业务,导致它们无法在某些真实世界场景中满足用户期望。在2023年2月的一次有关ChatGPT的讨论中,图灵奖得主杨立昆提出,生成文本中的事实性问题是生成式AI接下来面临的最重要的科学问题之一。

幻觉可以细分为两类:内在幻觉(Intrinsic Hallucinations)和外在幻觉(Extrinsic Hallucinations)。内在幻觉指的是生成的文本内容与输入的源信息有冲突;而外在幻觉则指生成了与源信息无关的文本。需要注意的是,这些外在幻觉可能与真实世界知识冲突,也可能不冲突。在某些任务中,事实正确的外在幻觉还可能会对其有帮助,它可以引入额外的背景知识和多样化的信息,从而提高生成文本的信息量。在一些任务中,即使事实是正确的,外在幻觉仍被视为额外的风险,需要避免。

在下面这个例子中,笔者让ChatGPT生成了一篇关于夏天的短文,但没有明确规定短文的具体内容。

输入:请生成一篇关于夏天的短文

ChatGPT:夏天是一年中最受欢迎的季节之一。它是阳光明媚、温暖宜人的季节,人们可以享受户外活动和各种夏季乐趣。在夏天,人们可以穿上轻使的衣服,享受户外运动,尝试各种新鲜水果和冰涼饮料。

夏季的早晨总是清新宜人,特别是在郊外或海滨地区,可以听到乌儿的歌声和海浪的声音。白天,太阳高照,温度升高,但这并不会影响人们的热情和活力。人们可以参加各种户外运动,如游泳、烧烤、骑自行车和野餐。这些活动可以让人们放松身心,享受美好时光。

在夏天,新鲜水果和冰镇饮料也是人们喜爱的。各种水果,如草莓、蓝莓、西瓜和葡萄等等,可以在市场上轻松买到。人们还可以品尝各种冰镇饮料,如冰茶、冰咖啡和冰沙等等。这些美食不仅可以满足人们的口腹之欲,还可以帮助人们保持身体健康和清负。

总之,夏天是一个美好的季节,充满了各种乐趣和活动。在这个季节,人们可以尽情享受户外运动、品尝关食、与家人朋友社交,度过一个难忘的夏天。

所有生成的内容中,包括鸟儿的歌声、新鲜的水果、海滩度假等,都是ChatGPT幻想出来的,都是幻觉。这些幻觉是有益的,在写关于夏天的短文时,需要这些细节使文章更生动、更具体。同时,这篇短文中的幻觉是无害的,没有明显的事实性错误,不会误导读者。

而下面这个例子清晰地展示了幻觉的有害性。这篇短文介绍的是成都,同样地,笔者没有给ChatGPT提供关于如何介绍成都的具体信息,介绍内容全是ChatGPT凭记忆“脑补”的。

输入:请生成一篇介绍成都的短文

ChatGPT:成都是中国西南地区的一个历史文化名城,位于四川盆地中部。成都是中国最古老、最繁华的城市之一,拥有丰富的历史文化遗产和关食文化。

成都的历史可以追溯到3000多年前的古蜀国时期。作为古代丝绸之路的重要通道和商业中心,成都是古代文化的重要中心之一。成都也是中国唯一一个拥有三座世界文化遗产的城市,包括都江堰、峨眉山和乐山大佛。这些遗产代表了成都的古代灌溉、佛教文化和自然关景。

除了历史文化遗产,成都还是一个享有盛誉的美食之都。成都菜以其麻辣、浓香和鲜美而闻名于世。著名的川菜包括麻婆豆腐、辣子鸡、水煮鱼等等。成都还有许多小吃和夜市,如春熙路夜市、宽窄巷子、锦里等等,让游客可以尽情品尝到地道的成都关食。

此外,成都还是一个充满活力和文艺气息的城市。成都的音乐、电影、戏剧和艺术活动都非常活跃,吸引了大量的艺术家和文化爱好者。著名的文化场馆包括成都美术馆、成都博物馆和成都音乐厅等等。

总之,成都是一个充满历史、文化和关食的城市。无论你是想了解中国的古代历史,品尝地道的川菜美食,还是欣赏当代文化艺术,成都都值得一游。

虽然ChatGPT给出了很多关于文化,饮食等方面的细节,让整篇文章生动有趣,但是ChatGPT对成都了解有限,生成的内容不可避免地出现了错误的事实,也就是有害的幻觉。首先,“位于四川盆地中部”是错误的,因为成都位于四川盆地的西部;其次,“成都也是中国唯一一个拥有三座世界文化遗产的城市,包括都江堰、峨眉山和乐山大佛。”峨眉山和乐山大佛都在乐山市,距离成都有2个多小时车程。此外,春熙路是成都著名的商业街,但是似乎并没有春熙路夜市。若游客根据这些有误导性的信息前往春熙路寻找夜市,可能会非常失望。

ChatGPT是人工智能,在模仿人的大脑进行对话。如果我们将ChatGPT当成一个真实的人,那么ChatGPT会产生幻觉就正常了。因为我们人类在撰写文本时同样会存在一定程度的“幻觉”,可能是由于错误的记忆或认知导致的对事实的错误描述,也可能是随意下笔导致的词不达意。所以,对于ChatGPT产生幻觉现象在一般情况下并不可怕,只要进一步进行修正就行。但如果ChatGPT产生的幻觉对人类造成伤害才是最可怕的,这就不是修正的问题了。

今天就聊到这里,我想强调一下,我真的不是ChatGPT技术领域的专家,只是因为兴趣,我先一步使用了ChatGPT。所以我希望与各位同仁在讨论区一起探索和学习,共同进步,谢谢。