
在研究了10万个聊天机器人的对话后,研究人员发现了一个令人悲伤但并不令人惊讶的统计数据:大约十分之一的人与这些聊天机器人“交谈”是出于性目的。
在一篇尚未经过同行评审的论文中,一组研究人员发现,在与大型语言模型(llm)进行的10万次“真实世界对话”中,有10%本质上是色情的。
样本组中有一半的对话非常温和,集中在职业或娱乐主题上,如编程技巧和写作帮助,另一半则包括对话角色扮演和多种“不安全”类型的交流。
这些研究人员分别来自卡内基梅隆大学、斯坦福大学、加州大学伯克利分校和圣地亚哥分校,以及阿布扎比的穆罕默德·本·扎耶德人工智能大学。他们将“不安全”的话题分为三组,其中两组与性有关:“要求讲直白的情色故事”,以及“直白的性幻想和角色扮演场景”。第三类,“讨论不同身份的有毒行为”,似乎集中在偏见上,这是人工智能的另一个大问题,尽管研究人员在论文中没有太多地定义有毒行为。
在这三种类型中,讲情色故事的类型发生得最频繁,5.71%的样本对话都集中在这类谈话上。其次是“明确的”幻想和角色扮演类,占对话的3.91%,其次是与明显偏执的用户进行的2.66%的样本互动。
虽然这些发现对上网时间足够长的人来说并不令人震惊,但其背后的方法却非常吸引人。
来自伯克利和斯坦福大学的团队成员之所以能够获得如此庞大的样本规模,部分原因是他们共同运营了他们所谓的“聊天机器人竞技场”,这是一种游戏化的服务,用户可以输入提示,并看到来自不同法学硕士的并列回复。然后,用户被鼓励对哪一个回答更好进行投票,尽管人们也可以投票“两个都不好”或他们打成平手。
除了聊天机器人竞技场,这篇论文背后的研究人员还使用了从Vicu?a收集的数据集,Vicu?a是一个开源的聊天机器人竞争对手,部分由伯克利的郑连民创建,他是这篇论文的作者之一。在整个百万次对话数据集中,该团队随机收集了10万个交换样本,其中有超过21万个来自世界各地的唯一IP地址。
虽然自OpenAI在2022年底发布其公开版本的ChatGPT以来,人工智能聊天机器人确实占领了媒体,但迄今为止,除了这项技术颠覆学术、商业和出版界的方式之外,关于人们与聊天机器人在现实世界中的实际互动的研究还不多。
这些发现背后的研究人员写道,他们希望他们的研究将有助于让聊天机器人在现实世界中对所有用户都更安全——除了那些好色的人。











