ChatGPT 的心理治疗能力通过图灵测试 竟优于人类专家!

最近的一项研究显示,受试者在区分 ChatGPT 与人类治疗师的心理治疗反应时,遇到了很大的困难。 研究表明,AI 的回答往往被认为比专业人士的回答更具同理心。 这项研究应用了经典的图灵测试,旨在评估人类能否识别与机器还是与其他人互动。

最近的一项研究显示,受试者在区分 ChatGPT 与人类治疗师的心理治疗反应时,遇到了很大的困难。研究表明,AI 的回答往往被认为比专业人士的回答更具同理心。这项研究应用了经典的图灵测试,旨在评估人类能否识别与机器还是与其他人互动。研究人员邀请了830名参与者,要求他们判断18对夫妻治疗案例中,哪些反应来自于 ChatGPT,哪些来自于经验丰富的人类治疗师。

QQ_1739773197743.png

根据发表在《PLOS 心理健康》上的研究结果,参与者在识别治疗反应的过程中,表现仅略高于随机猜测。人类治疗师的反应被正确识别的比例为56.1%,而 ChatGPT 的反应为51.2%。这项研究还发现,ChatGPT 在治疗质量的多个维度上表现优于人类专家,包括治疗联盟、同理心和文化适应性。

ChatGPT 能够取得如此成绩的原因有很多。AI 系统通常会提供更长的回答,语气更积极,并且在回答中使用更多的名词和形容词,这些特点使得其反应显得更加详细和富有同理心。然而,研究还发现,受试者在认为自己正在阅读 AI 生成的反应时,往往会对其评分较低,而当他们错误地认为 AI 的回答来自人类治疗师时,这些 AI 的反应会获得更高的评价。

研究者指出,虽然这项研究的发现令人振奋,但也有重要的局限性。他们使用的都是简短的假设性治疗场景,而非真实的治疗过程。此外,他们也质疑这一结果是否适用于个体咨询。

尽管如此,随着对 AI 在治疗领域潜力的进一步证据积累,研究人员强调,心理健康专业人士需要了解这些系统。他们呼吁,临床工作者必须小心地训练和监控 AI 模型,以确保提供高标准的护理。

目前,关于 AI 在咨询角色中的能力,已有多项研究得出相似的结论。一项来自墨尔本大学和西澳大学的研究显示,ChatGPT 在社交困境中的建议比人类专栏作家更具平衡性、全面性和同理心。

不过,尽管 AI 的表现优于人类,大多数参与者仍倾向于选择人类顾问。在澳大利亚的研究中,有77% 的受访者表示,他们更愿意接受人类的建议。虽然 AI 在医疗诊断中的回应同样被认为更具同理心和质量,但斯坦福大学和德克萨斯大学的研究者提醒,在心理治疗中使用 ChatGPT 时要保持谨慎,他们认为大语言模型缺乏真正的 “心智理论”,无法体验真正的同理心,并呼吁建立国际研究项目,以制定 AI 在心理学中安全整合的指导方针。

划重点:  

🧠 AI 心理治疗的研究显示,ChatGPT 与人类治疗师的反应难以区分。  

💬 ChatGPT 在治疗质量上得分高于人类专家,尤其在同理心和文化适应性方面。  

⚠️ 尽管 AI 表现优秀,但研究者呼吁在心理治疗中谨慎使用,强调 AI 缺乏真正的同理心。

相关资讯

​研究显示 ChatGPT 在心理治疗反应评分中优于专业心理治疗师

根据2025年2月12日发表在《PLOS 心理健康》期刊上的一项研究,来自俄亥俄州立大学的 H. Dorian Hatch 及其团队发现,ChatGPT 生成的心理治疗回应通常被评定得更高。 这项研究引发了人们对机器是否能够担当心理治疗师的广泛关注,尤其是在生成性人工智能的优势愈发明显的背景下。

AI 在心理治疗领域获认可,ChatGPT 展现超凡同理心

近期,一项研究表明,OpenAI 的 ChatGPT 通过了心理治疗领域的图灵测试,显示出其在提供心理咨询建议时,竟然比人类治疗师更具同理心。 这一研究成果来自科技媒体 The Decoder 的最新报道。 研究团队邀请了830名参与者,要求他们对比 ChatGPT 与人类治疗师的回复。

GPT-4能「伪装」成人类吗?图灵测试结果出炉

纯文本对话,安能辩我是 AI?在测试 AI 时,图灵测试是一个饱受争议但也久负盛名的评估方法,因此总会有研究者不畏繁琐,对新兴的语言模型进行图灵测试。近日,对 GPT-4 的图灵测试结果新鲜出炉了。                                 此图由AI生成「机器能够思考吗?」为了解答这个问题,图灵设计了一个能间接提供答案的模仿游戏。该游戏的最初设计涉及到两位见证者(witness)和一位审问者(interrogator)。两位见证者一个是人类,另一个是人工智能;他们的目标是通过一个纯文本的交互