研究发现:AI搜索引擎查询新闻频出错,超六成答案靠不住

一项最新的研究揭示了AI搜索引擎在处理新闻信息时存在的严重问题。 哥伦比亚新闻评论(CJR)的数字新闻中心对八款具备实时搜索功能的AI工具进行了测试,结果令人担忧:超过60%的新闻查询得到了不正确的答案。 研究发现,不同AI平台的错误率差异显著,其中Grok3的错误率高达94%,ChatGPT Search也达到了67%。

一项最新的研究揭示了AI搜索引擎在处理新闻信息时存在的严重问题。哥伦比亚新闻评论(CJR)的数字新闻中心对八款具备实时搜索功能的AI工具进行了测试,结果令人担忧:超过60%的新闻查询得到了不正确的答案

QQ_1741916033577.png

研究发现,不同AI平台的错误率差异显著,其中Grok3的错误率高达94%,ChatGPT Search也达到了67%。即使是付费版本,如Perplexity Pro和Grok3的高级服务,也更频繁地给出自信但错误的回答。研究人员强调,这些AI模型普遍存在**“自信地错误”**的倾向,即在缺乏可靠信息时,不会拒绝回答,而是编造看似合理的错误答案。

此外,研究还揭示了AI搜索引擎在引用方面的问题。它们常常指向新闻内容的联合发布平台,而非原始出版商的网站。更令人担忧的是,部分AI工具还会捏造无效的URL链接,导致用户无法访问信息来源。例如,Grok3在测试中超过一半的引用链接是失效的。

这些问题给新闻出版商带来了严峻挑战。阻止AI爬虫可能导致内容完全失去署名,而允许抓取则可能面临内容被广泛使用却无法引流回自身网站的困境。时代杂志的首席运营官马克·霍华德对此表达了对透明度和控制权的担忧。

研究人员指出,鉴于目前约四分之一的美国人已将AI模型作为传统搜索引擎的替代品,如此高的错误率令人担忧信息的可靠性。此项研究进一步证实了去年11月发布的类似报告,该报告也指出了ChatGPT在处理新闻内容时存在的准确性问题。尽管OpenAI和微软承认收到了研究结果,但并未直接回应具体问题。

划重点: 

⚠️ AI搜索引擎新闻搜索错误率惊人,超过六成答案不可靠。 

🔗 AI工具引用混乱,常指向转载平台或捏造失效链接

 🤖 付费AI搜索服务也可能更频繁地给出错误答案

相关资讯

超级碗期间,Perplexity 一条推特引爆下载量,增幅高达 50%!

在刚刚过去的超级碗赛事中,AI 搜索引擎 Perplexity 采取了一种与众不同的营销策略,通过一条推特(现称 X)来提升其移动应用的下载量,而没有选择传统的昂贵广告。 Perplexity 的首席执行官阿拉文・斯里尼瓦斯(Aravind Srinivas)在周五发布的推文中,介绍了一个引人注目的比赛,鼓励用户下载其应用,并通过在比赛期间提出至少五个问题来参加有可能赢得100万美元的抽奖。 这一活动不仅有效推动了应用的下载量,也帮助用户更好地了解 Perplexity 的 AI 搜索功能。

阿里巴巴AI搜索引擎Accio用户突破百万 新增AI功能赋能全球贸易

阿里巴巴旗下AI搜索引擎Accio用户数量已于3月11日突破100万里程碑。 该搜索引擎近期推出了一系列新的人工智能功能,旨在为全球贸易中的中小企业提供支持。 根据先前报道,阿里国际于2月28日宣布其面向全球B2B买家的首个AI搜索引擎Accio已接入DeepSeek等先进推理模型,并正式上线深度研究、商业探索等功能。

预定最强 AI:xAI Grok-3 有望下周登场,推理性能超 OpenAI o1

科技媒体 testingcatalog 今天(1 月 27 日)发布博文,报道称 xAI 官方虽然尚未公布,但 Grok-3 已短暂现身独立平台和 X 平台,开启内部测试,有望下周正式发布。