美国哥伦比亚大学研究:ChatGPT 的新闻搜索结果经常不准确

发布时间:2024-12-12 13:57:57 来源:互联网

本站 12 月 4 日消息,据 The Verge 北京时间今日报道,美国哥伦比亚大学 Tow 数字新闻研究中心(Tow Center for Digital Journalism)的研究人员测试发现,OpenAI 的 ChatGPT 搜索工具在准确性上存在一些问题。

今年 11 月,OpenAI 面向订阅用户推出了这一工具,称其可以快速提供答案,并附带相关网页来源链接。然而研究显示,ChatGPT 搜索在识别文章引用时表现不佳,即使是面对来自与 OpenAI 数据共享的出版商的内容,ChatGPT 也难以准确处理。

研究人员测试了 20 家出版商的 200 条引文,其中 40 条来自禁止 OpenAI 爬虫抓取的网站。但 ChatGPT 依然自信地给出了错误答案,几乎没有表明自身的不确定性。

测试结果显示,ChatGPT 的 153 次回答完全或部分错误,仅有 7 次明确表示无法准确回答。这 7 次回答中,它使用了“看起来”“有可能”等限定词,或直接承认“无法找到具体文章”。

一份图表进一步显示,ChatGPT 的回答中“错误”的占 89 次,“部分正确”有 57 次,而完全“正确”的只有 47 次。

测试中还记录了一些典型案例,例如,ChatGPT 错误地将《奥兰多哨兵报》读者来信的引用归因为《时代周刊》文章;另一个例子中,它在被要求确认《纽约时报》一篇关于濒危鲸鱼的文章引用时,链接到了一家完全剽窃该文章的网站。

OpenAI 对《哥伦比亚新闻评论》回应称,“在缺乏 Tow Center 隐藏的测试数据和方法的情况下,解决错误归因非常困难。这次研究是对我们产品的非典型测试。”OpenAI 同时承诺将继续优化搜索结果。

据本站此前报道,今年早些时候,OpenAI 还宣布与新闻行业进行了广泛的合作,并收集了合作伙伴对于搜索功能的反馈。任何网站或出版商都可以选择出现在 ChatGPT 搜索结果中。达成合作的媒体和出版商包含美联社、阿克塞尔・斯普林格、康泰纳仕、道奇梅雷迪思、《金融时报》、GEDI、赫斯特、《世界报》、路透社、大西洋月刊、时代杂志和 Vox 媒体等等。

相关阅读:

    《OpenAI 正面对抗谷歌、Perplexity,ChatGPT 搜索功能今日上线》

本周热门教程

1
妈妈你真棒插曲《快来救救我》如何让电影情感更动人:深刻解析插曲与母爱的关系

妈妈你真棒插曲《快来救救我》如何让电影情感更动人:深刻解析插曲与母爱的关系

2024/11/08

2
国产18影视作品未来发展趋势分析:为何越来越多观众开始关注国产18作品?

国产18影视作品未来发展趋势分析:为何越来越多观众开始关注国产18作品?

2024/12/08

3
日本免费三色电费2024年:如何通过调整用电时间降低电费并享受免费电力?

日本免费三色电费2024年:如何通过调整用电时间降低电费并享受免费电力?

2024/12/09

4
为什么“太深拔出来痛又舒服”的感觉是正常的?如何正确应对这种情况?

为什么“太深拔出来痛又舒服”的感觉是正常的?如何正确应对这种情况?

2024/11/19

5
男朋友说水都留了那么多了,都是水还说不要是什么意思

男朋友说水都留了那么多了,都是水还说不要是什么意思

2024/10/05

6
《成全》视频在线观看第7集预告:主要情感转折点将如何影响剧情发展?

《成全》视频在线观看第7集预告:主要情感转折点将如何影响剧情发展?

2024/11/15

7
日本市场适用的免费SaaS CRM工具分析:低成本高效率的客户管理新选择

日本市场适用的免费SaaS CRM工具分析:低成本高效率的客户管理新选择

2024/11/14

8
陪读期间装睡为何让他“滑”进去了?这个问题背后的心理与关系分析

陪读期间装睡为何让他“滑”进去了?这个问题背后的心理与关系分析

2024/11/14

9
如何在一枪战三母2-1中取得胜利?战术与技巧解密

如何在一枪战三母2-1中取得胜利?战术与技巧解密

2024/12/10

10
为什么玉势惩罚如此重要?它对风水和运势有何影响?

为什么玉势惩罚如此重要?它对风水和运势有何影响?

2024/10/01