!AI 聊器人旧事总结错误率超 50%——这款 AI 最离

2025-05-07 21:51

    

  近日,BBC的一项最新查询拜访了支流AI聊器人正在旧事总结上的惊人错误率。这项研究发觉,包罗OpenAI的ChatGPT、微软的Copilot、谷歌的Gemini和PerplexityAI正在内的AI东西,以至扭曲现实。研究方式取成果 BBC的研究团队拔取了100篇BBC网坐上的旧事报道,要求这些AI生成摘要。评估成果显示,51%的AI生成回覆存正在严沉错误,包罗现实不精确、错误援用和过时消息。此中,谷歌的Gemini表示最差,错误率高达60%。19%的AI回覆呈现了现实错误,例如错误的日期、数字和事务描述。13%的回覆则对BBC内容进行了不妥改动,以至援用了原始报道中底子不存正在的消息。最严沉的错误包罗:Gemini错读NHS指南,声称NHS晦气用电子烟戒烟,而现实上NHS是支撑的。ChatGPT和Copilot还供给了过时的消息,错误地声称已离任的里希·苏纳克和尼古拉·斯特金仍担任要职。行业回应取担心 BBC旧事取部分CEO Deborah Turness对研究成果暗示担心。她指出,虽然AI充满潜力,但目前的旧事总结使用存正在庞大风险。她呼吁AI开辟者收回相关东西,并取行业合做,提高通明度和精确性。OpenAI讲话人回应称,他们努力于支撑出书商和创做者,然而,这些勤奋似乎尚未显著改善成果。将来影响取挑和 这项研究凸显了AI正在旧事范畴使用的庞大挑和。错误消息不只信赖,还可能激发社会危机。BBC生成式AI打算总监Pete Archer强调,AI公司需取行业慎密合做,确保消息实正在性。结论:AI需要更严酷的监管和改良 跟着AI快速渗入各行各业,AI必需加强现实核查机制,并取公司合做,确保消息的精确性。若是无法供给靠得住的旧事消息,AI能否适合用于旧事?这值得我们深思。正在AI东西日益普及的今天,我们用户选择颠末严酷测试的产物,如搜狐的简单AI,以确保生成内容的精确性和靠得住性。

福建美丽鸟信息技术有限公司


                                                     


返回新闻列表
上一篇:AI最新相关旧事 下一篇:中美AI争霸巴黎上演:中国逆袭破局美国孤掌难鸣