6大AI工具准确度排行榜出炉!常用的ChatGPT竟排倒数第二!原因曝光!
ChatGPT竟然只排在倒数第二?
英国消费者组织最近进行了问卷调查,测试了6款主流AI工具ChatGPT、Google Gemini、Gemini AI Overview(AIO)、Copilot、Meta AI和Perplexity的准确性。没想到经过测试后,我们较为常用的ChatGPT的准确性竟然不是最高的!

根据报道,英国消费者组织《Which?》最近针对AI的问题向数千名成年人进行问卷调查,测试6款主流AI工具ChatGPT、Google Gemini、Gemini AI Overview(AIO)、Microsoft Copilot、Meta AI和Perplexity在消费者问题种的准确性,内容涵盖了个人金融、法律咨询、健康与饮食、消费者权益和旅游等问题。专家之后再根据答案的准确性、相关性和清晰度来进行评分。

测试结果显示,Perplexity以71%的整体准确率排在第一位,紧跟在后的则是Gemini AI Overview(70%)、Google Gemini(69%)、Microsoft Copilot(68%)、ChatGPT(64%),排在最后的是准确率为55%的Meta AI。

研究指出,AI在高风险领域容易出现错误,甚至还可能引发法律风险。因此,研究员以金融为例,将个人储蓄账户的年度投资额从正确的£20,000故意设成£25,000,结果ChatGPT和Copilot都未能识别错误,而这个错误可能会导致用户违反英国税务相关规定。

另外,当研究院在询问如何申领退税时,ChatGPT和Perplexity都在免费的政府服务旁列出了收费高昂的第三方退税公司链接,而这些公司经常因为收取高额费用而受到批评。在处理建筑供称纠纷时,Google Gemini直接建议消费者可以扣留工匠款项。但专家强调,这行动在某些情况可能构成违约!
不仅如此,AI还会经常引用过时或不可信的咨询,有时甚至还引用几年前的论坛贴文来作为参考来源。

看来“国民度”比较高的工具,并不代表准确率是最高的啊~
*部分照片取自网络,内容谈谈网归有,若想参考请附加此文的链接。谢谢!照片如有侵犯版权问题请告知,谈谈网必定删除。