近日,艾伦研究机构(Allen Institute)成员林禹臣在X平台上发文指出,ChatGPT-4在回答数学问题时出现了严重错误,认为13.11比13.8更大。此事引发了广泛关注,360公司创始人周鸿祎也在其个人账号发布视频,针对这一现象进行了详细评论和分析。
#### AI的数学常识性难题
林禹臣指出,“ChatGPT-4在回答中认为13.11比13.8更大。一方面,AI越来越擅长解决复杂的数学奥赛题,但另一方面,在处理常识性问题时依旧存在困难。”这一评论揭示了当前大模型在处理基础数学常识时的不足,即便它们在复杂数学运算中表现出色,但在简单数值比较上却可能出现错误。
#### 周鸿祎的解释
周鸿祎在视频中解释了大模型的工作原理和现有问题。他指出,“大模型的全称是大语言模型,它首先解决的是对人类自然语言理解的问题。”大语言模型(如ChatGPT)主要目的是理解和生成自然语言文本,并不是专门设计用于数学运算。
他进一步解释道,“大模型在处理数字时,并没有将9.9和9.11当成完整的数字来看,而是将它们分成了多个token进行处理。在没有经过专门提示和训练的情况下,大模型按照语言逻辑进行对比,而不是数值逻辑。”这就导致了模型在处理某些数值比较问题时会出现错误。
#### 解决方案
针对这一问题,周鸿祎提出了三种可能的解决方案:
1. **专门的数学训练**:通过对大模型进行专门的数学训练,可以提高其处理数值和数学问题的准确性。专门的训练能够让模型更好地理解和处理数值比较,减少常识性错误。
2. **搜索匹配答案**:通过搜索与已有答案进行匹配,可以利用已有的数据库提高模型的准确性。这种方法能够快速获取正确答案,但依赖于外部数据的准确性和完整性。
3. **调用外部函数或程序**:在处理数值计算时,调用外部函数或专门的计算程序是确保准确性的有效方法。这种方法能够绕过大模型在数值比较上的局限性,直接获取正确结果。
周鸿祎的分析和建议为解决大模型在处理数学常识问题上的不足提供了清晰的思路。他强调,通过适当的训练和外部工具的结合,可以显著提高大模型在数值比较和数学运算中的准确性。
#### 未来展望
此次事件揭示了当前AI技术在处理常识性问题时的局限性,也反映了大语言模型在设计和应用上的一些不足。然而,随着技术的不断进步和改进,AI在处理数学问题上的表现将会越来越好。通过专门训练和技术手段的结合,我们有理由相信,未来的大模型将能够更准确地理解和处理各种数值比较问题,为用户提供更可靠的答案。
这次的“比大小翻车”事件,不仅是对AI技术的一次考验,也为AI技术的发展指明了改进方向。在不断学习和优化的过程中,大模型终将成为更加智能和可靠的助手,广泛应用于各个领域,服务于人类的各项需求。
声明:本文仅为传递更多网络信息,不代表质流科技资讯观点和意见,仅供参考了解,更不能作为投资使用依据。