当前位置:首页  /  时时快讯  /  答不上来“9.9和9.11谁大”, 周鸿祎表明 大模子 为什么不识数

答不上来“9.9和9.11谁大”, 周鸿祎表明 大模子 为什么不识数

分类:时时快讯 28

【TechWeb】7月18日消息,这两天又一件事吵得沸沸扬扬:包罗 ChatGPT 4o、谷歌Gemini Advanced、Claude 3.5 Sonnet在内的很多 SOTA大模子 王者在答复 “9.9和9.11谁更大”的题目 时纷纷翻车。这让各人 大跌眼镜,人工智能还是 人工智障的说法再次卷土重来。

360首创 人周鸿祎对该热门话题也发表了本身 的观点,他以为 :“不要低估大模子 将来 发展的潜力,但是不要高估大模子 如今 的气力 “,”不要由于 这个事就对大模子 表现 扫兴 。这恰好 阐明 白 着实 大模子 跟人的大脑黑白 常像的,它并不是全能 的。”

同时,周鸿祎还表明 了大模子 为什么不识数、并给出了办理 大模子 不识数题目 的办理 方案。

大模子 为什么不识数?

周鸿祎以为 ,大模子 如今 还是 有很多 的缺点,不认识 “9.11和9.9谁大”,就是一个典范 的例子。

“看了几个大模子 输出的答案,差不多都在颠三倒四 ,为什么呢?”周鸿祎简单 表明 了为什么大模子 会以为 9.1比9.9大。

他以为 :第一个题目 :“着实 大模子 的全称叫大语言模子 ,它起首 办理 的是对人类天然 语言明白 的题目 。以是 大模子 把9.9和9.11并没有当成一个数字来看,而是把它们分成了两个token。没有颠末 专门特别 的提示和练习 ,大模子 是不懂阿拉伯数字,也不懂数学,以是 大模子 是按照一个笔墨 的逻辑来举行 对比。以是 9前面是一样大的,那么11比9要大,以是 就得出来9.11比9.9要大。”

周鸿祎还举了个例子:这就比如 你小时间 上私塾只学了四书五经,一点数学算数都没学。那出一个如许 的小数题你固然 就不会了。

第二个题目 就是对提示词的依靠 。也就是说你跟人工智能提要求的时间 ,假如 都是谈天 呆板 人的界面,你的说法不一样,那大模子 的反应是不一样的。就好像 一个题目 换了种问法,偶然 间 大模子 就很聪明 ,偶然 间 大模子 就很笨。这恰好 阐明 白 通过天然 语言跟大模子 来交换 交互,在有些环境 下是一种非常不靠谱的方式。比如 也有人说换一种问法大模子 就会了,比如 说把9.9和9.11放在前面,再问谁大谁小,而不是先问谁大谁小,然后把9.11和9.9放在背面 。

怎么办理 大模子 不识数的题目 ?

“这也恰好 阐明 白 光靠大模子 是办理 不了企业当局 的很多 实际 的工作和生产上的题目 ,必要 和其他技能 相连合 “,周鸿祎以为 ,着实 办理 这个题目 也很简单 ,有三种做法。

第一种方法,就是要教会大模子 数学,就要把很多 数学知识举行 专门的练习 。就像我们小学上了语文之后,还要学算数一样。有了如许 专门的训如许 的专业模子 ,就可以精确 的答复 这个题目 。

第二个办理 题目 的方法,是像360AI搜刮 一样,就利用 搜刮 和知识推理相连合 。

答不上来“9.9和9.11谁大”, 周鸿祎解释大模型为什么不识数

周鸿祎称,刚才试看了一下360大模子 的答复 ,实际 上也是禁绝 确的。但是跟360AI搜刮 连合 在一起,通过全网搜刮 雷同 的答案,再加上大模子 的明白 ,相称 于是现找答案,然后现教大模子 ,那么答案就是对的。这也就是搜刮 加强 大 概 知识对齐。

第三种方法实际 上调用API。比如 说假如 大模子 可以或许 辨认 这是一个数学题,但是它不会解。不要紧 ,利用 函数调用的方式去调比如 说一个数学网站的API,比如 说有很多 雷同 的这种数学网站,可以正确 的告诉你9.9和9.11谁大谁小。

尚有 一种最简单 的做法,为什么大模子 如今 都要学编程呢?由于 编程就比如 是大模子 给了一个盘算 器,那你出了一道数学题,固然 我不会答复 ,但是假如 我手上有个盘算 器,那我就能答复 。以是 有了大模子 会懂得调pythons语言,用pythons来写一个程序,让pythons来比一下9.11和9.9谁大。固然 了,编程的程序结果 假如 是对的那也会得出精确 的答案。

末了 ,周鸿祎给出了三点总结:

第一,大模子 对天然 语言的明白 是它的底子 。很多 数学物理化学的这些专业知识他并不相识 ,这个很正常。各人 不要惊奇 ,要学习这些知识还必要 专业的模子 练习 。

第二,利用 搜刮 可以把人类拥有的解题的履历 和知识的推理相连合 ,实际 上是一种可以单独用大模子 更有效 的一种方法。

第三,大模子 作为一个谈天 呆板 人,实际 上直接在业务和工作上直接用是不实际 的,肯定 必要 给他增长 各种本领 的补强。比如 说它能调用其他的工具,能本身 编程序来算。实际 上人类也是如许 ,假如 给了人类一个很复杂的一堆数据,让人类凭着本身 的头脑去总结数据的规律,人类也每每 答复 不精确 。但是人类假如 会编程序,大概 手边有一个什么盘算 软件,那么用这个盘算 软件和工具就可以资助 人类得到精确 的答案。以是 大模子 也必要 外部工具的资助 。

”以是 不要由于 这个事儿对大模子 表现 扫兴 。这恰好 阐明 白 着实 大模子 跟人的大脑黑白 常像的,它并不是全能 的。人本日 之以是 能做很多 工作,人本身 是得到了很多 第三方工具的资助 ,包罗 盘算 机,包罗 盘算 器。“周鸿祎夸大 ,”盼望 不要由于 这个事儿丧失你对人工智能的信心。“

猜你喜欢

全部评论(0
评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。