答不上来“9.9和9.11谁大”, 周鸿祎表明 大模子 为什么不识数
【TechWeb】7月18日消息,这两天又一件事吵得沸沸扬扬:包罗 ChatGPT 4o、谷歌Gemini Advanced、Claude 3.5 Sonnet在内的很多 SOTA大模子 王者在答复 “9.9和9.11谁更大”的题目 时纷纷翻车。这让各人 大跌眼镜,人工智能还是 人工智障的说法再次卷土重来。
360首创 人周鸿祎对该热门话题也发表了本身 的观点,他以为 :“不要低估大模子 将来 发展的潜力,但是不要高估大模子 如今 的气力 “,”不要由于 这个事就对大模子 表现 扫兴 。这恰好 阐明 白 着实 大模子 跟人的大脑黑白 常像的,它并不是全能 的。”
同时,周鸿祎还表明 了大模子 为什么不识数、并给出了办理 大模子 不识数题目 的办理 方案。
大模子 为什么不识数?
周鸿祎以为 ,大模子 如今 还是 有很多 的缺点,不认识 “9.11和9.9谁大”,就是一个典范 的例子。
“看了几个大模子 输出的答案,差不多都在颠三倒四 ,为什么呢?”周鸿祎简单 表明 了为什么大模子 会以为 9.1比9.9大。
他以为 :第一个题目 :“着实 大模子 的全称叫大语言模子 ,它起首 办理 的是对人类天然 语言明白 的题目 。以是 大模子 把9.9和9.11并没有当成一个数字来看,而是把它们分成了两个token。没有颠末 专门特别 的提示和练习 ,大模子 是不懂阿拉伯数字,也不懂数学,以是 大模子 是按照一个笔墨 的逻辑来举行 对比。以是 9前面是一样大的,那么11比9要大,以是 就得出来9.11比9.9要大。”
周鸿祎还举了个例子:这就比如 你小时间 上私塾只学了四书五经,一点数学算数都没学。那出一个如许 的小数题你固然 就不会了。
第二个题目 就是对提示词的依靠 。也就是说你跟人工智能提要求的时间 ,假如 都是谈天 呆板 人的界面,你的说法不一样,那大模子 的反应是不一样的。就好像 一个题目 换了种问法,偶然 间 大模子 就很聪明 ,偶然 间 大模子 就很笨。这恰好 阐明 白 通过天然 语言跟大模子 来交换 交互,在有些环境 下是一种非常不靠谱的方式。比如 也有人说换一种问法大模子 就会了,比如 说把9.9和9.11放在前面,再问谁大谁小,而不是先问谁大谁小,然后把9.11和9.9放在背面 。
怎么办理 大模子 不识数的题目 ?
“这也恰好 阐明 白 光靠大模子 是办理 不了企业当局 的很多 实际 的工作和生产上的题目 ,必要 和其他技能 相连合 “,周鸿祎以为 ,着实 办理 这个题目 也很简单 ,有三种做法。
第一种方法,就是要教会大模子 数学,就要把很多 数学知识举行 专门的练习 。就像我们小学上了语文之后,还要学算数一样。有了如许 专门的训如许 的专业模子 ,就可以精确 的答复 这个题目 。
第二个办理 题目 的方法,是像360AI搜刮 一样,就利用 搜刮 和知识推理相连合 。
周鸿祎称,刚才试看了一下360大模子 的答复 ,实际 上也是禁绝 确的。但是跟360AI搜刮 连合 在一起,通过全网搜刮 雷同 的答案,再加上大模子 的明白 ,相称 于是现找答案,然后现教大模子 ,那么答案就是对的。这也就是搜刮 加强 大 概 知识对齐。
第三种方法实际 上调用API。比如 说假如 大模子 可以或许 辨认 这是一个数学题,但是它不会解。不要紧 ,利用 函数调用的方式去调比如 说一个数学网站的API,比如 说有很多 雷同 的这种数学网站,可以正确 的告诉你9.9和9.11谁大谁小。
尚有 一种最简单 的做法,为什么大模子 如今 都要学编程呢?由于 编程就比如 是大模子 给了一个盘算 器,那你出了一道数学题,固然 我不会答复 ,但是假如 我手上有个盘算 器,那我就能答复 。以是 有了大模子 会懂得调pythons语言,用pythons来写一个程序,让pythons来比一下9.11和9.9谁大。固然 了,编程的程序结果 假如 是对的那也会得出精确 的答案。
末了 ,周鸿祎给出了三点总结:
第一,大模子 对天然 语言的明白 是它的底子 。很多 数学物理化学的这些专业知识他并不相识 ,这个很正常。各人 不要惊奇 ,要学习这些知识还必要 专业的模子 练习 。
第二,利用 搜刮 可以把人类拥有的解题的履历 和知识的推理相连合 ,实际 上是一种可以单独用大模子 更有效 的一种方法。
第三,大模子 作为一个谈天 呆板 人,实际 上直接在业务和工作上直接用是不实际 的,肯定 必要 给他增长 各种本领 的补强。比如 说它能调用其他的工具,能本身 编程序来算。实际 上人类也是如许 ,假如 给了人类一个很复杂的一堆数据,让人类凭着本身 的头脑去总结数据的规律,人类也每每 答复 不精确 。但是人类假如 会编程序,大概 手边有一个什么盘算 软件,那么用这个盘算 软件和工具就可以资助 人类得到精确 的答案。以是 大模子 也必要 外部工具的资助 。
”以是 不要由于 这个事儿对大模子 表现 扫兴 。这恰好 阐明 白 着实 大模子 跟人的大脑黑白 常像的,它并不是全能 的。人本日 之以是 能做很多 工作,人本身 是得到了很多 第三方工具的资助 ,包罗 盘算 机,包罗 盘算 器。“周鸿祎夸大 ,”盼望 不要由于 这个事儿丧失你对人工智能的信心。“
相关文章
猜你喜欢
-
算力服务管理成“香饽饽” 慧辰股份发布融合算力管理服务平台
依托数据分析、数据发掘和数据运业务务底子,慧辰股份(维权)开始在智算与AI应用服务范畴布局提速。7月26日,公司发布自研智算服务体系化产物方案,包罗“融合算力管理服务平台”和“慧AI”两款产物。慧辰股份CTO马亮博士告诉记者,不完全统计,近两年在建智算项目有数百家。对于大量...
-
Meta最强大模子 逾越 GPT-4o,扎克伯格再次挑起开闭源之争
界面消息记者|伍洋宇界面消息编辑|宋佳楠 继OpenAI忽然上线一款“小模子”GPT-4omini之后,Meta决定抛出其超大参数的大模子炸场。 7月24日,Meta发布了开源大模子系列Llama3.1405B,以及升级后的70B和8B两个尺寸模子。 Ll...
-
中国信通院正式启动AI大模子 算子适配生态建立 工作
快讯择要【中国信通院正式启动AI大模子算子适配生态建立工作】证券时报e公司讯,据中国信通院CAICT微信公众号,为加快大模子软硬件协同生态构建,推动差别尺寸、范例模子与芯片软件栈、Trito...
-
科大国创在合肥市人工智能生态大会上发布星云大模子
快讯择要【科大国创在合肥市人工智能生态大会上发布星云大模子】证券时报e公司讯,据科大国创消息,7月20日下战书,2024年合肥市人工智能生态大会举行。大会发布了多个大模子建立最新结果及应用,此中...
-
资源 视角下的AI海潮 :关注AI基建带来的体系 性投资机遇
经济观察网记者郑晨烨“我们以为,美国的很多大模子仍处于‘从0到1’的阶段,重要聚焦于一些C端应用范畴,更方向于假造经济或线上经济。相比之下,中国大模子的上风在于可以或许在初次落地后不绝美满和强大。同时,依靠较为完备的积聚,中国在实体经济中举行垂直范...
最新发布
-
200多家公司脱手港股年内回购逾1500亿港元
2024-07-31 -
南山团体 发起部分要约收购 连续看好恒通股份将来 发展
2024-07-31 -
万科拟向苏州高新地产出售合资公司50%股权
2024-07-31 -
小摩下调诺瓦瓦克斯医药评级至“减持”
2024-07-31 -
“白酒股下跌空间已不大!”公募人士不认同瑞银证券看空观点 多家酒企也回应了
2024-07-31