当前位置：首页 / 时时快讯 / Meta最强大模子逾越 GPT-4o，扎克伯格再次挑起开闭源之争

Meta最强大模子逾越 GPT-4o，扎克伯格再次挑起开闭源之争

分类：时时快讯 2024-07-24 31

界面消息记者 | 伍洋宇

界面消息编辑 | 宋佳楠

　　继OpenAI忽然上线一款“小模子 ”GPT-4o mini之后，Meta决定抛出其超大参数的大模子炸场。

　　7月24日，Meta发布了开源大模子系列Llama 3.1 405B，以及升级后的70B和8B两个尺寸模子。

Meta最强大模型超越GPT-4o，扎克伯格再次挑起开闭源之争

　　Llama 3.1 405B被以为是当前最强的开源大模子。根据Meta公布的信息，该模子上下文长度支持128K，增长了对八种语言的支持，在通用知识、可操控性、数学、工具利用和多语言翻译等方面可以或许与GPT-4o和Claude 3.5 sonnet等旗舰模子相媲美，乃至在人工评估（Human Evaluation）的比力中，其总体表现比这两个模子更好。

　　同时，8B和70B两个型号的升级版本也是多语言的，而且都拓展到了128K上下文长度。

　　Llama 3.1 405B是Meta迄今为止最大的模子。Meta表现，该模子的练习涉及高出 15万亿tokens，为了在公道时间内到达抱负结果，团队优化了整个练习堆栈，利用了高出 16000个H100 GPU——这也是第一个在云云大规模算力下完成练习的Llama模子。

　　这个艰巨的练习目标被团队拆分为多个关键步调。为了最洪流平包管练习稳固性，Meta没有选择MoE架构（肴杂专家架构），而是采取了标准仅解码器的Transformer模子架构举行小幅调解。

　　据Meta先容，团队也利用了迭代的后练习过程，对每一轮举行监督微调和直接偏好优化，为每个回合创建最高质量的合成数据，以进步每种本领的性能。与此前版本的Llama相比，团队提拔和改进了用于练习前、后的数据数量和质量。

　　在Llama 3.1 405B炸场的同时，马克·扎克伯格发表了一篇题为“开源AI是进步的蹊径 ”的宣言，再次夸大开源大模子的意义与代价，剑锋直指OpenAI等走上闭源蹊径的大模子公司。

　　扎克伯格重提开源Linux与闭源Unix的故事，以为前者支持更多功能和更广泛的生态体系，而且是云盘算和运行大多数移动装备操纵体系的行业标准底子。“我信托人工智能也会以雷同的方式发展。”

　　他指出，几家科技公司在开辟领先的闭源大模子，但开源大模子正在敏捷缩小这一差距。最直接的证据是，Llama 2此前只能与掉队的老一代模子相比，但Llama 3已经可与最新模子相提并论，并在某些范畴得到领先。

　　他预计，从来岁开始，Llama 3就能成为业内开始辈的模子 ——而在此之前，Llama已经在开放性、可修改性和本钱服从方面处于领先职位。

　　扎克伯格引用了很多来由叙述为什么这个天下必要开源模子，称对开辟者而言，除了更透明的开辟环境以更好练习、微调和提炼他们本身的模子，另一个紧张因素是“必要一种既高效又负担得起的模式”。

　　他表明道，对于面向用户和离线的推理任务，开辟职员可以在本身的底子办法上运行Llama 3.1 405B，本钱约莫是GPT- 4o等闭源模子的50%。

　　围绕开源、闭源两大蹊径之争，此前业界已有过多番讨论，但当时的重要基调在于，两者各有代价，开源可以或许以高性价比的方式惠及广大开辟者，而且有利于大语言模子自身的技能迭代与发展，而闭源可以或许会合资源更快、更深突破性能瓶颈，比开源更有望率先告竣 AGI（通用人工智能）。

　　换句话说，业界广泛以为，在模子的性能程度上，开源很难追上闭源。而Llama 3.1 405B的出现大概会让行业重新思考这一结论，很大概将影响一大批已经倾向于利用闭源模子服务的企业和开辟者群体。

　　如今，Meta的生态圈已经非常巨大。Llama 3.1模子上线后，高出 25个相助搭档将提供相干服务，包罗亚马逊AWS、英伟达、Databricks、Groq、戴尔、微软Azure和谷歌云等。

　　只是扎克伯格对于Llama系列模子处于领先职位的预期是来岁，不打扫中心有再被闭源模子掀翻屋顶的大概。在此期间，外界大概会纷纷关注到那些性能程度赶不上Llama 3.1 405B的闭源大模子，它们当前的处境简直有些尴尬。

　　他还特别谈及中国与美国在大模子范畴的竞争，以为美国在这方面永久领先中国数年是不实际的。但纵然是几个月的微小领先，也会随着时间的推移而“聚沙成塔 ”，从而使美国得到 “显着上风 ”。

　　“美国的上风是去中心化和开放式创新。有些人以为，我们必须封闭我们的模式，以防止中国得到这些模式，但我以为这行不通，只会让美国及其盟友处于倒霉职位。”在扎克伯格看来，一个只有封闭模式的天下，会导致少数大公司和地缘政治对手可以或许得到领先的模式，而初创公司、大学和小企业则错失机遇。别的，将美国创新限定在封闭开辟中，增长了完全无法领先的大概性。

　　“相反，我以为我们最好的战略是创建一个强大的开放生态体系，让我们的领先公司与当局和盟友密切相助，以确保他们可以或许最好地利用最新盼望，并在长期内实现可连续的先发上风。”扎克伯格表现。

模子伯格

上一篇：医药贸易概念股震荡拉升，开开实业午后涨停

下一篇：传美国医疗用品巨头Medline思量 2025年上市估值或达500亿美元

猜你喜欢

全部评论（0）

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

Meta最强大模子逾越 GPT-4o，扎克伯格再次挑起开闭源之争

相关文章

猜你喜欢

黄仁勋、扎克伯格“与子同袍”

算力服务管理成“香饽饽” 慧辰股份发布融合算力管理服务平台

马斯克时隔一年再提“约架” 扎克伯格回应：又来？

中国信通院正式启动AI大模子算子适配生态建立工作

科大国创在合肥市人工智能生态大会上发布星云大模子

最新发布

热门文章

随机推荐

热门标签

Meta最强大模子 逾越 GPT-4o，扎克伯格再次挑起开闭源之争

相关文章

猜你喜欢

黄仁勋、扎克伯格“与子同袍”

算力服务管理成“香饽饽” 慧辰股份发布融合算力管理服务平台

马斯克时隔一年再提“约架” 扎克伯格回应：又来？

中国信通院正式启动AI大模子 算子适配生态建立 工作

科大国创在合肥市人工智能生态大会上发布星云大模子

最新发布

热门文章

随机推荐

热门标签

Meta最强大模子逾越 GPT-4o，扎克伯格再次挑起开闭源之争

中国信通院正式启动AI大模子算子适配生态建立工作