Meta最强大模子 逾越 GPT-4o,扎克伯格再次挑起开闭源之争
界面消息 记者 | 伍洋宇
界面消息 编辑 | 宋佳楠
继OpenAI忽然 上线一款“小模子 ”GPT-4o mini之后,Meta决定抛出其超大参数的大模子 炸场。
7月24日,Meta发布了开源大模子 系列Llama 3.1 405B,以及升级后的70B和8B两个尺寸模子 。
Llama 3.1 405B被以为 是当前最强的开源大模子 。根据Meta公布的信息,该模子 上下文长度支持128K,增长 了对八种语言的支持,在通用知识、可操控性、数学、工具利用 和多语言翻译等方面可以或许 与GPT-4o和Claude 3.5 sonnet等旗舰模子 相媲美,乃至 在人工评估(Human Evaluation)的比力 中,其总体表现 比这两个模子 更好。
同时,8B和70B两个型号的升级版本也是多语言的,而且 都拓展到了128K上下文长度。
Llama 3.1 405B是Meta迄今为止最大的模子 。Meta表现 ,该模子 的练习 涉及高出 15万亿tokens,为了在公道 时间内到达 抱负 结果 ,团队优化了整个练习 堆栈,利用 了高出 16000个H100 GPU——这也是第一个在云云 大规模算力下完成练习 的Llama模子 。
这个艰巨 的练习 目标 被团队拆分为多个关键步调 。为了最洪流 平 包管 练习 稳固 性,Meta没有选择MoE架构(肴杂 专家架构),而是采取 了标准 仅解码器的Transformer模子 架构举行 小幅调解 。
据Meta先容 ,团队也利用 了迭代的后练习 过程,对每一轮举行 监督 微调和直接偏好优化,为每个回合创建最高质量的合成数据,以进步 每种本领 的性能。与此前版本的Llama相比,团队提拔 和改进了用于练习 前、后的数据数量 和质量。
在Llama 3.1 405B炸场的同时,马克·扎克伯格发表了一篇题为“开源AI是进步 的蹊径 ”的宣言,再次夸大 开源大模子 的意义与代价 ,剑锋直指OpenAI等走上闭源蹊径 的大模子 公司。
扎克伯格重提开源Linux与闭源Unix的故事,以为 前者支持更多功能和更广泛的生态体系 ,而且 是云盘算 和运行大多数移动装备 操纵 体系 的行业标准 底子 。“我信托 人工智能也会以雷同 的方式发展。”
他指出,几家科技公司在开辟 领先的闭源大模子 ,但开源大模子 正在敏捷 缩小这一差距。最直接的证据是,Llama 2此前只能与掉队 的老一代模子 相比,但Llama 3已经可与最新模子 相提并论,并在某些范畴 得到 领先。
他预计,从来岁 开始,Llama 3就能成为业内开始 辈 的模子 ——而在此之前,Llama已经在开放性、可修改性和本钱 服从 方面处于领先职位 。
扎克伯格引用了很多 来由 叙述 为什么这个天下 必要 开源模子 ,称对开辟 者而言,除了更透明的开辟 环境 以更好练习 、微调和提炼他们本身 的模子 ,另一个紧张 因素是“必要 一种既高效又负担得起的模式”。
他表明 道,对于面向用户和离线的推理任务 ,开辟 职员 可以在本身 的底子 办法 上运行Llama 3.1 405B,本钱 约莫 是GPT- 4o等闭源模子 的50%。
围绕开源、闭源两大蹊径 之争,此前业界已有过多番讨论,但当时 的重要 基调在于,两者各有代价 ,开源可以或许 以高性价比的方式惠及广大开辟 者,而且 有利于大语言模子 自身的技能 迭代与发展,而闭源可以或许 会合 资源更快、更深突破性能瓶颈,比开源更有望率先告竣 AGI(通用人工智能)。
换句话说,业界广泛 以为 ,在模子 的性能程度 上,开源很难追上闭源。而Llama 3.1 405B的出现大概 会让行业重新思考 这一结论,很大概 将影响一大批已经倾向于利用 闭源模子 服务的企业和开辟 者群体。
如今 ,Meta的生态圈已经非常巨大 。Llama 3.1模子 上线后,高出 25个相助 搭档 将提供相干 服务,包罗 亚马逊AWS、英伟达、Databricks、Groq、戴尔、微软Azure和谷歌云等。
只是扎克伯格对于Llama系列模子 处于领先职位 的预期是来岁 ,不打扫 中心 有再被闭源模子 掀翻屋顶的大概 。在此期间,外界大概 会纷纷关注到那些性能程度 赶不上Llama 3.1 405B的闭源大模子 ,它们当前的处境简直 有些尴尬。
他还特别 谈及中国与美国在大模子 范畴 的竞争,以为 美国在这方面永久 领先中国数年是不实际 的。但纵然 是几个月的微小领先,也会随着时间的推移而“聚沙成塔 ”,从而使美国得到 “显着 上风 ”。
“美国的上风 是去中心 化和开放式创新。有些人以为 ,我们必须封闭我们的模式,以防止中国得到 这些模式,但我以为 这行不通,只会让美国及其盟友处于倒霉 职位 。”在扎克伯格看来,一个只有封闭模式的天下 ,会导致少数大公司和地缘政治对手可以或许 得到 领先的模式,而初创公司、大学和小企业则错失机遇 。别的 ,将美国创新限定 在封闭开辟 中,增长 了完全无法领先的大概 性。
“相反,我以为 我们最好的战略 是创建 一个强大 的开放生态体系 ,让我们的领先公司与当局 和盟友密切相助 ,以确保他们可以或许 最好地利用 最新盼望 ,并在长期 内实现可连续 的先发上风 。”扎克伯格表现 。
相关文章
猜你喜欢
-
黄仁勋、扎克伯格“与子同袍”
经济观察网记者钱玉娟北京时间7月30日,在美国丹佛举行的SiGGRAPH2024(2024年国际盘算机图形与交互技能顶会)上,美国科技公司Meta的CEO扎克伯格与芯片巨头英伟达CEO黄仁勋交换后,互换了外套。 扎克伯格为黄仁勋定制了一件玄色皮衣外套,黄仁勋则将对话...
-
算力服务管理成“香饽饽” 慧辰股份发布融合算力管理服务平台
依托数据分析、数据发掘和数据运业务务底子,慧辰股份(维权)开始在智算与AI应用服务范畴布局提速。7月26日,公司发布自研智算服务体系化产物方案,包罗“融合算力管理服务平台”和“慧AI”两款产物。慧辰股份CTO马亮博士告诉记者,不完全统计,近两年在建智算项目有数百家。对于大量...
-
马斯克时隔一年再提“约架” 扎克伯格回应:又来?
泉源:财联社 客岁炎天,两位顶级科技大佬马斯克和扎克伯格“约架”大戏一度成为热门话题,但这场对决终极未能上演。时隔一年后,马斯克再次提出乐意和扎克伯格比力一番,只是这一次扎克伯格好像并不筹划接招。 以色列总理内塔尼亚胡周三在美国国会大厦发表了发言,马斯克也前去国会...
-
中国信通院正式启动AI大模子 算子适配生态建立 工作
快讯择要【中国信通院正式启动AI大模子算子适配生态建立工作】证券时报e公司讯,据中国信通院CAICT微信公众号,为加快大模子软硬件协同生态构建,推动差别尺寸、范例模子与芯片软件栈、Trito...
-
科大国创在合肥市人工智能生态大会上发布星云大模子
快讯择要【科大国创在合肥市人工智能生态大会上发布星云大模子】证券时报e公司讯,据科大国创消息,7月20日下战书,2024年合肥市人工智能生态大会举行。大会发布了多个大模子建立最新结果及应用,此中...
最新发布
-
200多家公司脱手港股年内回购逾1500亿港元
2024-07-31 -
南山团体 发起部分要约收购 连续看好恒通股份将来 发展
2024-07-31 -
万科拟向苏州高新地产出售合资公司50%股权
2024-07-31 -
小摩下调诺瓦瓦克斯医药评级至“减持”
2024-07-31 -
“白酒股下跌空间已不大!”公募人士不认同瑞银证券看空观点 多家酒企也回应了
2024-07-31