南宫(28NG·国际)官方网站-相信品牌力量

师资队伍

马斯克推出Grok-3欲与ChatGPT和DeepSeek角逐｜甲子光年

职　　务：小编

职　　称：

电子邮箱：巴布工程师

科研方向：　　　　近年来▪，人工智能领域的每一次突破似乎都被冠以“世界第一●■•”、▪●“革命性”■、“颠

马斯克推出Grok-3欲与ChatGPT和DeepSeek角逐｜甲子光年

　　近年来▪，人工智能领域的每一次突破似乎都被冠以“世界第一●■•”、★▪●“革命性”■、“颠覆性…•▪”等夸张的标签。从OpenAI的GPT系列到Google的Gemini，再到xAI的Grok-3，每一款新模型的发布都被媒体包装成“改变游戏规则=”的里程碑•■。但真正的科技创新是需要被客观思考的，只有这样才能深入理解其背后的复杂性和实际应用价值。

　　其实不加“世界第一★■◆”=▼★“地表最聪明AI”等定语，也可以开产品开发布会。而当AI被“世界第一”淹没•，我们是否迷失在华丽辞藻中？

　　原标题：《马斯克推出Grok-3★，欲与ChatGPT和DeepSeek角逐｜甲子光年》

　　马斯克解释道：△■•“Grok正在模拟两个不同的行星——地球和火星。绿色的球体代表飞船△●★，在地球与火星之间穿梭。你可以看到从地球到火星的旅程，最终宇航员安全返回。”

　　OpenAI首席执行官萨姆·奥尔特曼（Samuel Altman）随后便在X上隔空回怼：“不了，谢谢。不过如果你愿意的线亿美元的价格收购推特…★。▪=▼”

　　本文为澎湃号作者或机构在澎湃新闻上传并发布•，仅代表该作者或机构观点■•-，不代表澎湃新闻的观点或立场=…-，澎湃新闻仅提供信息发布平台-。申请澎湃号请用电脑访问★•▼。

　　马斯克表示：“Grok-3能减少AI幻觉。”实现方式是反复检查数据并确保逻辑一致，他也透露，Grok-3训练时使用的算力远超之前版本，并大量采用了合成数据。自2023年7月成立xAI以来，xAI先后于2023年11月和2024年8月发布了Grok-1和Grok-2，前者拥有3140亿参数，成为当时参数量最大的开源大模型。

　　自上任以来，马斯克一个接一个地锤向国际开发署、教育部和国土安全部等机构。不仅睡在办公室，还带领为数不多的手下每天工作17小时。其网站称，DOGE近期宣布削减550亿美元开支▼★=。

　　随后他说道，xAI和 Grok的使命就是理解宇宙。“我们希望解答最宏大的问题：外星人在哪里…▪•？生命的意义是什么？宇宙如何终结？”

　　团队透露-，Grok-3的计算能力是前代产品的“10倍以上”•◆▪。据悉，Grok-3是在今年1月初完成预训练，目前还在不断优化中。马斯克表示：“我们每天都在改进模型，所以24小时内能看到进步。”

　　美西时间2月17号•★，埃隆·马斯克（Elon Musk）的人工智能初创公司xAI推出Grok-3模型★，并十分高调地宣称，这是“地表最聪明的AI”=△。

　　就在这个月•◆…，马斯克领导的投资财团向OpenAI提出了974亿美元的收购要约，表示要“将OpenAI重新定位为非营利性研究机构”。根据收购计划…●•，交易后OpenAI会与xAI合并•▼。

　　据xAI最新公开资料显示，在一场针对AGI核心引擎的纯粹盲测中，用户在不知答案来源的情况下提交同一查询，并对两个不同模型的回答进行投票。结果显示，Grok-3的早期版本在这一测试中获得了1,400 ELO分◆▼▪，远超其他竞争对手，如Claude 3和GPT-4等。这一盲测方式仅考察模型本身的推理能力，而非依赖外部数据或提示■-▼。

　　在Grok-3发布之际，不知是否有意为之，奥特曼也在同一日宣布GPT4●▼.5已经进入测试阶段，AGI 的时刻即将来临■，正式发布也指日可待。

　　乍一看，Grok-3似乎已经坐稳了数学推理领域的“头把交椅●…▪”=■。但仔细推敲，这些成绩是否线的绝对领先地位？或许还不能轻易下结论，毕竟测试环境和数据集的选择可能对结果产生影响，单一测试并不能全面反映模型的综合性能。同时Grok-3 Reasoning Beta仍处于测试阶段，稳定性和可靠性尚未经过广泛验证。

　　发布后最后，马斯克预告，或许一周后Grok-3将推出语音模式■■。后面Grok-3将通过xAI的企业API提供和DeepSearch功能◆。

　　给Grok-3的第二个问题是：设计一个结合俄罗斯方块和宝石迷阵玩法的混合游戏。并提示代码可能较长，还要“insanely great”▼▪。经过思考●•，Grok 3设计出了既有俄罗斯方块的消除机制，又有宝石迷阵特点的游戏。

　　他也在直播中表示，★“Grok”的名字来自罗伯特·海因莱因（Robert Anson Heinlein）的小说《异乡异客》●…，主角是在火星上长大的人类▼■•，“Grok”也是一个“火星词”◆◆★，代表充分而深刻地理解事物。

　　同时他也插播了一句：“如果一切顺利，SpaceX 将在未来两年把星舰火箭送往火星，搭载Optimus机器人和Grok。”

　　除了Grok-3=△，xAI还推出了一款名为DeepSearch的新型智能搜索引擎△-。DeepSearch基于Grok-3开发●△，具备推理能力，并提供完整地思考过程■。在演示中，DeepSearch展示了其在研究、头脑风暴和数据分析等场景中的应用潜力。

　　相比之下，DeepSeek-V3的算法优化路径仅使用了2048块英伟达H800 GPU▼=●，耗费了557.6万美元就完成了训练，比同等规模的模型（如GPT-4•●…、GPT-4o、Llama 3▼.1），训练成本大幅降低▼●-。同时，Grok 3还是非开源模型，需要付费。

　　xAI宣布-，Grok-3将于美国当地周一正式推出••，首批体验者为X的Premium Plus订阅用户，同时还推出了名为Super Grok的独立订阅服务，为忠实粉丝提供先进功能和最新特性访问权限■=。

　　“最优秀的人工智能不仅依赖大规模预训练，更需要具备类人推理能力，即能够独立思考解决方案、自我批判●■、验证、回溯…▪▼，并从第一性原理出发◆▼。”根据这一思路，xAI在预训练模型的基础上引入了强化学习，希望进一步推进模型的推理能力。

　　马斯克与三位工程师共同完成了演示▪●，其中左一的工程团队负责人伊戈尔・巴布什金（Igor Babuschkin）■-，原是DeepMind 的高级研究员…△；左二的研究负责人Jimmy Ba是杰弗里·辛顿 (Geoffrey Hinton) 的学生；右二的Tony吴宇怀（Yuhuai Wu）是近期加入团队的成员。

　　首先团队仅输入一行指令，让Grok-3编写代码，生成一段模拟火箭从地球发射、降落火星，并在合适的发射窗口返回地球的3D动画。Grok-3在考虑了开普勒定律后▪■•，不但生成了可以绘制出动画的代码••，还生成了一段模拟火箭发射轨迹的3D动画。

　　Grok-3依托由20万块NVIDIA H100 GPU构建的Colossus超算集群，计算能力是前代Grok-2的10倍-，预训练阶段的消耗相当于一座核电站7%的月发电量▪。Colossus从筹建到上线天，xAI计划将Colossus的规模扩大十倍，整合超过100万块GPU，用以超越谷歌、OpenAI等竞争对手。

　　此外，xAI还推出了一款名为DeepSearch的新型智能搜索引擎。它能搜索网页、查找资料和推测用户意图并思考，并在交叉比对后确保返回正确的信息。

　　xAI表示，Grok-3聪明的原因是它背后依托了Colossus，通过“突破光速…”的研发模式实现了技术飞跃。

　　马斯克与奥尔特曼已经有过多轮法律战和公关战。去年马斯克起诉了奥尔特曼•，OpenAI随后便发布了一篇名为《OpenAI与埃隆·马斯克》的博文回应了指控◆•。马斯克也不甘示弱，在社交媒体上表示如果OpenAI将名称更改为●“ClosedAI•★▪”，他将撤回对其的诉讼。

　　DeepSeek搅动的混天绫，又一次在人工智能的海域卷起了巨浪。让OpenAI、xAI等一众公司都坐不住了◆。