北京时间2月18日中午,马斯克旗下人工智能初创公司xAI正式发布了新一代AI基座大模型Grok 3。马斯克将这款模型称为“地球上最聪明的人工智能”,并称其在数学推理、科学逻辑推理和代码写作等方面超越了包括DeepSeek R1、GPT-4o、Gemini-2 Pro等在内的主流模型。

20 万张卡砸出的,地表最聪明 AI,翻车了吗?
Grok 3的最大特点是引入了“思维链”推理能力,使其能够像人类一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供连贯、有逻辑响应的能力。此外,Grok 3还具备自我纠正机制和强化学习能力,能够通过评估自身输出并优化答案,减少错误并提高准确性。
在发布会上,Grok 3展示了其强大的推理能力。它在2024年美国数学邀请赛(AIME’24)测试中获得52分,超过DeepSeek-V3的39分;在科学知识评估(GPQA)中得分75分,领先于DeepSeek-V3的65分。此外,Grok 3还通过实时演示计算地球到火星的往返轨道和即兴创造全新游戏,证明了其理论推理能力和实际应用转化能力。

20 万张卡砸出的,地表最聪明 AI,翻车了吗?

20 万张卡砸出的,地表最聪明 AI,翻车了吗?
Grok 3的开发得益于全球最大的AI超算Colossus,使用了超过20万张英伟达H100高性能GPU芯片进行训练,计算量是前代Grok 2的十倍。这种大规模的硬件投入使其具备了强大的多模态功能和推理能力。
然鹅......

20 万张卡砸出的,地表最聪明 AI,翻车了吗?

20 万张卡砸出的,地表最聪明 AI,翻车了吗?