IMG-LOGO

xAI推出Grok 4模型,创下行业新标杆

- 2025-09-07 09:53:45 3 Views


xAI 再次迈出重大步伐,推出 Grok 4,这是其基础系统的最新版本,该公司宣称其为「全球最强大的 AI 模型」。

最新款机型在准确性和相关性方面达到了新的行业基准,在各种任务上的表现远超人类思维水平。

Grok 4 构建于 xAI 的「巨像」数据集群之上,这意味着它能够利用多达 20 万块英伟达 H100 GPU 来为其响应提供动力。这是一个巨大的计算能力,不过在这方面,xAI 的总体潜在计算能力仍落后于 Meta(据报道,Meta 拥有约 60 万块 GPU 以及自己的 AI 芯片)。


然而,即便如此,正如所提到的,Grok 4 在多项人工智能性能测试中取得了创纪录的高分,其中包括 ARC-AGI 和「人类的终极考试」,后者涵盖了数百个学科的 2500 道题目。

据报道,Grok 4 在其大多数测试中都达到了顶级水平,而 X 的所有者埃隆·马斯克称赞该模型是他迄今为止见过的功能最强大、最有价值的人工智能体验。

按照马斯克的说法:「Grok 4 已经达到了这样一种程度,即除非题目设计得极具对抗性,否则它几乎不会答错数学/物理考试题。它能够识别题目中的错误或歧义,然后修正题目中的错误,或者回答有歧义题目的每一种变体。据我所知,这是首次有 AI 能够解决那些答案在互联网或书籍上都找不到的困难的、现实世界的工程问题。」

因此,Grok 4 的表现相当不错,这或许能为 xAI 的巨额估值以及其快速的支出提供正当理由,马斯克的这家人工智能初创公司正努力成为更广泛的人工智能竞赛中的真正参与者,并击败埃隆·马斯克都讨厌的 OpenAI 和 Meta,从而在整体市场中占据主导地位。

尽管打败他们会很困难。

如前所述,Meta 的技术能力仍远超 xAI,而 OpenAI 至少从消费者的角度来看,市场影响力要大得多。

ChatGPT 已成为人工智能应用的代名词,xAI 的 Grok 在这方面要超越它会很困难,尤其是 X(Grok 的主要访问入口)仍在不断流失用户。

不过 Grok 确实有自己的独立应用程序,xAI 正在寻求达成协议,将 Grok 作为新的人工智能项目的底层操作系统。这可能还包括政府操作系统和改进措施,这是马斯克在政府效率部(DOGE)的前团队正在寻求实施的。但话说回来,马斯克最近与特朗普总统的争执可能会对此产生不利影响,这可能会严重阻碍 xAI 的盈利机会。

但如果 Grok 4 真如 xAI 所宣称的那样表现出色,那么或许达成交易就不会是那么大的问题,不过马斯克近期对 xAI 代码的干预,以及将 Grok 变成种族主义的扩音器,无疑也会削弱人们对该系统的信心。

这似乎确实是一个特点,而非缺陷。

在评估 Grok 4 回答查询所采取的步骤时,似乎该过程确实会参考马斯克的想法,并将其纳入回应之中。



Grook 4 的回应


这相当令人担忧,马斯克更看重自己的言论而非他人的,这可能会极大地影响 Grook 的回应。

这是否会最终削弱 xAI 的营收潜力,并影响到 X 的人工智能项目以及如今已成为 xAI 一部分的 X 平台?这似乎很有可能。鉴于 xAI 据称估值达 1130 亿美元,如果 Grok 不能大幅超出预期,实在难以想象它究竟如何能撑得起如此高的估值。

在这方面,X 公司还为 Grok 访问权限推出了新的定价层级,以此作为从该项目中获取更多收益的手段。



Grok 4 基准


正如您在此概览中所见,「超级 Grok」访问权限每月收费 30 美元,面向普通大众,而 X 还为更大规模的项目新增了「超级 Grok 重型」层级。

SuperGrok Heavy 将并行运行多个 Grok 系统,然后比较它们的响应以选出最佳结果。xAI 表示,这有助于生成更准确的响应,不过对于大多数用例来说,SuperGrok 就已经足够了。

基本上,如果 Grok 4 真如 Grok 所宣称的那样出色,那么它可能会成为该公司的一个重要盈利点,并为 xAI 带来更多收入。而如果 xAI 赚的钱更多,那么 X 平台就不必那么依赖广告收入了,不过这也可能意味着 X 会放松其审核措施,从而影响输入 Grok 的数据质量,降低其价值。

我不知道,似乎这里面的变量太多,不能完全依赖 Grok 4 作为基础的人工智能模型,但话说回来,如果它能达到这些已指出的基准,也许这就不重要了。

哦,还有,Grok 也将应用于特斯拉汽车。

也许这将是 xAI 另一种赚钱的方式,即在特斯拉汽车销售中加入 xAI 的订阅费。

鉴于马斯克的 AI 项目迄今引发的各种争议,我仍会对对其寄予过多信任持谨慎态度,但 Grok 4 的初步性能数据至少值得一看。