2025-12-21 22:47 点击次数:77


Grok-3 讲授了「黎曼揣摸」了?
xAI 推敲员 Hieu Pham 周末发布的一条推文在 AI 圈掀翻山地风云,推文原话是这样说的:
Grok-3 AI 系统刚刚讲授了黎曼揣摸(Riemann ’ s hypothesis)。为了考证这一讲授的正确性,咱们决定暂停该系统的西宾。若是讲授被证明无误,咱们将不再不绝其西宾,因为这样的 AI 被以为过于智能,可能对东谈主类组成挟制。
老法例,先说论断,这单纯等于玩梗良友。
斟酌词,跟着推文的握住发酵,如故速即激发了杰出两百万网友的关爱与操办,以致发射到海表里的 AI 公论圈。
事情的起源大纲目纪念到网友 Andrew Curran 更早些时辰的一则「爆料」,其宣称 Grok-3 在西宾经过中发生了厄运性事件。

随后,多样离奇的传言连续无间。
网友起哄说,OpenAI CEO Sam Altman 用强大的激光器瞄准了 xAI 的最大西宾集群,导致数据严重损坏;也有东谈主煞有介事地透露有东谈主筹算顺心下一代 LLM 西宾驱动。
更有簸弄称,AI 似乎获取了自我意志,并管理了黎曼揣摸,但在讲授代码中「成心概略了 15 个分号」,使东谈主类无法考证。

连 Runway 首创东谈主 Crist ó bal Valenzuela 也来凑吵杂:
Gen-4 刚刚荣获了包括最好影片在内的统共奥斯卡奖项。为了深入推敲其在艺术范畴的创新着力,咱们决定暂停对其进行的西宾。若是这部电影照实如早期评述家所言具有立异性,咱们将不会还原西宾,因为这标明 AI 在艺术方面如故达到如斯高的水平,以至于可能挟制到东谈主类的创造力。
坏话就这样越传越邪乎。
多位 xAI 推敲东谈主员也纷纷转发 Andrew Curran 推文,加入这场集体「大团建」。
比如咱们的老熟东谈主 xAI 联创 Greg Yang 率先簸弄谈,Grok-3 在西宾经过中转眼殴打办公室里年长的保安。

另一位推敲东谈主员 Heinrich Kuttler 则透露:「是的,情况很是糟糕!咱们自后用 nan(Not a Number,非数)把统共特殊的权重齐替换了一遍,才还原。」
虽然,更感性的网友平直在 X 上究诘刻下版块的 Grok 对黎曼揣摸的相识,果不其然, Grok 的阐发十分「玛卡巴卡」。

最终,这场闹剧由始作俑者—— xAI 推敲员 Hieu Pham 躬行画上句号:
好的,《周六夜现场》收尾了。至于为什么讲授黎曼假定是危境的,我锋利推选马特 · 海格(@matthaig1)的精彩演义《东谈主类》。
那么问题来了,为什么这则 Grok-3 讲授黎曼揣摸的音书能引起平方的关爱呢?领先是黎曼揣摸自己的要紧性。
黎曼揣摸(Riemann Hypothesis)是数学中一个对于素数永别的要紧揣摸,由德国数学家伯恩哈德 · 黎曼于 1859 年建议,该揣摸被列为克雷数学推敲所(Clay Mathematics Institute)的「千年顾惜」之一。

它波及到黎曼 ζ 函数(Riemann zeta function),这个函数界说为:
ζ ( s ) =1+12s+13s+14s+ ⋯ zeta ( s ) = 1 + frac{1}{2^s} + frac{1}{3^s} + frac{1}{4^s} + cdots ζ ( s ) =1+2s1+3s1+4s1+ ⋯
黎曼揣摸的中枢内容是:统共非世俗的黎曼 ζ 函数零点的实部齐等于 1/2。换句话说,若是 ss 是黎曼 ζ 函数的一个非世俗零点,即 ζ ( s ) =0 ζ ( s ) =0,那么其实部必定是 ℜ ( s ) =1/2 ℜ ( s ) =1/2。
克雷数学推敲所说了,若是有东谈主简略得胜讲授黎曼揣摸,将奖励 100 万好意思元的奖金。但这个揣摸于今莫得被讲授或反驳,也被平方以为是当代数论中的一个未解之谜。

这个揣摸的讲授对于数论(数学的一个分支)有着潜入的影响。
面前,好多当代加密时代(比如保护网上支付、数据诡秘等)齐依赖于素数的性质。讲授黎曼揣摸或将会让东谈主类更好地相识这些时代的基础,而况可能影响到未来的安全算法。
假如 Grok-3 能讲授黎曼揣摸,这不仅将鼓舞表面数学、物理学、密码学等范畴的大幅进展,同期将象征着 AI 在推理和管理复杂问题方面的强大越过。
以致不错说,这将成为东谈主工智能超越东谈主类智能的一个象征性事件。

月之暗面首创东谈主杨植麟曾透露,数学场景是进修 AI 念念考才气最梦想的场景。
数学是一个极其严谨的逻辑体系,而 AI 的推理才气经常建树在严实的逻辑推导之上。
AI 管理数知识题的经过本色上是一个持续念念考的历程,在这个经过中,它会握住尝试不同念念路,通过反复试错来寻找正确谜底。即便诡计经过中出现不实,AI 也能通过考证和校对来蜕变收尾。

访佛的理念也体面前 OpenAI o1 的强化学习西宾上。
若是说畴前的大模子是学习数据,o1 更像在学习念念维。就像咱们解题,不仅要写出谜底,也要写出推理经过。一起题目不错死记硬背,但学会了推理,才能举一反三。
是以在本年好意思国针对优秀高中生的 AIME 试验当中,GPT-4o 仅完成了百分之十三的题目。比较之下,o1 的正确率高达 83 个百分点。
就博士水准的 GPQA Diamond 科研测评而言,GPT-4o 获取了 56.1% 的得益,而 o1 的阐发更为出色。不仅胜过了东谈主类博士的 69.7%,更是达到了 78% 的正确率。

在国际信息学奥赛 ( IOI ) 的评测中,当每谈题允许 50 次尝试时,模子达到了 49% 的得分率,即 213 分,而当每题提交契机增至一万次时,其最终得分普及至 362 分。
拿击败围棋宇宙冠军的 AlphaGo 类比,就愈加容易相识了。
AlphaGo 等于通过强化学习西宾的,先使用大齐东谈主类棋谱进行监督学习,然后与我方对弈,每局对弈证据赢输得到奖励或者处分,握住普及棋艺,以致掌抓东谈主类棋手想不到的智商。

o1 和 AlphaGo 有一样之处,不外 AlphaGo 只可下围棋,o1 则是一个通用的大讲话模子。
o1 学习的材料,可能是数学题库、高质地的代码等,然后 o1 被西宾生成解题的念念维链,并在奖励或处分的机制下,生成和优化我方的念念维链,握住提高推理的才气。
这其实也解释了,为什么 OpenAI 强调 o1 的数学、代码才气强,因为对错比较容易考证,强化学习机制简略提供明确的响应,从而普及模子的性能。
虽然,更要紧的是怎么将这种推理才气拓展愚弄到更平方的范畴中。
是以咱们会看到不少外洋网友为 Grok-3 讲授黎曼揣摸喜跃,「若是是这样的话,咱们确切在见证一个强大的打破。」

马斯克曾屡次在公开方位渲染 Grok-3 的刚劲,他宣称 Grok-3 展望在年底前问世,并将成为「宇宙上最刚劲的 AI」。
实验上,Grok-3 是由上头提到的 AI 初创公司 xAI 斥地的第三代大型讲话模子,并展望在性能上预期将超越现存的统共 AI 大模子。
原因在于 Grok-3 西宾背后依托的是面前宇宙上最大的 AI 西宾集群—— Colossus。

这个集群由 10 万个液冷英伟达 H100 GPU 组成,弃取单一的 RDMA 蚁集互连架构。这个集群的范围如故超越了面前宇宙上任何其他的超等诡计机,而且未来还将持续扩张 GPU 数目。
证据 The Information 的报谈,Colossus 的出现以致引起了 Altman 的密切关爱,后者派飞机飞越 Colossus 西宾基地,试图窥伺其斥地进展和动力供应情况。

是以说,当「最强 AI」、「千年数学顾惜」和以及长盛不衰的「AI 挟制论」这三重元素重叠,一场完整的「坏话风暴」就此变成。
以致咱们不错以为,Grok-3 讲授黎曼揣摸的坏话,与其说是一场闹剧,不如说是统共这个词 AI 行业的一面照妖镜:
其一是折射出东谈主们对 AI 的深层作风,大齐时代乐不雅派信托 AI 终将无所弗成,既惦记它发展得太快会失控,又发怵它发展得不够快无法完了打破。
其二是自 GPT-4 问世以来,尽管 AI 范畴握住有新产物暴露,却鲜有确切的打破性进展。
东谈主类既是 AI 的创造者,却又成了它最慌乱的不雅众。

每一个 AI 坏话的背后,齐藏着统共这个词行业的慌乱与期待。
加之最近闹得沸沸扬扬的 Scaling Law 发展撞墙论,比较旧年的井喷期,本年的「创新疲顿」让东谈主们对模子的小步改进毅然失去耐烦。
在这个有趣有趣上,Grok-3 讲授黎曼揣摸的坏话也成了东谈主们对未来的一次集体遐想。哪怕行为普通用户,咱们也越来越期待下一个从 GPT-3.5 到 GPT-4 的质变时刻。
虽然,确切的 AI 打破,经常发生在统共东谈主齐不看好的时辰。
但咱们齐但愿这个谜底能在年底前揭开开云kaiyun。
Powered by kai云体育app官方下载app最新版本-kai云体育app官方登录入口 @2013-2022 RSS地图 HTML地图