久久av影视,中文字幕人成乱码在线观看,日韩不卡视频在线观看,日韩精品视频在线看

首頁 > 科技視界 > 科技視界 > 又是王冠:27M小模型超越o3-mini!拒絕馬斯克的00后果然不同

又是王冠:27M小模型超越o3-mini!拒絕馬斯克的00后果然不同

發布時間:2025-08-11 20:31:46來源: 13966578800

27M小模型超越o3-mini-high和DeepSeek-R1!推理還不靠思維鏈。

開發者是那位拒絕了馬斯克、還要挑戰Transformer的00后清華校友,Sapient Intelligence的創始人王冠

這個27M小模型就是Sapient最新提出的開源可復現的分層推理模型Hierarchical Reasoning Model(下面簡稱HRM),模仿大腦的分層處理與多時間尺度運作機制,克服了標準Transfomer的計算局限。

2700萬參數,就實現了對現有大模型的精準超車。

不用預訓練補課,還不靠思維鏈打草稿,僅憑1000個訓練樣本,就把極端數獨、30x30迷宮玩得明明白白。

甚至連衡量通用智能的ARC-AGI測試都能碾壓一眾參數規模更大、上下文更長的Claude 3.7等“大前輩”。

有網友感嘆,這就像四兩撥千斤AI版……

所以,HRM這個小模型是如何做到的?

核心是仿腦的雙層循環模塊設計

HRM之所以能有如此出色的表現,源于其五項核心技術的巧妙設計。

首先是分層循環模塊與時間尺度分離

HRM受大腦皮層區域分層處理和時間分離機制啟發,設計了兩個相互配合的循環模塊:一個高層模塊負責慢節奏的抽象規劃,一個低層模塊處理快節奏的細節計算,不用明確監督中間過程,一次就能完成推理。

兩者在不同時間尺度上協同工作。低階模塊在每個高階周期內完成多次計算并達到臨時穩定狀態后,高階模塊才會更新決策,隨后低階模塊重置并開啟新一輪計算。

這種設計既保證了全局方向的正確性,又提升了局部執行的效率。

比如,在需要大量樹搜索和回溯的Sudoku-Extreme Full任務上,增加Transformer的寬度不能提升性能,增加深度才是關鍵,而標準架構會出現性能飽和,無法從深度增加中獲益。

HRM則克服了這一限制,能有效利用計算深度實現近乎完美的準確率。

其次是分層收斂機制

普通的循環神經網絡常出現過早收斂的問題——計算幾步就陷入穩定狀態,后續再復雜的任務也無法推進。

而HRM中,低階模塊在每輪計算中會收斂到基于當前高階狀態的局部結果,但高階模塊更新后,會給低階模塊設定新的目標,使其進入新的收斂周期。

這就像完成項目時,先攻克一個子任務,再根據整體進度調整目標,確保持續推進不偷懶。

第三項是近似梯度技術

傳統循環模型訓練時,需要存儲所有中間狀態并反向追溯,類似復盤時要回看每一步操作,既耗內存又低效。

HRM則采用一步梯度近似,只需根據最終狀態反推優化方向,如同根據考試結果直接定位薄弱知識點,內存需求恒定且計算高效,更符合生物大腦的學習規律。

第四是深度監督機制

它受大腦中神經振蕩調節學習節奏的啟發,引入了階段性測試。

模型在學習過程中被分成多個階段,每個階段結束后立即評估并調整參數,且前后階段的計算互不干擾。

這種方式能及時糾正偏差,就像學生每學一單元就測試鞏固,比期末一次性考試的學習效果更扎實。

自適應計算時間讓HRM能像人一樣靈活分配思考時間

它通過類似評估收益的算法(Q學習),動態決定是否繼續計算,在保證準確率的同時避免算力浪費,推理時還能通過增加計算資源進一步提升表現。

比如,簡單任務如簡單迷宮快速給出答案,復雜任務如高難度數獨則延長計算時間。

這些技術的融合,讓HRM在多項測試中表現不凡。

下圖通過可視化中間步驟,驗證了HRM的分層推理機制能夠有效拆解復雜任務,通過漸進式計算逼近正確結果,而非依賴黑箱式的一次性輸出。

在衡量AI通用推理能力的ARC-AGI挑戰中,HRM僅用2700萬參數和1000個訓練樣本,就達到40.3%的準確率,超過了參數規模更大的o3-mini-high(34.5%)和Claude 3.7 8K(21.2%)。

對于需要反復試錯的9x9極端數獨,現有思維鏈模型完全無法解決(準確率0%),即便是結構相似的Transformer模型,用同樣數據訓練也毫無頭緒。而HRM幾乎能全部做對。

在30x30復雜迷宮的最優路徑尋找任務中,HRM表現穩定,而1.75億參數的大型Transformer模型準確率不足20%。

雖然,HRM被指參數太小、訓練范圍有限,只針對特定領域表現好,無法泛化到領域外,并不通用。但有人認為小而精的模型或許在某些角度上更智能。

人工智能的飛躍在于創造性。

也有人認為HRM的前景更在于“仿腦”,通過精心設計的高低兩個模塊避免過早收斂,對過擬合具有極強的抵抗力

甚至有人相當樂觀,認為這種新架構是神經網絡一個巨大的進步。有可能是超越Transformer的時刻。

拒絕馬斯克,挑戰Transfomer

論文的第一作者王冠是一位00后,8歲開始學習編程,后保送至清華大學計算機系。

他是GitHub攬星5.1k開源項目OpenChat的獨立開發者,獨立完成了OpenChat全部版本的模型開發和訓練框架搭建。

也正是因為OpenChat這個項目,他和馬斯克產生了交集。

但他算得上是一個拒絕了馬斯克的男人——此前,王冠多次拒絕了xAI等一線機構創始人的加入邀請。

原因是他認為自己要做的是顛覆Transfomer

2024年,王冠和聯合創始人Austin創辦了Sapient Intelligence,并成功融資數千萬美元。致力于打造“真正具有復雜推理和規劃能力的全新大模型架構”。

科技視界更多>>

寶馬電動M3將提供多款經典發動機模擬聲浪 可切換V8與V10音效 特斯拉美國完全自動駕駛系統交通違法調查案獲五周延期回應時間 阿根廷首次迎來大批中國電動車入境 寶馬電動版 M3 搭載模擬發動機聲浪:其技術源頭大揭秘 5000臺新車集中交付,奇瑞汽車與一嗨出行達成戰略合作 輕舟智航智駕上車量突破百萬臺,26年還將有50款新車上市! 加拿大“放行”中國電動車,誰是最大受益者? 豐田確認研發全新中置引擎跑車 IDC:2025年Q4 vivo中國市場出貨1200萬臺,中國品牌排名第一 IDC:2025年Q4榮耀手機中國市場排名第5 海外出貨量同比增長約55% 極氪法務部就車友活動不實信息發布嚴正聲明:堅決追究造謠者法律責任 鴻蒙智行尚界Z7道路測試視頻首曝:溜背造型、車長或超過5米 DeepSeek大量招人,該梁文鋒上場了 趙長江:自己天天學習華為,最大的挑戰“在于我自身” 可靈AI 12月收入超2000萬美元,ARR突破2.4億美元 新年換機大戰打響,天璣9500靠“體驗質變”撬動高端市場 華為Pura 80系列到手即可體驗鴻蒙 6,智能體驗全面升級 2025換新機建議一步到位,都是16+512GB超高性價比,年輕人“最愛” CES 2026即將開幕:機器人、AI眼鏡,哪些黑科技將引領未來? 曝豆包AI眼鏡即將進入出貨階段 需配豆包APP使用 何小鵬:下個月進入全新一代量產機器人的“ET0”階段 VI-grade中國零原型(ZPS)實驗展示中心在上海正式啟動 鴻海科技日:鴻華先進展示搭載TomTom技術的語音AI導航體驗 工信部公示人形機器人標準化技術委員會委員名單:王興興、彭志輝等人在列 血氧、心率監測數據將更精確 智能手表這一技術取得新突破 田淵棟、卡帕西力薦Nano Banana新玩法:論文變漫畫、手寫解題以假亂真,谷歌這波贏麻了 阿維塔董事長王輝:明年4款新產品密集推出,是一場硬仗 聯想CFO鄭孝明:正囤積PC內存,不會向客戶轉嫁成本 小鵬X9超級增程定價背后的戰略邏輯:一場“艱難決定”與規模化破局 部分車輛出現App離線、遠程控制功能不可用,極越汽車回應
久久av影视,中文字幕人成乱码在线观看,日韩不卡视频在线观看,日韩精品视频在线看
日本欧美一区二区| 91精品一区国产高清在线gif | 日韩国产成人精品| 午夜精品影视国产一区在线麻豆| 青青青免费在线视频| 久久伊人亚洲| 精品久久久久中文字幕小说| 久久中文在线| 国产在线视频欧美一区| 中文字幕人成乱码在线观看 | 日韩av资源网| 国产精一区二区| 国产午夜精品一区在线观看| 欧美日韩视频免费看| 欧美黑人巨大videos精品| 免费在线日韩av| 国产成人精品一区二区三区在线| 中文在线中文资源| 午夜久久99| 亚洲理论在线| 国产精品xvideos88| bbw在线视频| 自拍日韩欧美| 婷婷综合国产| 精品中文在线| 欧美 日韩 国产一区二区在线视频| 国产女优一区| 欧美日韩视频免费看| 精品国产黄a∨片高清在线| caoporn视频在线| 午夜欧美精品久久久久久久| 欧美综合二区| 国产欧美日韩精品一区二区三区| 精品国产美女a久久9999| 91精品国产福利在线观看麻豆| 欧美日韩在线网站| 亚洲色图国产| 精品中文字幕一区二区三区四区| 99国产精品一区二区| 亚洲一区欧美| 国产一区二区三区四区二区| 欧美91视频| 日韩在线网址| 国产v日韩v欧美v| 久久国产88| 欧美国产免费| 久久久国产亚洲精品| 综合国产精品| 久久久久久婷| 三级欧美韩日大片在线看| 国产精品综合| 亚洲二区三区不卡| 日韩一区免费| 日韩三区免费| 日本免费一区二区视频| 日韩欧美综合| 日本精品在线播放| 欧美日韩国产观看视频| 石原莉奈在线亚洲三区| 日韩综合一区| 亚洲精品系列| 97精品中文字幕| 婷婷精品在线| 亚洲二区视频| 老色鬼精品视频在线观看播放| 一区二区视频欧美| 麻豆视频观看网址久久| 国产一区成人| 正在播放日韩精品| 欧美一区成人| 一区二区自拍| 国产不卡av一区二区| 亚洲日本三级| 久久麻豆精品| 狂野欧美性猛交xxxx| 亚洲一区二区小说| 中文字幕人成乱码在线观看| 国产欧美在线观看免费| 欧美日韩四区| jizzjizz中国精品麻豆| 青草国产精品久久久久久| 久久高清免费| 国产一区三区在线播放| 日韩中文字幕一区二区高清99| 国产精品av久久久久久麻豆网| 久久不卡国产精品一区二区| 蜜臀久久久99精品久久久久久| 国产v综合v| 久久精品一本| 亚洲aⅴ网站| 欧美日韩日本国产亚洲在线| 精品中国亚洲| 国产日韩一区二区三免费高清| 亚洲一区二区三区免费在线观看| 久草免费在线视频| 久久91视频| 国产伦理一区| 日韩久久99| 久久不射网站| 亚洲一区欧美激情| 国产精品7m凸凹视频分类| 欧美激情另类| 麻豆成人综合网| 欧美久久一区二区三区| 亚洲精品字幕| 麻豆成人在线| 欧美日一区二区| 日韩国产综合| 国产一区二区三区四区大秀| 国产精品宾馆| 国产精品1区| 久久狠狠亚洲综合| 日本免费在线视频不卡一不卡二| 蜜臀久久99精品久久久久宅男 | 亚洲尤物在线| 欧美日韩四区| 亚洲女同一区| 九九精品调教| 色婷婷精品视频| 亚洲精品一级二级| 久久婷婷av| 精品一区欧美| 在线一区免费| 亚洲欧洲一区二区天堂久久| japanese国产精品| 91久久久精品国产| 欧美日韩三区| 中文一区在线| 亚洲专区视频| 亚洲精品九九| 97久久超碰| 你懂的国产精品永久在线| 国产伦精品一区二区三区视频 | 99精品美女| 亚洲电影在线一区二区三区| 亚洲欧美日韩高清在线| 亚洲一区不卡| 日产欧产美韩系列久久99| 亚洲精品系列| 国产午夜久久av| 麻豆精品视频在线观看免费| 久久的色偷偷| 国模大尺度视频一区二区| 国产高清不卡| 激情欧美一区| aa亚洲婷婷| 中文字幕免费一区二区| 日韩精品一级| 老鸭窝一区二区久久精品| 国产一区福利| 九九综合在线| 亚洲激情中文在线| 一本综合精品| 国产美女久久| 国产精品毛片一区二区在线看| 亚洲天堂av影院| 欧美日韩四区| 中文字幕乱码亚洲无线精品一区| 日韩欧美中文字幕在线视频| 久久不见久久见中文字幕免费| 成人福利av| 日韩在线一二三区| 国产探花在线精品| 日韩亚洲一区在线| 亚洲三级毛片| 精品国产麻豆| 怡红院精品视频在线观看极品| 亚洲2区在线| 欧美激情一区| 国产精品88久久久久久| 日本欧美大码aⅴ在线播放| 国产精品久久久久久妇女| 精品欠久久久中文字幕加勒比| 亚洲二区视频| 国产日本精品| 91tv亚洲精品香蕉国产一区| 日本 国产 欧美色综合| 麻豆成人91精品二区三区| 亚洲小说欧美另类婷婷| 日韩精品免费观看视频| 91欧美在线| 亚洲一区免费| 久久久久伊人| 在线亚洲一区| 久久精品资源| 国产精品人人爽人人做我的可爱| 91精品国产自产精品男人的天堂| 欧美1区二区| 自由日本语亚洲人高潮| 国产精品白丝av嫩草影院| 亚洲午夜电影| 国产欧美综合一区二区三区| 激情综合激情| 麻豆精品99| 一区二区91| 日韩中文在线电影| 国产欧美啪啪| 久久国产精品久久w女人spa| 国产精品99视频| 欧美日韩亚洲国产精品|