內(nèi)地低成本高效的AI模型DeepSeek,推出后震撼科技界后,有AI教母之稱的美籍華裔科學(xué)家李飛飛,率領(lǐng)其團(tuán)隊(duì)僅花了20美元及26分鐘,便創(chuàng)造出一個(gè)“s1”的AI推理模型,表現(xiàn)媲美OpenAI o1和DeepSeek R1等尖端推理模型。
▲李飛飛及其團(tuán)隊(duì)只用了20美元,便創(chuàng)出效能媲美DeepSeek R1的新AI模型。路透社
▲李飛飛是斯坦福大學(xué)首位紅杉講席教授。Stanford University
▲DeepSeek的估值存在巨大分歧,估值區(qū)間在10億美元到1550億美元之間。路透社
僅用16塊H100 GPU訓(xùn)練
綜合外媒報(bào)道,李飛飛是斯坦福大學(xué)首位紅杉講席教授,美國(guó)國(guó)家工程院院士。她與斯坦福大學(xué)和華盛頓大學(xué)的研究團(tuán)隊(duì),在一個(gè)月內(nèi)便研發(fā)出s1模型,因像DeepSeek一樣并非從零開(kāi)始。s1是以阿里巴巴的通義千問(wèn)Qwen2.5 -32B-Instruct開(kāi)源模型為底座,在16塊輝達(dá)(NVIDIA)H100 GPU上監(jiān)督微調(diào)26分鐘,訓(xùn)練出新模型。
表現(xiàn)媲美OpenAI o1及DeepSeek R1
報(bào)道指,李飛飛團(tuán)隊(duì)在研究中提出了“預(yù)算控制”策略,透過(guò)加入“wait指令”等方式,強(qiáng)制延長(zhǎng)模型推理過(guò)程、思考時(shí)間,以此促使模型自我檢查并修正錯(cuò)誤的推理步驟,提升推理品質(zhì)。
根據(jù)李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn),可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競(jìng)賽數(shù)學(xué)問(wèn)題上更較o1-preview高出27%。
內(nèi)媒每日經(jīng)濟(jì)新聞報(bào)道,復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院副教授鄭驍慶受訪時(shí)表示:“像DeepSeek或類(lèi)似的公司,在尋找有效的整合解決方案時(shí),需要進(jìn)行大量的前期研究與消融實(shí)驗(yàn)。”這意味著前期是需要大量“燒錢(qián)”的。
由于s1是基于現(xiàn)成模型進(jìn)行監(jiān)督微調(diào),而微調(diào)一個(gè)模型和從零開(kāi)始訓(xùn)練一個(gè)模型的成本是無(wú)法相提并論的。其次50美元是否包含了其他數(shù)據(jù)、設(shè)備和消融實(shí)驗(yàn)等費(fèi)用,如DeepSeek-V3不到600萬(wàn)美元的訓(xùn)練成本,其實(shí)也只包含了訓(xùn)練時(shí)的GPU算力費(fèi)用。

- 馬斯克效率部|揭歷來(lái)最愚蠢研究:為顯而易見(jiàn)之事燒錢(qián)120萬(wàn)美元 韓國(guó)瑜愿協(xié)商總預(yù)算案吁喊停大罷免,賴清德搬“佛經(jīng)”回應(yīng) 賴清德放任大罷免?藍(lán)揭綠盤(pán)算:優(yōu)先壓制盧秀燕 22歲女生中學(xué)疑遭狼師性侵四年,獲大學(xué)錄取未逃陰霾抑郁輕生 海巡署士官長(zhǎng)指侵同袍妻,惡喊:你下面濕濕的!判賠金額出爐 黃珊珊、林憶君沒(méi)投票!藍(lán)白聯(lián)手60:51封殺“選罷法”覆議案 啦啦隊(duì)女神熱舞“馬甲下滑”!傲人上圍險(xiǎn)走光 民進(jìn)黨再爆性騷擾,前黨工PO文控前主管“那天你喝多”,內(nèi)容曝光 22歲女生中學(xué)時(shí)期遭性侵輕生,母親曾問(wèn)淫師:你對(duì)我女兒做了什么 葉珂下個(gè)月生女娃!閨蜜證實(shí)分手再爆:黃曉明不見(jiàn)得喜歡她