亚洲精品视频久久_亚洲日本电影久久_亚洲午夜福利院在线观看_精品乱理伦片中文字幕

AI教母︱李飛飛花20美金26分鐘造出新模型,效果媲美DeepSeek

發(fā)布時(shí)間:2025-02-12 08:42

內(nèi)地低成本高效的AI模型DeepSeek,推出后震撼科技界后,有AI教母之稱的美籍華裔科學(xué)家李飛飛,率領(lǐng)其團(tuán)隊(duì)僅花了20美元及26分鐘,便創(chuàng)造出一個(gè)“s1”的AI推理模型,表現(xiàn)媲美OpenAI o1和DeepSeek R1等尖端推理模型。

新AI模型

▲李飛飛及其團(tuán)隊(duì)只用了20美元,便創(chuàng)出效能媲美DeepSeek R1的新AI模型。路透社

李飛飛

▲李飛飛是斯坦福大學(xué)首位紅杉講席教授。Stanford University

DeepSeek

▲DeepSeek的估值存在巨大分歧,估值區(qū)間在10億美元到1550億美元之間。路透社

僅用16塊H100 GPU訓(xùn)練

綜合外媒報(bào)道,李飛飛是斯坦福大學(xué)首位紅杉講席教授,美國(guó)國(guó)家工程院院士。她與斯坦福大學(xué)和華盛頓大學(xué)的研究團(tuán)隊(duì),在一個(gè)月內(nèi)便研發(fā)出s1模型,因像DeepSeek一樣并非從零開(kāi)始。s1是以阿里巴巴的通義千問(wèn)Qwen2.5 -32B-Instruct開(kāi)源模型為底座,在16塊輝達(dá)(NVIDIA)H100 GPU上監(jiān)督微調(diào)26分鐘,訓(xùn)練出新模型。

表現(xiàn)媲美OpenAI o1及DeepSeek R1

報(bào)道指,李飛飛團(tuán)隊(duì)在研究中提出了“預(yù)算控制”策略,透過(guò)加入“wait指令”等方式,強(qiáng)制延長(zhǎng)模型推理過(guò)程、思考時(shí)間,以此促使模型自我檢查并修正錯(cuò)誤的推理步驟,提升推理品質(zhì)。

根據(jù)李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn),可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競(jìng)賽數(shù)學(xué)問(wèn)題上更較o1-preview高出27%。

內(nèi)媒每日經(jīng)濟(jì)新聞報(bào)道,復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院副教授鄭驍慶受訪時(shí)表示:“像DeepSeek或類(lèi)似的公司,在尋找有效的整合解決方案時(shí),需要進(jìn)行大量的前期研究與消融實(shí)驗(yàn)。”這意味著前期是需要大量“燒錢(qián)”的。

由于s1是基于現(xiàn)成模型進(jìn)行監(jiān)督微調(diào),而微調(diào)一個(gè)模型和從零開(kāi)始訓(xùn)練一個(gè)模型的成本是無(wú)法相提并論的。其次50美元是否包含了其他數(shù)據(jù)、設(shè)備和消融實(shí)驗(yàn)等費(fèi)用,如DeepSeek-V3不到600萬(wàn)美元的訓(xùn)練成本,其實(shí)也只包含了訓(xùn)練時(shí)的GPU算力費(fèi)用。

專(zhuān)題 更多 >
熱門(mén)文章