亚州精品国产一线永久无码,亚洲区欧美区强奸

AI教母︱李飛飛花20美金26分鐘造出新模型，效果媲美DeepSeek

發(fā)布時(shí)間：2025-02-12 08:42

內(nèi)地低成本高效的AI模型DeepSeek，推出后震撼科技界后，有AI教母之稱的美籍華裔科學(xué)家李飛飛，率領(lǐng)其團(tuán)隊(duì)僅花了20美元及26分鐘，便創(chuàng)造出一個(gè)“s1”的AI推理模型，表現(xiàn)媲美OpenAI o1和DeepSeek R1等尖端推理模型。

▲李飛飛及其團(tuán)隊(duì)只用了20美元，便創(chuàng)出效能媲美DeepSeek R1的新AI模型。路透社

▲李飛飛是斯坦福大學(xué)首位紅杉講席教授。Stanford University

▲DeepSeek的估值存在巨大分歧，估值區(qū)間在10億美元到1550億美元之間。路透社

僅用16塊H100 GPU訓(xùn)練

綜合外媒報(bào)道，李飛飛是斯坦福大學(xué)首位紅杉講席教授，美國(guó)國(guó)家工程院院士。她與斯坦福大學(xué)和華盛頓大學(xué)的研究團(tuán)隊(duì)，在一個(gè)月內(nèi)便研發(fā)出s1模型，因像DeepSeek一樣并非從零開(kāi)始。s1是以阿里巴巴的通義千問(wèn)Qwen2.5 -32B-Instruct開(kāi)源模型為底座，在16塊輝達(dá)(NVIDIA)H100 GPU上監(jiān)督微調(diào)26分鐘，訓(xùn)練出新模型。

表現(xiàn)媲美OpenAI o1及DeepSeek R1

報(bào)道指，李飛飛團(tuán)隊(duì)在研究中提出了“預(yù)算控制”策略，透過(guò)加入“wait指令”等方式，強(qiáng)制延長(zhǎng)模型推理過(guò)程、思考時(shí)間，以此促使模型自我檢查并修正錯(cuò)誤的推理步驟，提升推理品質(zhì)。

根據(jù)李飛飛等人的研究論文《s1：Simple test- time scaling》，該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn)，可媲美OpenAI的o1，以及DeepSeek的R1等尖端推理模型，在競(jìng)賽數(shù)學(xué)問(wèn)題上更較o1-preview高出27%。

內(nèi)媒每日經(jīng)濟(jì)新聞報(bào)道，復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院副教授鄭驍慶受訪時(shí)表示：“像DeepSeek或類(lèi)似的公司，在尋找有效的整合解決方案時(shí)，需要進(jìn)行大量的前期研究與消融實(shí)驗(yàn)。”這意味著前期是需要大量“燒錢(qián)”的。

由于s1是基于現(xiàn)成模型進(jìn)行監(jiān)督微調(diào)，而微調(diào)一個(gè)模型和從零開(kāi)始訓(xùn)練一個(gè)模型的成本是無(wú)法相提并論的。其次50美元是否包含了其他數(shù)據(jù)、設(shè)備和消融實(shí)驗(yàn)等費(fèi)用，如DeepSeek-V3不到600萬(wàn)美元的訓(xùn)練成本，其實(shí)也只包含了訓(xùn)練時(shí)的GPU算力費(fèi)用。

相關(guān)閱讀