DeepSeek R1中美下載榜登頂,如何顛覆AI格局,Nvidia夜盤急挫5%
國(guó)產(chǎn)AI黑馬DeepSeek(深度求索,Deep Seek)自1月20日正式發(fā)布大模型DeepSeek R1后,因其在數(shù)學(xué)、編程和推理等關(guān)鍵領(lǐng)域與OpenAI的最強(qiáng)模型性能相當(dāng),而且API調(diào)用成本低90%至95%,震驚市場(chǎng)。該應(yīng)用程序更在蘋果中國(guó)和美國(guó)地區(qū)App Store免費(fèi)下載榜中登頂,其中在美國(guó)地區(qū)下載榜上更超越ChatGPT。
DeepSeek對(duì)股市有何影響?
Saas概念股向上 英偉達(dá)急跌
在憧憬AI應(yīng)用普及下,有關(guān)消息刺激多只在港上市Saas概念股向上,其中醫(yī)渡科技(2158)曾升逾6%、匯量科技(1860)及微盟(2013)亦曾分別升6%及5.4%。芯片股亦見受壓,中芯(981)曾跌3%;華虹半導(dǎo)體(1347)曾跌逾3%;晶門半導(dǎo)體(2878)更曾跌6%。此外,AI芯片龍頭英偉達(dá)(Nvidia,NVDA)亦因此利淡,在部份券商平臺(tái)美股夜盤急跌逾5%至135.15美元。
AI行業(yè)專家如何評(píng)價(jià)DeepSeek R1?
綜合媒體報(bào)道,DeepSeek R1的驚艷表現(xiàn)引來(lái)多位AI行業(yè)專家和從業(yè)者盛贊。百度(9888)前首席科學(xué)家吳恩達(dá)在冬季達(dá)沃斯論壇上表示,對(duì)DeepSeek的進(jìn)展印象深刻,并認(rèn)爲(wèi)他們能夠以非常經(jīng)濟(jì)的方式訓(xùn)練模型。
微軟CEO吁認(rèn)真對(duì)待中國(guó)
微軟行政總裁Satya Nadella也公開表示,DeepSeek切實(shí)有效地開發(fā)了一款開源模型,在推理計(jì)算方面表現(xiàn)出色,而且超級(jí)計(jì)算效率極高;他更強(qiáng)調(diào),「我們必須非常、非常認(rèn)真地對(duì)待中國(guó)的這些進(jìn)展」。
AI競(jìng)爭(zhēng)格局有何改變?
DeepSeek的成功更獲外媒形容為「標(biāo)志著中國(guó)在人工智能領(lǐng)域日益強(qiáng)大的自主創(chuàng)新能力」。英國(guó)《金融時(shí)報(bào)》文章指出,DeepSeek并非個(gè)例,自去年中開始,阿里巴巴(9988)、 騰訊(700) 、字節(jié)跳動(dòng)等中國(guó)科企持續(xù)縮小與美國(guó)同行差距,除了在能力方面逐漸趨近,更在成本效益上實(shí)現(xiàn)超越,而且這種增長(zhǎng)效率并非偶然。
開源模型趕上閉源模型
至于DeepSeek的另一熱議焦點(diǎn),是在于開源模型趕上閉源模型,可能改變競(jìng)爭(zhēng)格局。事實(shí)上,OpenAI的閉源是其主導(dǎo)AI行業(yè)格局的一大特征。不過(guò),Meta首席AI科學(xué)家Yann LeCun表示,DeepSeek得益于開放生態(tài),其創(chuàng)新基于前人成果的持續(xù)迭代,顯示了開源模型正在超越閉源系統(tǒng)。華爾街頂級(jí)風(fēng)投A16z創(chuàng)始人Marc Andreessen更稱,DeepSeek-R1是其見過(guò)最令人驚嘆、最令人印象深刻的突破之一,并且是「開源」、是「給世界的禮物」。
值得留意的是,Tesla行政總裁馬斯克曾對(duì)OpenAI的閉源提起訴訟。在去年2月29日,馬斯克向舊金山高等法院控告OpenAI背離公共開源AGI的承諾,提出違約、違反受托責(zé)任和不公平商業(yè)行為等指控,要求法院命令OpenAI恢復(fù)開源狀態(tài),阻止OpenAI及其總裁、CEO,以及微軟從AGI技術(shù)中獲利,并對(duì)OpenAI使用捐款進(jìn)行清查。不過(guò),馬斯克的努力尚未使OpenAI開源,但DeepSeek正以開源姿態(tài)贏得更多認(rèn)可。
DeepSeek創(chuàng)辦人是誰(shuí)?何時(shí)成立及崛起?
DeepSeek創(chuàng)辦人為梁文鋒,1985年出生于廣東省湛江市,今年約40歲,浙江大學(xué)畢業(yè),擁有信息與電子工程學(xué)系學(xué)士和碩士學(xué)位。他早于2008年起開始帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動(dòng)量化交易,到2015年正式成立幻方量化,2019年資金管理規(guī)模更突破百億元。
直到2023年,梁文鋒宣布進(jìn)軍通用人工智能領(lǐng)域,專注于做真正人類等級(jí)的人工智能;同年幻方量化正式宣布成立大模型公司DeepSeek。
在2023年11月2日,公司已推出首個(gè)模型DeepSeek Coder,該模型免費(fèi)供商業(yè)使用且完全開源;11月29日推出DeepSeek LLM,參數(shù)規(guī)模達(dá)67B,性能接近GPT-4,同時(shí)還發(fā)布了聊天版本DeepSeek Chat。
DeepSeek被稱為「價(jià)格屠夫」及「AI界拼多多」
真正讓Deepseek在AI界受關(guān)注,是其在去年5月開源的第二代MoE大模型DeepSeek-V2,該模型在性能上比肩GPT-4 Turbo,價(jià)格卻只有GPT-4的百分之一,因此被稱為「價(jià)格屠夫」及「AI界的拼多多」。隨后在2024年下半年,還先后發(fā)布了DeepSeek R1-lite-preview和DeepSeek-V3。
直到今年推出R1模型,在MATH基準(zhǔn)測(cè)試上達(dá)77.5%準(zhǔn)確率,與OpenAI的o1不相上下;在編程領(lǐng)域,R1在Codeforces評(píng)測(cè)中達(dá)2441分水平,高于96.3%的人類參與者。更重要的是,這是在不到600萬(wàn)美元的投入和2048塊低性能的H800芯片的條件下完成,訓(xùn)練時(shí)間僅用兩個(gè)月,令全球側(cè)目。
DeepSeek VS ChatGPT
若將DeepSeek與ChatGPT性能作比較,DeepSeek在MATH 500、AIME 2024和Codeforces等數(shù)學(xué)和編程測(cè)試中,表現(xiàn)優(yōu)于ChatGPT和其他主流模型。在多任務(wù)理解和復(fù)雜問(wèn)題處理方面,兩者表現(xiàn)相當(dāng),雖然DeepSeek在部分測(cè)試中略低于Claude,但整體上仍優(yōu)于大多數(shù)模型。
上下文理解能力較弱
不過(guò),ChatGPT在響應(yīng)速度和文字生成方面較佳,其首次響應(yīng)時(shí)間通常在1秒以內(nèi),DeepSeek則需要1.1秒左右,同時(shí)ChatGPT每秒可生成100個(gè)TOKEN,DeepSeek則為87.5個(gè)TOKEN。此外,DeepSeek一個(gè)較明顯弱點(diǎn)是上下文理解能力較弱,只能記住13萬(wàn)個(gè)TOKEN的上下文,而ChatGPT和Claude則能記住200萬(wàn)個(gè)TOKEN。
以上內(nèi)容歸星島新聞集團(tuán)所有,未經(jīng)許可不得擅自轉(zhuǎn)載引用。

- 泰國(guó)7中國(guó)人遭綁架獲解救,多名軍警被揭涉案勒索百萬(wàn)元 “河南礦山”豪派1億元年終獎(jiǎng),員工15分鐘“數(shù)走”10萬(wàn)元 王星事件關(guān)鍵人“顏十六”到案回國(guó),被指騙9人赴泰“拍戲” 特朗普稱與多方商討收購(gòu)TikTok,預(yù)計(jì)30天內(nèi)做決定 劉德華氣炸“再多錢都不與她合作”,女星耍大牌片場(chǎng)電話訂包 哥倫比亞拒絕美國(guó)驅(qū)逐移民航班,特朗普立即報(bào)復(fù)征25%關(guān)稅 三環(huán)幫劉憲治慘死!昔獲“財(cái)團(tuán)董座獄友”指點(diǎn)洗白,卻囂張掌摑警所長(zhǎng) 全臺(tái)大罷免要來(lái)了!最新街訪民眾氣炸嗆“柯建銘老番顛” 尹錫悅遭檢方以涉嫌內(nèi)亂等罪嫌起訴,韓國(guó)總統(tǒng)首例