中國AI初創(chuàng)DeepSeek再發(fā)表新技術論文,可令處理長文的速度提高11倍,創(chuàng)辦人梁文鋒更親自參與該論文研究。另外,梁文鋒2009年讀研期間曾到上海一科技公司實習,直接擔任新技術部經(jīng)理,月薪達1.6萬人民幣,屬高薪一族。
推新技術處理長文快11倍
據(jù)內(nèi)媒報道,DeepSeek昨公布一項由梁文鋒親自參與的研究論文成果——原生稀疏注意力(Native Sparse Attention, NSA)機制,結合算法創(chuàng)新和硬件優(yōu)化,解決長文建模中的計算瓶頸。
▲DeepSeek成為炙手可熱的科技新貴。路透社
報道指,論文顯示,NSA仍未用于訓練DeepSeek V3模型。論文指出,NSA處理長文的速度可提升11.6倍,在通用基準測試中,實現(xiàn)性能反超傳統(tǒng)的“全注意力模型”。
此外,梁文鋒成為舉世矚目的科技紅人后,他出道前的經(jīng)歷也成為關注焦點。快科技報道,梁文鋒在2009年曾在上海閔行的艾麒信息科技實習,負責人工智能有關的內(nèi)容。
專注研究半天不出辦公室
艾麒信息創(chuàng)辦人周朝恩透露,梁文鋒是他的浙大校友,讀研期間就以實習生身分加入艾麒,后經(jīng)推薦直接擔任新技術部經(jīng)理,給予月薪人民幣1.6萬元,算是高薪特別聘請。
周朝恩憶述稱,“初見梁文鋒時,他戴著一副眼鏡,斯文有禮,身材清瘦,給人一種文靜內(nèi)斂的印象。入職后,就全身心投入到人工智能視頻與圖像技術的研究中,常常一整天都待在辦公室里,專注地鉆研技術難題,甚至半天都不出來一次?!?。
不善言辭典型技術男
周朝恩形容,梁文鋒不善言辭,但交流技術時則能清晰表達觀點,展現(xiàn)強大邏輯思維能力,指他“為人沉著冷靜,性格簡單直接,對產(chǎn)品和技術有極高的追求,堪稱典型的技術男風格”。
梁文鋒也曾管理過多位演算法工程師,采用扁平化管理方式,給團隊成員充分的自由和信任,發(fā)揮每個人的特長,并帶領團隊攻克了多項技術難題,優(yōu)化影像處理演算法。
豐富的管理經(jīng)驗在梁文鋒創(chuàng)業(yè)后得到了延續(xù)。周朝恩指出,梁文鋒招聘的團隊成員大多是數(shù)學競賽一等獎、拿過國際金牌的演算法人才,這種對高端人才的管理和激勵方式,使得梁文鋒在管理量化投資和深度求索時,能夠迅速組織一支高效專業(yè)的技術團隊。

- 俄烏戰(zhàn)爭|特朗普疑與澤連斯基“割席”,批基輔不應挑釁 緬甸詐騙園區(qū)|總理佩通坦指7000人獲救,待轉移至泰國 民企座談會 | 任正非:警惕科技業(yè)“表面繁榮掩蓋內(nèi)功不足” 丈夫看謎片助興,人妻美背竟成“手機架”嘆:有溫度的飛機杯? 古巨基攜妻出席衛(wèi)詩雅大婚,老婆受愛情滋養(yǎng)神似一港星 汪小菲傳欠2.5億新臺幣未還“丟下債務回北京”,大S生前經(jīng)濟遭拖垮 謝寒冰再曝新照!曹興誠隔空嗆“牢飯吃定了”:會哭著來求饒 黃珊珊哽咽憶柯爸:對后輩很溫暖“永遠笑瞇瞇” 陳妍希陳曉離婚?| 他曾稱“有精神潔癖”對另一半2要求曝光 楊丞琳結婚5年首曬婚紗照,和李榮浩補辦婚禮“藏1年才公開”!