亚洲精品视频久久_亚洲日本电影久久_亚洲午夜福利院在线观看_精品乱理伦片中文字幕

2025年AI再進(jìn)化,兩大關(guān)鍵發(fā)展,挑戰(zhàn)人類產(chǎn)業(yè),專家料監(jiān)管趨嚴(yán)

發(fā)布時間:2025-01-01 15:13

AI技術(shù)日新月異下,近期就有內(nèi)地商家利用技術(shù)偽造名人直播帶貨,不但形象真實、聲音更難分真?zhèn)?,甚至成功售賣了1,200件商品;事實上,如今只需輸入一段文字,AI就能自動生成具有立體感的圖像、影片,以至同步產(chǎn)出相應(yīng)旁白或音樂,甚或協(xié)同多種模型,自動完成復(fù)雜任務(wù)。對于來年發(fā)展方向,有AI業(yè)界表示,“多模態(tài)大模型”與“AI Agent協(xié)同技術(shù)”將成為引領(lǐng)未來發(fā)展的關(guān)鍵技術(shù)。

OpenAI后續(xù)推出的GPT-o1及o3

▲OpenAI后續(xù)推出的GPT-o1及o3,不但在圖像與文字生成的品質(zhì)上向前躍進(jìn),更讓AI的推理與理解能力直迫高等學(xué)府的博士水準(zhǔn)。

“多模態(tài)與協(xié)同”大降創(chuàng)作門檻

回顧深度學(xué)習(xí)和大型語言模型在2023年的蓬勃發(fā)展,2024年與過去最大的不同在于正式邁入“多模態(tài)與協(xié)同”的全新階段,本地AI科技公司DotAI行政總裁楊廣澤向《星島頭條》表示,以往用戶必須依賴不同的模型或工具,才能分別處理文字、圖像、聲音和影片;然而,今年初誕生的“多模態(tài)大模型”,將這些功能統(tǒng)整到同一學(xué)習(xí)架構(gòu)內(nèi),讓用戶僅透過日常語言就能創(chuàng)造圖像、音樂或影片,甚至生成3D模型。

這項技術(shù)突破大幅降低了內(nèi)容創(chuàng)作的門檻,用戶不必懂程式語言,也不需要各種繁瑣的后制工具,只要能說、能寫,就能運用“多模態(tài)大模型”完成復(fù)雜且多樣化的輸出。楊廣澤表示:“對于內(nèi)容產(chǎn)業(yè)與創(chuàng)意領(lǐng)域而言,簡直是一場革命?!?/p>

這場革命已在各領(lǐng)域掀起波瀾,初創(chuàng)企業(yè)與垂直領(lǐng)域公司也紛紛推出創(chuàng)新應(yīng)用。以內(nèi)容創(chuàng)作和娛樂領(lǐng)域為例,AI音樂讓使用者只需輸入曲風(fēng)、情感、速度等關(guān)鍵詞就能自動生成完整曲目,還能根據(jù)影片或圖像氛圍進(jìn)行調(diào)整。AI數(shù)字分身則被企業(yè)用于虛擬主播或客服行銷,教育機(jī)構(gòu)也藉此快速制作線上課程。聲紋技術(shù)更實現(xiàn)了精準(zhǔn)的聲音辨識與合成,不僅可用于語音品牌或個人化AI助理,還支援聲紋安全認(rèn)證。

“AI Agent”自動完成復(fù)雜任務(wù)

目前,AI已能直接操作使用者的電腦、整理檔案或啟動軟件,甚至連結(jié)多平臺之間的云端帳號,在多個系統(tǒng)間協(xié)同工作。在金融、法律、醫(yī)療、程式設(shè)計等專業(yè)領(lǐng)域中,這些模型不僅能快速閱讀、歸納龐大資料,也能主動提供分析建議。楊廣澤表示,它不只是更聰明的聊天機(jī)器人,而更像一位“大管家”,可以協(xié)同多種工具與模型,自動完成復(fù)雜的任務(wù)。

這項技術(shù)稱為“AI Agent”,有“能看、能聽、能做”的特質(zhì),正顛覆人們對AI的傳統(tǒng)想像,更突破的是,AI還能使用其他AI的功能,打造一種模型之間互助合作的生態(tài)。換句話說,“多模態(tài)大模型”提供了AI看、聽及創(chuàng)作共同進(jìn)行的能力,而“AI Agent”讓AI能協(xié)同、決策與執(zhí)行。它能整合多個模型,如文字生成、圖像識別、聲音合成等與第三方API(云端服務(wù)、CRM、行銷平臺等),協(xié)調(diào)并管理一連串自動化流程。

楊廣澤表示,對企業(yè)而言,“AI Agent”能將市場分析、文案生成、影片制作、客戶服務(wù)串聯(lián)成一個自動化操作管道。對個人而言,蘋果等公司則嘗試將“個人化AI”與Agent概念結(jié)合,讓行事曆、健身紀(jì)錄、語音助理跨裝置無縫共享,更好地管理工作與生活。

中美科技巨頭大舉布局AI

看準(zhǔn)這股趨勢,全球各大科技巨頭與初創(chuàng)公司今年紛紛布局。OpenAI后續(xù)推出的GPT-o1及o3,不但在圖像與文字生成的品質(zhì)上向前躍進(jìn),更讓AI的推理與理解能力直迫高等學(xué)府的博士水平。

Google則在搜尋與協(xié)同作業(yè)工具中,大量導(dǎo)入名為Gemini的多模態(tài)模型。由前OpenAI團(tuán)隊組成的Anthropic,同樣借助Claude系列模型向更高維度的理解與表達(dá)前進(jìn)。蘋果則利用自家硬件生態(tài)系的優(yōu)勢,鎖定“個人化AI”并推出Apple Intelligence,主打隱私保護(hù)與操作便利的語音服務(wù)、健康管理等功能。

在地球的另一端,中國科技巨頭在AI領(lǐng)域也不甘示弱,各自推出大模型應(yīng)用,廣泛應(yīng)用于智能客服、教育培訓(xùn)、行業(yè)諮詢、商業(yè)分析等領(lǐng)域。百度公司主打升級版文心一言4.0,除了強(qiáng)化多模態(tài)能力外,還推出專門服務(wù)企業(yè)的“文心一言企業(yè)版”,主打智慧商業(yè)分析和決策輔助。

此外,字節(jié)跳動發(fā)布云雀大模型,專注工業(yè)制造領(lǐng)域的智能化升級。阿里云發(fā)布通義千問2.0,整合了多模態(tài)理解與生成能力,并針對金融、醫(yī)療、教育等垂直領(lǐng)域推出定制化解決方案。騰訊推出混元大模型升級版,重點強(qiáng)化其在游戲開發(fā)、內(nèi)容創(chuàng)作和社交媒體領(lǐng)域的應(yīng)用。華為則推出“昇騰智算平臺”,為企業(yè)提供從芯片到軟件的全棧AI計算服務(wù)。

制造、金融業(yè)或更多AI方案推出

楊廣澤認(rèn)為,自2024年開始,各大公司已達(dá)成共識,勢必要利用自身龐大數(shù)據(jù)基礎(chǔ)與技術(shù)底蘊,打造最強(qiáng)大、最智慧的多模態(tài)大模型。展望2025年,AI技術(shù)將朝向更深度的整合與應(yīng)用方向發(fā)展,“多模態(tài)大模型”與“AI Agent”的結(jié)合將進(jìn)一步成熟,可望在企業(yè)管理、醫(yī)療診斷、教育培訓(xùn)等領(lǐng)域?qū)崿F(xiàn)更精準(zhǔn)的場景落地。

業(yè)界預(yù)計,將出現(xiàn)更多專注于特定垂直領(lǐng)域的AI解決方案,尤其在制造業(yè)、金融服務(wù)和創(chuàng)意產(chǎn)業(yè)方面。

AI監(jiān)管料加強(qiáng) 平衡創(chuàng)新與合規(guī)

然而,隨著AI應(yīng)用范圍擴(kuò)大,產(chǎn)業(yè)面臨的挑戰(zhàn)也將更加復(fù)雜。一方面,各國可能會加強(qiáng)AI監(jiān)管力度,特別是在數(shù)據(jù)隱私、算法透明度和內(nèi)容審核等方面。另一方面,企業(yè)需要在技術(shù)創(chuàng)新與合規(guī)要求之間尋求平衡,同時應(yīng)對日益增長的資訊安全威脅。

楊廣澤認(rèn)為,2025年可能成為AI治理的關(guān)鍵之年,預(yù)期將有更多國家制定AI監(jiān)管框架,企業(yè)也需要建立更完善的AI倫理準(zhǔn)則和風(fēng)險管理機(jī)制。在這樣的發(fā)展態(tài)勢下,具備強(qiáng)大技術(shù)實力同時又能確保合規(guī)營運的企業(yè),將在新一輪競爭中占據(jù)優(yōu)勢。

以上內(nèi)容歸星島新聞集團(tuán)所有,未經(jīng)許可不得擅自轉(zhuǎn)載引用


熱門文章