99久久久久久黄色片麻豆,国产欧美日韩第一页

2025年AI再進(jìn)化，兩大關(guān)鍵發(fā)展，挑戰(zhàn)人類產(chǎn)業(yè)，專家料監(jiān)管趨嚴(yán)

發(fā)布時間：2025-01-01 15:13

AI技術(shù)日新月異下，近期就有內(nèi)地商家利用技術(shù)偽造名人直播帶貨，不但形象真實、聲音更難分真?zhèn)?，甚至成功售賣了1,200件商品；事實上，如今只需輸入一段文字，AI就能自動生成具有立體感的圖像、影片，以至同步產(chǎn)出相應(yīng)旁白或音樂，甚或協(xié)同多種模型，自動完成復(fù)雜任務(wù)。對于來年發(fā)展方向，有AI業(yè)界表示，“多模態(tài)大模型”與“AI Agent協(xié)同技術(shù)”將成為引領(lǐng)未來發(fā)展的關(guān)鍵技術(shù)。

▲OpenAI后續(xù)推出的GPT-o1及o3，不但在圖像與文字生成的品質(zhì)上向前躍進(jìn)，更讓AI的推理與理解能力直迫高等學(xué)府的博士水準(zhǔn)。

“多模態(tài)與協(xié)同”大降創(chuàng)作門檻

回顧深度學(xué)習(xí)和大型語言模型在2023年的蓬勃發(fā)展，2024年與過去最大的不同在于正式邁入“多模態(tài)與協(xié)同”的全新階段，本地AI科技公司DotAI行政總裁楊廣澤向《星島頭條》表示，以往用戶必須依賴不同的模型或工具，才能分別處理文字、圖像、聲音和影片；然而，今年初誕生的“多模態(tài)大模型”，將這些功能統(tǒng)整到同一學(xué)習(xí)架構(gòu)內(nèi)，讓用戶僅透過日常語言就能創(chuàng)造圖像、音樂或影片，甚至生成3D模型。

這項技術(shù)突破大幅降低了內(nèi)容創(chuàng)作的門檻，用戶不必懂程式語言，也不需要各種繁瑣的后制工具，只要能說、能寫，就能運用“多模態(tài)大模型”完成復(fù)雜且多樣化的輸出。楊廣澤表示：“對于內(nèi)容產(chǎn)業(yè)與創(chuàng)意領(lǐng)域而言，簡直是一場革命?！?/p>

這場革命已在各領(lǐng)域掀起波瀾，初創(chuàng)企業(yè)與垂直領(lǐng)域公司也紛紛推出創(chuàng)新應(yīng)用。以內(nèi)容創(chuàng)作和娛樂領(lǐng)域為例，AI音樂讓使用者只需輸入曲風(fēng)、情感、速度等關(guān)鍵詞就能自動生成完整曲目，還能根據(jù)影片或圖像氛圍進(jìn)行調(diào)整。AI數(shù)字分身則被企業(yè)用于虛擬主播或客服行銷，教育機(jī)構(gòu)也藉此快速制作線上課程。聲紋技術(shù)更實現(xiàn)了精準(zhǔn)的聲音辨識與合成，不僅可用于語音品牌或個人化AI助理，還支援聲紋安全認(rèn)證。

“AI Agent”自動完成復(fù)雜任務(wù)

目前，AI已能直接操作使用者的電腦、整理檔案或啟動軟件，甚至連結(jié)多平臺之間的云端帳號，在多個系統(tǒng)間協(xié)同工作。在金融、法律、醫(yī)療、程式設(shè)計等專業(yè)領(lǐng)域中，這些模型不僅能快速閱讀、歸納龐大資料，也能主動提供分析建議。楊廣澤表示，它不只是更聰明的聊天機(jī)器人，而更像一位“大管家”，可以協(xié)同多種工具與模型，自動完成復(fù)雜的任務(wù)。

這項技術(shù)稱為“AI Agent”，有“能看、能聽、能做”的特質(zhì)，正顛覆人們對AI的傳統(tǒng)想像，更突破的是，AI還能使用其他AI的功能，打造一種模型之間互助合作的生態(tài)。換句話說，“多模態(tài)大模型”提供了AI看、聽及創(chuàng)作共同進(jìn)行的能力，而“AI Agent”讓AI能協(xié)同、決策與執(zhí)行。它能整合多個模型，如文字生成、圖像識別、聲音合成等與第三方API（云端服務(wù)、CRM、行銷平臺等），協(xié)調(diào)并管理一連串自動化流程。

楊廣澤表示，對企業(yè)而言，“AI Agent”能將市場分析、文案生成、影片制作、客戶服務(wù)串聯(lián)成一個自動化操作管道。對個人而言，蘋果等公司則嘗試將“個人化AI”與Agent概念結(jié)合，讓行事曆、健身紀(jì)錄、語音助理跨裝置無縫共享，更好地管理工作與生活。

中美科技巨頭大舉布局AI

看準(zhǔn)這股趨勢，全球各大科技巨頭與初創(chuàng)公司今年紛紛布局。OpenAI后續(xù)推出的GPT-o1及o3，不但在圖像與文字生成的品質(zhì)上向前躍進(jìn)，更讓AI的推理與理解能力直迫高等學(xué)府的博士水平。

Google則在搜尋與協(xié)同作業(yè)工具中，大量導(dǎo)入名為Gemini的多模態(tài)模型。由前OpenAI團(tuán)隊組成的Anthropic，同樣借助Claude系列模型向更高維度的理解與表達(dá)前進(jìn)。蘋果則利用自家硬件生態(tài)系的優(yōu)勢，鎖定“個人化AI”并推出Apple Intelligence，主打隱私保護(hù)與操作便利的語音服務(wù)、健康管理等功能。

在地球的另一端，中國科技巨頭在AI領(lǐng)域也不甘示弱，各自推出大模型應(yīng)用，廣泛應(yīng)用于智能客服、教育培訓(xùn)、行業(yè)諮詢、商業(yè)分析等領(lǐng)域。百度公司主打升級版文心一言4.0，除了強(qiáng)化多模態(tài)能力外，還推出專門服務(wù)企業(yè)的“文心一言企業(yè)版”，主打智慧商業(yè)分析和決策輔助。

此外，字節(jié)跳動發(fā)布云雀大模型，專注工業(yè)制造領(lǐng)域的智能化升級。阿里云發(fā)布通義千問2.0，整合了多模態(tài)理解與生成能力，并針對金融、醫(yī)療、教育等垂直領(lǐng)域推出定制化解決方案。騰訊推出混元大模型升級版，重點強(qiáng)化其在游戲開發(fā)、內(nèi)容創(chuàng)作和社交媒體領(lǐng)域的應(yīng)用。華為則推出“昇騰智算平臺”，為企業(yè)提供從芯片到軟件的全棧AI計算服務(wù)。

制造、金融業(yè)或更多AI方案推出

楊廣澤認(rèn)為，自2024年開始，各大公司已達(dá)成共識，勢必要利用自身龐大數(shù)據(jù)基礎(chǔ)與技術(shù)底蘊，打造最強(qiáng)大、最智慧的多模態(tài)大模型。展望2025年，AI技術(shù)將朝向更深度的整合與應(yīng)用方向發(fā)展，“多模態(tài)大模型”與“AI Agent”的結(jié)合將進(jìn)一步成熟，可望在企業(yè)管理、醫(yī)療診斷、教育培訓(xùn)等領(lǐng)域?qū)崿F(xiàn)更精準(zhǔn)的場景落地。

業(yè)界預(yù)計，將出現(xiàn)更多專注于特定垂直領(lǐng)域的AI解決方案，尤其在制造業(yè)、金融服務(wù)和創(chuàng)意產(chǎn)業(yè)方面。

AI監(jiān)管料加強(qiáng) 平衡創(chuàng)新與合規(guī)

然而，隨著AI應(yīng)用范圍擴(kuò)大，產(chǎn)業(yè)面臨的挑戰(zhàn)也將更加復(fù)雜。一方面，各國可能會加強(qiáng)AI監(jiān)管力度，特別是在數(shù)據(jù)隱私、算法透明度和內(nèi)容審核等方面。另一方面，企業(yè)需要在技術(shù)創(chuàng)新與合規(guī)要求之間尋求平衡，同時應(yīng)對日益增長的資訊安全威脅。

楊廣澤認(rèn)為，2025年可能成為AI治理的關(guān)鍵之年，預(yù)期將有更多國家制定AI監(jiān)管框架，企業(yè)也需要建立更完善的AI倫理準(zhǔn)則和風(fēng)險管理機(jī)制。在這樣的發(fā)展態(tài)勢下，具備強(qiáng)大技術(shù)實力同時又能確保合規(guī)營運的企業(yè)，將在新一輪競爭中占據(jù)優(yōu)勢。

以上內(nèi)容歸星島新聞集團(tuán)所有，未經(jīng)許可不得擅自轉(zhuǎn)載引用

專題更多 >

亚洲精品视频久久_亚洲日本电影久久_亚洲午夜福利院在线观看_精品乱理伦片中文字幕

2025年AI再進(jìn)化，兩大關(guān)鍵發(fā)展，挑戰(zhàn)人類產(chǎn)業(yè)，專家料監(jiān)管趨嚴(yán)

2025年AI再進(jìn)化，兩大關(guān)鍵發(fā)展，挑戰(zhàn)人類產(chǎn)業(yè)，專家料監(jiān)管趨嚴(yán)