AI與數(shù)字內(nèi)容產(chǎn)業(yè)加速深度耦合!騰訊優(yōu)圖發(fā)布《2021十大人工智能趨勢(shì)》
AI與數(shù)字內(nèi)容產(chǎn)業(yè)的深度耦合,將有望為行業(yè)釋放更大的科技勢(shì)能,構(gòu)筑數(shù)字內(nèi)容生成新范式。
6月5日,以“交叉、融合、相生、共贏”為主題的2021全球人工智能技術(shù)大會(huì)(GAITC 2021)在杭州舉行。會(huì)上,騰訊優(yōu)圖聯(lián)合廈門大學(xué)人工智能研究院共同發(fā)布《2021十大人工智能趨勢(shì)》(以下簡(jiǎn)稱“趨勢(shì)報(bào)告”),基于雙方長(zhǎng)期對(duì)人工智能尤其是計(jì)算機(jī)視覺(jué)的研究洞察,對(duì)自動(dòng)深度學(xué)習(xí)、無(wú)監(jiān)督/弱監(jiān)督學(xué)習(xí)、3D視覺(jué)技術(shù)等AI方向發(fā)展趨勢(shì)進(jìn)行了預(yù)測(cè)。
趨勢(shì)報(bào)告顯示,越來(lái)越多的人工智能企業(yè)發(fā)現(xiàn)數(shù)據(jù)的標(biāo)注開(kāi)始成為抬高交付成本、制約效果提升的主要因素之一,不斷強(qiáng)化無(wú)監(jiān)督/弱監(jiān)督學(xué)習(xí)由量變到質(zhì)變,將助推企業(yè)從前期的迅速擴(kuò)張到穩(wěn)定期高效化運(yùn)作的新階段;AI與數(shù)字內(nèi)容產(chǎn)業(yè)的深度耦合,也將有希望為行業(yè)釋放更大的科技勢(shì)能,構(gòu)筑數(shù)字內(nèi)容生成新范式。
另外,自動(dòng)機(jī)器學(xué)習(xí)的自動(dòng)化程度與可解釋性得到進(jìn)一步提升、3D視覺(jué)技術(shù)淡化虛實(shí)邊界助力產(chǎn)業(yè)消費(fèi)升級(jí)、人工智能內(nèi)核芯片向類腦神經(jīng)計(jì)算方向演進(jìn)等趨勢(shì),也成為趨勢(shì)報(bào)告的關(guān)注重點(diǎn)。
以下為《2021十大人工智能趨勢(shì)》詳細(xì)內(nèi)容:
1、自動(dòng)機(jī)器學(xué)習(xí)的自動(dòng)化程度與可解釋性得到進(jìn)一步提升
自動(dòng)機(jī)器學(xué)習(xí)(AutoML)目前已經(jīng)在多個(gè)領(lǐng)域中初步實(shí)現(xiàn)對(duì)機(jī)器學(xué)習(xí)方法的自動(dòng)化設(shè)計(jì)過(guò)程,但其仍然存在自動(dòng)化程度不足,可解釋性不強(qiáng)的問(wèn)題。如神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索(NAS)在一些應(yīng)用領(lǐng)域中取得了可以與人類機(jī)器學(xué)習(xí)專家可比較的水平,然而現(xiàn)有的NAS方法實(shí)際需要基于人工設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)。此外,AutoML的自動(dòng)化過(guò)程往往被認(rèn)為是一種 “黑箱”,缺乏可解釋性。
今后自動(dòng)化程度及可解釋性仍然是AutoML研究的熱點(diǎn)問(wèn)題,通過(guò)提高AutoML中的超參數(shù)選擇,特征表示與機(jī)器學(xué)習(xí)算法的確定和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索的自動(dòng)化程度及可解釋性,AutoML將實(shí)現(xiàn)對(duì)機(jī)器學(xué)習(xí)涉及的每個(gè)環(huán)節(jié)的真正的自動(dòng)化設(shè)計(jì)過(guò)程。AutoML整個(gè)體系架構(gòu)的日趨完善,將推動(dòng)新一代普適性AutoML平臺(tái)的建設(shè),并實(shí)現(xiàn)機(jī)器學(xué)習(xí)的大眾化。
2、無(wú)監(jiān)督/弱監(jiān)督學(xué)習(xí)逐漸成為企業(yè)降本增效新利器
在過(guò)去的幾年中,深度學(xué)習(xí)所取得的巨大成功離不開(kāi)大規(guī)模標(biāo)注的數(shù)據(jù)集。大規(guī)模標(biāo)注的背后,是傳統(tǒng)的監(jiān)督學(xué)習(xí)對(duì)于每一個(gè)訓(xùn)練樣本完備標(biāo)簽的要求。隨著業(yè)務(wù)規(guī)模的不斷擴(kuò)大,越來(lái)越多的企業(yè)發(fā)現(xiàn)數(shù)據(jù)的標(biāo)注開(kāi)始成為抬高交付成本、制約效果提升的主要因素之一。
在此背景下,無(wú)監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)通過(guò)不使用標(biāo)簽或減少對(duì)標(biāo)簽數(shù)量、質(zhì)量的要求來(lái)迅速降低深度模型對(duì)于數(shù)據(jù)的標(biāo)注需求,使得原本無(wú)法利用的數(shù)據(jù)如今都可以加入到模型的訓(xùn)練中去,進(jìn)而由量變引發(fā)質(zhì)變。在NLP領(lǐng)域,基于Transformer的無(wú)監(jiān)督訓(xùn)練模型已持續(xù)霸榜各種NLP任務(wù)數(shù)據(jù)集;在CV領(lǐng)域,最新的MPL方法也通過(guò)額外的無(wú)標(biāo)注數(shù)據(jù)集首次將ImageNet的Top-1分類準(zhǔn)確率提升到了90%+的水平。
可以預(yù)見(jiàn)的是,將有越來(lái)越多的人工智能企業(yè)會(huì)面臨從前期的迅速擴(kuò)張到穩(wěn)定期高效化運(yùn)作的新階段,而在這個(gè)過(guò)程中,無(wú)監(jiān)督/弱監(jiān)督學(xué)習(xí)無(wú)疑將成為他們過(guò)渡到這個(gè)階段的重要手段之一。
3、3D視覺(jué)技術(shù)助力產(chǎn)業(yè)消費(fèi)升級(jí),淡化虛實(shí)邊界
作為視覺(jué)AI領(lǐng)域多年熱點(diǎn)研究方向之一,3D視覺(jué)技術(shù)的核心任務(wù)是對(duì)三維空間、物體及環(huán)境進(jìn)行真實(shí)還原與重建。隨著相關(guān)算法與硬件計(jì)算能力的不斷升級(jí), 3D視覺(jué)算法效果得到大幅提升,三維幾何重建更加精細(xì),表面紋理重建更加清晰,帶來(lái)更加逼真的視覺(jué)觀感。
近年來(lái),諸多3D視覺(jué)研究成果為低成本高質(zhì)量的3D內(nèi)容生成提供了良好技術(shù)支撐,基于3D虛擬形象的舞臺(tái)演出、直播帶貨、教育互動(dòng)等應(yīng)用層出不窮,成為AI內(nèi)容產(chǎn)業(yè)全新發(fā)展方向。以此為基礎(chǔ),結(jié)合5G時(shí)代流量帶寬的全面升級(jí),帶有交互功能的3D虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、混合現(xiàn)實(shí)的3D視覺(jué)應(yīng)用將用戶體驗(yàn)向真實(shí)與虛擬的完美融合進(jìn)一步邁進(jìn)。
用戶會(huì)因?yàn)樘摂M偶像生動(dòng)自然的舞臺(tái)表演進(jìn)行打賞,會(huì)由于虛擬主播“賣力”地帶貨促銷而下單購(gòu)買,而線上平臺(tái)則依靠3D視覺(jué)技術(shù)大大降低內(nèi)容制作和IP運(yùn)營(yíng)成本,最終帶來(lái)社會(huì)商業(yè)發(fā)展模式與個(gè)人消費(fèi)習(xí)慣的顛覆與變革。展望未來(lái),3D視覺(jué)技術(shù)將持續(xù)在包括游戲娛樂(lè)、影視制作、電商直播、醫(yī)療整形等眾多領(lǐng)域廣泛應(yīng)用,虛擬與現(xiàn)實(shí)的邊界將不斷淡化。
4、多模態(tài)融合加速AI認(rèn)知升維
深度學(xué)習(xí)在多個(gè)人工智能的細(xì)分領(lǐng)域(如視覺(jué),自然語(yǔ)言處理等)已日趨成熟化和規(guī)模化,然而要真正實(shí)現(xiàn)通用人工智能,必然要將這些細(xì)分領(lǐng)域各自所針對(duì)的信息模態(tài)整合利用,即多模態(tài)融合。多模態(tài)融合的目標(biāo)是建立在圖像、文字、語(yǔ)音等的多模態(tài)信息識(shí)別的基礎(chǔ)上,實(shí)現(xiàn)不同模態(tài)信息的統(tǒng)一表征框架,從而起到1+1>2的作用。
典型的場(chǎng)景之一是通過(guò)圖文語(yǔ)音聯(lián)合識(shí)別,實(shí)現(xiàn)對(duì)隱晦和暗示性,招嫖廣告,兒童不良表情包等圖文混合內(nèi)容識(shí)別,支持審核業(yè)務(wù)深度打擊不良內(nèi)容。除了圖文融合等跨域模態(tài)融合,同域內(nèi)的不同信息維度同樣可以融合,如隨著深度生成技術(shù)的發(fā)展,當(dāng)前的人臉識(shí)別除了傳統(tǒng)的RGB圖外,還需要融合深度圖、紅外圖等信息來(lái)更好的防御越來(lái)越多元化的人臉偽造攻擊,實(shí)現(xiàn)更強(qiáng)的人臉?lè)烙?/span>
隨著人工智能認(rèn)知能力的提升,多模態(tài)融合也將會(huì)從圖文等實(shí)質(zhì)性模態(tài),逐漸拓展到如物理關(guān)系,邏輯推斷,因果分析等知識(shí)性模態(tài),從感知智能邁向認(rèn)知智能。
5、人工智能推動(dòng)數(shù)字內(nèi)容生成向新范式演進(jìn)
隨著數(shù)字文化產(chǎn)業(yè)的蓬勃發(fā)展,尤其是二次元文化滲透出圈,數(shù)字內(nèi)容產(chǎn)業(yè)面臨新一輪的需求升級(jí),伴隨著5G商業(yè)化進(jìn)程的不斷加深,多元化、精品化的優(yōu)質(zhì)數(shù)字內(nèi)容將面臨更快的消費(fèi)節(jié)奏,與此同時(shí),供給側(cè)仍存在巨大的產(chǎn)能缺口,數(shù)字內(nèi)容產(chǎn)業(yè)正處于勞動(dòng)密集型向科技密集型的轉(zhuǎn)型階段。
AI與數(shù)字內(nèi)容產(chǎn)業(yè)的深度耦合,將有希望為行業(yè)釋放更大的科技勢(shì)能,以GPT-3、DALL-E為代表的AI技術(shù),已在文本、語(yǔ)音、圖像、視頻等內(nèi)容生成中取得了令人驚艷的結(jié)果,然而在精確性、泛化性、合理性方面仍然面臨挑戰(zhàn),目前的前沿研究一方面探索從模型結(jié)構(gòu)(自動(dòng)化搜索等),訓(xùn)練形式(無(wú)監(jiān)督對(duì)比學(xué)習(xí)等)等方面提升精度效果;另一方面引入知識(shí)圖譜領(lǐng)域知識(shí),向機(jī)器介紹常識(shí)和其他特定領(lǐng)域的知識(shí)進(jìn)而提升常識(shí)推理效果。
伴隨著技術(shù)的持續(xù)升級(jí)演進(jìn),我們預(yù)見(jiàn)AI將逐步在數(shù)字內(nèi)容生成領(lǐng)域釋放引擎級(jí)的影響力,在內(nèi)容、平臺(tái)、技術(shù)多方合力引導(dǎo)下,構(gòu)筑數(shù)字內(nèi)容生成新范式。
6、邊緣計(jì)算與人工智能加速融合
近年來(lái),隨著深度學(xué)習(xí)算法的迅猛發(fā)展,計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、搜索推薦廣告等各種領(lǐng)域的任務(wù)性能得到不斷刷新。同時(shí),隨著邊緣智能設(shè)備的廣泛普及和硬件改進(jìn),基于深度學(xué)習(xí)的人工智能技術(shù)在邊緣端應(yīng)用落地成為了可能。
然而,在邊緣端上部署深度學(xué)習(xí)模型具有很大的難度。其主要挑戰(zhàn)表現(xiàn)在,邊緣端等智能設(shè)備在計(jì)算、存儲(chǔ)、功耗等方面有很大的限制。因此,邊緣端模型必須滿足低計(jì)算復(fù)雜度、小模型尺寸、低模型功耗等要求。未來(lái)將趨向硬件友好型的剪枝加速。根據(jù)邊緣硬件的CPU類型來(lái)設(shè)計(jì)特定的網(wǎng)絡(luò)稀疏化模式,適配不同硬件的模型壓縮與優(yōu)化加速技術(shù)是未來(lái)研究熱點(diǎn)趨勢(shì)。其次,基于自動(dòng)化的1-bit量化方法有上百倍的理論性能提升,因此也是未來(lái)研究熱點(diǎn)趨勢(shì)。
7、人工智能內(nèi)核芯片向類腦神經(jīng)計(jì)算方向演進(jìn)
人工智能內(nèi)核芯片已經(jīng)成為人工智能時(shí)代的關(guān)鍵技術(shù)之一,在某些領(lǐng)域中的具體任務(wù)上人工智能內(nèi)核芯片能夠?qū)崿F(xiàn)超越人腦的表現(xiàn),但針對(duì)人工智能內(nèi)核芯片的研究依然落后于人工智能的發(fā)展,人工智能內(nèi)核芯片無(wú)法同時(shí)滿足多種人工智能算法的加速要求,并且面對(duì)各種新型人工智能技術(shù)不斷涌現(xiàn)的局面,人工智能內(nèi)核芯片與人腦相比其自我學(xué)習(xí)能力與可擴(kuò)展性存在明顯不足。
未來(lái)人工智能內(nèi)核芯片將在結(jié)構(gòu)上更接近人腦的神經(jīng)構(gòu)造,獲得類神經(jīng)計(jì)算的能力,通過(guò)不斷整合最新的人工智能技術(shù),定制型人工智能內(nèi)核芯片將逐漸演變?yōu)橥ㄓ眯腿斯ぶ悄軆?nèi)核芯片,在提高自我學(xué)習(xí)能力的同時(shí),實(shí)現(xiàn)對(duì)不同人工智能技術(shù)在不同任務(wù)上的加速計(jì)算,從而推動(dòng)人工智能內(nèi)核芯片實(shí)現(xiàn)真正的落地。
8、算法公平性研究推動(dòng)AI應(yīng)用走向普惠無(wú)偏見(jiàn)
由于數(shù)據(jù)偏差、算法本身缺陷、甚至是人為偏見(jiàn)的存在,現(xiàn)有AI算法普遍存在對(duì)于某些特定人群效果不公平的"歧視性現(xiàn)象"。隨著AI算法在社會(huì)各行業(yè)的廣泛落地應(yīng)用,作為輔助人們決策的重要工具,算法的公平性問(wèn)題正受到越來(lái)越多的關(guān)注。過(guò)去的幾年業(yè)界已在逐步探索一些針對(duì)性的解決方案,包括構(gòu)建更公正的數(shù)據(jù)集、算法訓(xùn)練中引入公平性約束損失、提高機(jī)器學(xué)習(xí)算法的可解釋性等。
但就整體而言,當(dāng)前公平性研究在精度和公平性的平衡、不同場(chǎng)景的泛化性有效性等問(wèn)題上正處于方興未艾的階段。隨著歐盟發(fā)布《人工智能白皮書(shū)》、《人工智能倫理:問(wèn)題和倡議》,中國(guó)發(fā)布《協(xié)同落實(shí)人工智能治理原則的行動(dòng)建議》,人工智能的治理正成為一個(gè)愈加熱門的議題,而算法的公平性正是人工智能治理的關(guān)鍵問(wèn)題。我們預(yù)見(jiàn)算法公平性的研究將持續(xù)深化,在人臉識(shí)別等最廣泛的AI應(yīng)用領(lǐng)域取得突破,為不同人群帶來(lái)更加普惠無(wú)偏見(jiàn)的效果。
9、隱私保護(hù)AI落地實(shí)用幫助算法可持續(xù)進(jìn)化
人工智能和機(jī)器學(xué)習(xí)算法的廣泛應(yīng)用,在為人們提供便利的同時(shí),也帶來(lái)了極大的隱私泄露風(fēng)險(xiǎn)。這種隱私泄露包括用戶數(shù)據(jù)在授權(quán)范圍以外被處理共享、機(jī)器學(xué)習(xí)算法訓(xùn)練后存在數(shù)據(jù)記憶等現(xiàn)象。AI算法開(kāi)發(fā)中的數(shù)據(jù)隱私保護(hù)問(wèn)題受到的關(guān)注以及監(jiān)管日益增長(zhǎng),美國(guó)于2020年生效《加利福利亞消費(fèi)者隱私法案》,中國(guó)于2020年公布《個(gè)人信息保護(hù)法(草案)》。
針對(duì)機(jī)器學(xué)習(xí)中上述隱私保護(hù)問(wèn)題,研究工作近年來(lái)逐步深入走向成熟,發(fā)展出了數(shù)據(jù)匿名化、聯(lián)邦學(xué)習(xí)、差分隱私等一系列方法。我們預(yù)見(jiàn)能夠保護(hù)用戶數(shù)據(jù)隱私的更加靈活高效的AI學(xué)習(xí)方法將在金融、醫(yī)療、社交等場(chǎng)景實(shí)用化落地,消減用戶的隱私擔(dān)憂,幫助AI算法在場(chǎng)景中可持續(xù)地進(jìn)化。
10、人工智能技術(shù)向安全智能方向邁進(jìn)
隨著人工智能技術(shù)在各行各業(yè)的廣泛應(yīng)用,濫用或惡意破壞人工智能系統(tǒng)將會(huì)給社會(huì)帶來(lái)巨大的負(fù)面影響。近年來(lái)算法后門攻擊、對(duì)抗樣本攻擊、模型竊取攻擊等針對(duì)人工智能算法的攻擊技術(shù)持續(xù)發(fā)展,通過(guò)篡改構(gòu)造特殊數(shù)據(jù)誘騙人工智能應(yīng)用產(chǎn)生不可信的錯(cuò)誤結(jié)果,帶來(lái)了更大的算法安全風(fēng)險(xiǎn),因此保障人工智能應(yīng)用安全可靠的需求日漸迫切。未來(lái)人工智能技術(shù)將向著安全智能方向持續(xù)演化,一方面從算法的可解釋性入手提升模型的魯棒性,另一方面化被動(dòng)為主動(dòng),通過(guò)主動(dòng)安全檢測(cè)機(jī)制對(duì)各類攻擊進(jìn)行偵測(cè)與攔截,最終實(shí)現(xiàn)人工智能可用性與可信性雙軌并重的現(xiàn)實(shí)需求,推動(dòng)人工智能技術(shù)在更廣泛領(lǐng)域的安全落地。
作為騰訊旗下頂級(jí)的人工智能實(shí)驗(yàn)室,騰訊優(yōu)圖長(zhǎng)期堅(jiān)持基礎(chǔ)研究和產(chǎn)業(yè)落地兩條腿走路,擁有超過(guò)1000余項(xiàng)AI相關(guān)國(guó)內(nèi)外專利,300余篇論文被CVPR、AAAI、ICCV等國(guó)際頂會(huì)收錄。在產(chǎn)業(yè)落地方面,騰訊優(yōu)圖通過(guò)騰訊云持續(xù)輸出頂尖的視覺(jué)AI能力,目前已推出超過(guò)30個(gè)行業(yè)解決方案。
? Copyright 2013 南京奧特賽人工智能技術(shù)研發(fā)有限公司 版權(quán)所有 備案號(hào):蘇ICP備19032300號(hào)-1 蘇公網(wǎng)安備32011602010459 技術(shù)支持:科威鯨網(wǎng)絡(luò)