
2025年9月15日,在2025年國(guó)家網(wǎng)絡(luò)安全宣傳周主論壇上,《人工智能安全治理框架》2.0版(以下簡(jiǎn)稱《框架》2.0版)正式發(fā)布。這是繼2024年9月發(fā)布《人工智能安全治理框架》1.0版(以下簡(jiǎn)稱《框架》)后的又一重大制度性成果,體現(xiàn)了我國(guó)在人工智能安全治理領(lǐng)域持續(xù)深化、與時(shí)俱進(jìn)的戰(zhàn)略布局?!犊蚣堋?.0版在前一版本的基礎(chǔ)上,梳理調(diào)整了風(fēng)險(xiǎn)分類,探索提出分級(jí)治理原則,強(qiáng)化全生命周期技術(shù)治理手段,標(biāo)志著我國(guó)人工智能治理理念從“初步確立”邁向“體系升級(jí)”,為推動(dòng)人工智能在安全可控前提下健康發(fā)展提供了制度保障和戰(zhàn)略引領(lǐng)。
一、細(xì)化風(fēng)險(xiǎn)分類:風(fēng)險(xiǎn)體系的升級(jí)與調(diào)整
在風(fēng)險(xiǎn)體系上,《人工智能安全治理框架》1.0版將人工智能安全風(fēng)險(xiǎn)分為“內(nèi)生安全風(fēng)險(xiǎn)”和“應(yīng)用安全風(fēng)險(xiǎn)”兩大類,主要聚焦算法、數(shù)據(jù)、系統(tǒng)本身以及在應(yīng)用中可能引發(fā)的現(xiàn)實(shí)、網(wǎng)絡(luò)、認(rèn)知與倫理問(wèn)題。而《框架》2.0版則對(duì)風(fēng)險(xiǎn)分類進(jìn)行了系統(tǒng)優(yōu)化,將安全風(fēng)險(xiǎn)細(xì)化為三類:技術(shù)內(nèi)生安全風(fēng)險(xiǎn)、技術(shù)應(yīng)用安全風(fēng)險(xiǎn)和應(yīng)用衍生安全風(fēng)險(xiǎn)。其中,技術(shù)內(nèi)生安全風(fēng)險(xiǎn)主要指算法模型、數(shù)據(jù)、系統(tǒng)等自身帶來(lái)的風(fēng)險(xiǎn),還特別增加了“模型開(kāi)源風(fēng)險(xiǎn)”,指出基礎(chǔ)模型開(kāi)源可能被不法分子用于訓(xùn)練“作惡模型”;技術(shù)應(yīng)用安全風(fēng)險(xiǎn)側(cè)重模型在具體應(yīng)用中的風(fēng)險(xiǎn),強(qiáng)調(diào)低質(zhì)有害信息經(jīng)網(wǎng)絡(luò)擴(kuò)散會(huì)污染內(nèi)容生態(tài);應(yīng)用衍生安全風(fēng)險(xiǎn)則明確指向人工智能應(yīng)用衍生出的社會(huì)層面風(fēng)險(xiǎn),如沖擊就業(yè)結(jié)構(gòu)、資源供需平衡、科研倫理風(fēng)險(xiǎn)等,例如“AI+科研”可能降低高倫理風(fēng)險(xiǎn)科研領(lǐng)域的準(zhǔn)入門檻,引發(fā)違背社會(huì)倫理的研究行為等。這一調(diào)整體現(xiàn)了治理思路從“靜態(tài)治理”向“動(dòng)態(tài)治理”的轉(zhuǎn)變,不僅關(guān)注技術(shù)本身的安全性,也兼顧其在復(fù)雜社會(huì)環(huán)境中的外溢效應(yīng)。
二、強(qiáng)化技術(shù)治理:構(gòu)建全生命周期安全能力
在技術(shù)治理方面,此次發(fā)布的《框架》2.0版引入了多項(xiàng)全新舉措,突出研發(fā)與應(yīng)用的全生命周期安全治理理念,特別指出要在人工智能系統(tǒng)的設(shè)計(jì)、開(kāi)發(fā)、測(cè)試、部署、運(yùn)維等各個(gè)環(huán)節(jié)全面嵌入安全考量。對(duì)比《框架》,《框架》2.0版明顯加大了對(duì)技術(shù)和工程措施的重視,體現(xiàn)了從技術(shù)到管理的協(xié)同框架。前者的技術(shù)應(yīng)對(duì)措施主要針對(duì)模型算法、訓(xùn)練數(shù)據(jù)、算力設(shè)施等提出靜態(tài)加固手段,而新版則更多強(qiáng)調(diào)持續(xù)演進(jìn)與動(dòng)態(tài)更新。例如,《框架》2.0版要求建立治理措施動(dòng)態(tài)調(diào)整機(jī)制,應(yīng)對(duì)技術(shù)迭代帶來(lái)的不確定性;新增的“分級(jí)管理”也意味著根據(jù)不同風(fēng)險(xiǎn)等級(jí)采取差異化的技術(shù)手段。
這些變化標(biāo)志著我國(guó)的人工智能治理思路正在從“被動(dòng)補(bǔ)救”向“主動(dòng)駕馭”轉(zhuǎn)變,希望建立更敏捷、高動(dòng)態(tài)的治理體系。同時(shí),《框架》2.0版的技術(shù)治理更加側(cè)重早期介入、全環(huán)節(jié)覆蓋與靈活調(diào)整,與國(guó)際上推動(dòng)可信AI和安全評(píng)估的趨勢(shì)更加契合。國(guó)內(nèi)科研機(jī)構(gòu)制定技術(shù)標(biāo)準(zhǔn)與評(píng)測(cè)體系,搭建了算法安全評(píng)估試驗(yàn)場(chǎng)基礎(chǔ)設(shè)施,支撐從數(shù)據(jù)安全評(píng)估、模型設(shè)計(jì)與開(kāi)發(fā)安全審計(jì)、算法運(yùn)行時(shí)風(fēng)險(xiǎn)監(jiān)測(cè)等貫穿全生命周期的智能算法安全評(píng)估,與《框架》2.0版重點(diǎn)強(qiáng)調(diào)的全生命周期安全治理不謀而合,也為框架的落地實(shí)施提供了可行的技術(shù)路徑支撐。
三、人才培養(yǎng)與共治共享:共建協(xié)同治理生態(tài)
此外,《框架》2.0版在人才培養(yǎng)方面和共治共享方面也有一些新表述和新觀點(diǎn)值得關(guān)注。
在人才培養(yǎng)方面,此前的《框架》曾提出“加大人工智能安全人才培養(yǎng)力度”,要求推動(dòng)AI安全教育與學(xué)科同步發(fā)展、依托學(xué)校和科研機(jī)構(gòu)培養(yǎng)AI安全設(shè)計(jì)、開(kāi)發(fā)和治理人才。新版本延續(xù)了這一思路,并倡導(dǎo)通過(guò)高校、企業(yè)與政府合作培養(yǎng)復(fù)合型安全人才。有國(guó)內(nèi)媒體就此評(píng)論:“《框架》2.0版發(fā)布后,需要與產(chǎn)業(yè)、學(xué)界共同落實(shí)人才培養(yǎng)計(jì)劃,形成產(chǎn)學(xué)研一體化的良性互動(dòng)。”
在共治共享方面,新框架明確倡導(dǎo)多方協(xié)同和跨界治理。中央網(wǎng)信辦指出,《框架》2.0版將促進(jìn)構(gòu)建“跨國(guó)界、跨領(lǐng)域、跨行業(yè)的協(xié)同治理格局”,推動(dòng)國(guó)際多邊合作和技術(shù)成果共享。也就是說(shuō),《框架》2.0版不僅繼續(xù)強(qiáng)調(diào)國(guó)際規(guī)則和最佳實(shí)踐的共享,也突出不同部門、領(lǐng)域和國(guó)家之間的聯(lián)動(dòng)機(jī)制。
這一升級(jí)體現(xiàn)出人工智能安全治理從“單點(diǎn)發(fā)力”向“體系聯(lián)動(dòng)”的轉(zhuǎn)變:一方面,通過(guò)系統(tǒng)化的人才培養(yǎng)為治理體系提供長(zhǎng)效支撐;另一方面,以多元主體的協(xié)同合作,形成法律、倫理與標(biāo)準(zhǔn)的共同約束力和執(zhí)行力。這不僅是我國(guó)對(duì)人工智能安全治理的深化布局,也是面向全球的制度性貢獻(xiàn),有望推動(dòng)形成廣泛的國(guó)際共識(shí)與合作機(jī)制。
總體來(lái)看,《框架》2.0版在風(fēng)險(xiǎn)分類上實(shí)現(xiàn)了更為細(xì)化和全面的體系升級(jí),在治理方式上體現(xiàn)出從被動(dòng)向主動(dòng)的范式轉(zhuǎn)變,在生態(tài)建設(shè)上凸顯了跨界協(xié)同和共治共享的戰(zhàn)略導(dǎo)向。這不僅為我國(guó)人工智能安全治理提供了制度性遵循,也為國(guó)際治理貢獻(xiàn)了具有中國(guó)特色的“中國(guó)方案”。(作者:程學(xué)旗,中國(guó)科學(xué)院計(jì)算技術(shù)研究所副所長(zhǎng)、研究員)