
2025年9月15日,在國(guó)家網(wǎng)絡(luò)安全宣傳周主論壇上,《人工智能安全治理框架》2.0版(以下簡(jiǎn)稱《框架》2.0版)正式發(fā)布,這是2024年發(fā)布的《人工智能安全治理框架》1.0版(以下簡(jiǎn)稱《框架》)的升級(jí)版本。針對(duì)人工智能迅猛發(fā)展帶來的治理難點(diǎn),《框架》2.0版秉持我國(guó)一貫倡導(dǎo)的“以人為本、智能向善”的基本理念,強(qiáng)化風(fēng)險(xiǎn)識(shí)別精細(xì)化,增強(qiáng)框架動(dòng)態(tài)適應(yīng)能力并提升與國(guó)際規(guī)則銜接水平。這一新版本為我國(guó)人工智能安全治理提供更穩(wěn)固的治理框架支撐,為產(chǎn)業(yè)發(fā)展提供明確方向,也為全球治理貢獻(xiàn)系統(tǒng)化的中國(guó)方案,展現(xiàn)出重要的戰(zhàn)略價(jià)值。
一、《框架》2.0版出臺(tái)背景
隨著全球人工智能技術(shù)發(fā)展進(jìn)入加速期,技術(shù)創(chuàng)新與應(yīng)用落地呈現(xiàn)出爆發(fā)式增長(zhǎng)的態(tài)勢(shì),2024年全球人工智能市場(chǎng)規(guī)模已經(jīng)超過2792億美元,預(yù)計(jì)到2030年年復(fù)合增長(zhǎng)率將會(huì)達(dá)到35.9%。然而技術(shù)的快速發(fā)展也帶來了前所未有的安全挑戰(zhàn)與治理難題,在技術(shù)層面,人工智能系統(tǒng)的脆弱性正日益凸顯,算法偏見問題導(dǎo)致的歧視現(xiàn)象在多個(gè)領(lǐng)域已經(jīng)出現(xiàn),模型可解釋性不足讓關(guān)鍵決策過程陷入“黑箱”困境,對(duì)抗性攻擊技術(shù)的出現(xiàn)使AI系統(tǒng)面臨新的安全威脅,從應(yīng)用實(shí)踐方面來看人工智能安全事件呈現(xiàn)頻發(fā)的態(tài)勢(shì)。截至2025年4月全球已報(bào)告的深度偽造相關(guān)事件達(dá)179起,超出2024年全年總量,涉及數(shù)據(jù)泄露等多個(gè)方面,這些案件不僅侵犯了個(gè)人權(quán)益,更對(duì)社會(huì)穩(wěn)定和國(guó)家安全構(gòu)成了威脅。2024年發(fā)布的《框架》在原則確立與基礎(chǔ)構(gòu)建方面起到了重要作用,但在風(fēng)險(xiǎn)分類精細(xì)度、治理措施操作性以及國(guó)際規(guī)則兼容性等方面有待細(xì)化。面對(duì)快速迭代的技術(shù)發(fā)展和日益復(fù)雜的安全威脅,迫切需要構(gòu)建一個(gè)更加完善且更具前瞻性的治理體系。在這樣的背景下,國(guó)家相關(guān)部門組織專業(yè)力量,在深入開展調(diào)研和廣泛征求各方意見的基礎(chǔ)上制定《框架》2.0版,新框架充分吸收國(guó)內(nèi)外最新研究成果與實(shí)踐經(jīng)驗(yàn),針對(duì)當(dāng)前人工智能發(fā)展所面臨的最緊迫安全問題提出系統(tǒng)性解決方案?!犊蚣堋?.0版的出臺(tái)既是對(duì)技術(shù)發(fā)展趨勢(shì)的及時(shí)回應(yīng)之舉,也是完善國(guó)家治理體系的一項(xiàng)重要舉措,體現(xiàn)出統(tǒng)籌發(fā)展與安全的戰(zhàn)略思維,為人工智能產(chǎn)業(yè)健康有序發(fā)展提供了制度框架保障。
相較于2024年9月發(fā)布的《框架》,此次出臺(tái)的《框架》2.0版在形式上延續(xù)既有總體架構(gòu)和邏輯體系,也在理念與措施方面作出實(shí)質(zhì)性拓展?!犊蚣堋?.0版繼續(xù)保持風(fēng)險(xiǎn)識(shí)別、技術(shù)應(yīng)對(duì)、綜合治理和安全指引的框架結(jié)構(gòu),沿用風(fēng)險(xiǎn)分類、可追溯管理等治理工具確保制度一致性和可操作性。在此基礎(chǔ)上《框架》2.0版進(jìn)一步提出“可信應(yīng)用、防范失控”新原則并構(gòu)建人工智能科技倫理準(zhǔn)則,新增應(yīng)用衍生風(fēng)險(xiǎn)治理維度且強(qiáng)化開源與供應(yīng)鏈安全機(jī)制,這些新增內(nèi)容既回應(yīng)技術(shù)演進(jìn)帶來的新挑戰(zhàn),也讓治理目標(biāo)從“能否實(shí)現(xiàn)”轉(zhuǎn)變?yōu)椤叭绾呜?fù)責(zé)任地實(shí)現(xiàn)”。圍繞可信原則,《框架》2.0版將價(jià)值約束融入技術(shù)流程以確保技術(shù)發(fā)展可控可信,同時(shí)《框架》2.0版強(qiáng)調(diào)開源生態(tài)、供應(yīng)鏈管理和國(guó)際接軌推動(dòng)構(gòu)建開放協(xié)同治理格局,這一轉(zhuǎn)變使“可信”從抽象原則轉(zhuǎn)化為制度化可執(zhí)行要求,既回應(yīng)公眾對(duì)人工智能長(zhǎng)期可靠和可控的期待,也為全球治理提供系統(tǒng)化的中國(guó)方案。
二、《框架》2.0版呈現(xiàn)全方位多層次保障機(jī)制
《框架》2.0版的發(fā)布意味著我國(guó)人工智能治理體系建設(shè)步入新階段,從整體情況來看,《框架》2.0版主要涵蓋安全治理原則與總體框架、安全風(fēng)險(xiǎn)分類、技術(shù)應(yīng)對(duì)措施、綜合治理措施與安全指引等內(nèi)容,不僅構(gòu)建起較為完整的系統(tǒng)和治理體系,更關(guān)鍵的是為人工智能健康發(fā)展提供全方位多層次保障機(jī)制。
(一)作為系統(tǒng)性治理藍(lán)圖的框架全景
《框架》2.0版搭建起多層次全方位治理體系,該體系將安全治理原則與總體框架當(dāng)作總綱,明確人工智能安全治理基本方向和核心要求??偩V部分以“以人為本、智能向善”作為導(dǎo)向,遵循包容審慎、敏捷治理、技管結(jié)合、開放合作、可信應(yīng)用五大原則,既體現(xiàn)國(guó)際共識(shí)又結(jié)合中國(guó)國(guó)情,為整個(gè)治理體系提供價(jià)值導(dǎo)向和理論根基?!犊蚣堋?.0版設(shè)計(jì)14項(xiàng)綜合治理措施和4項(xiàng)安全指引,通過系統(tǒng)化設(shè)計(jì)實(shí)現(xiàn)從原則到實(shí)踐、從技術(shù)到管理的有機(jī)銜接,形成層次分明、相互支撐的治理藍(lán)圖,既考慮當(dāng)前技術(shù)發(fā)展水平又為未來技術(shù)演進(jìn)預(yù)留空間,充分體現(xiàn)框架的前瞻性和適應(yīng)性。
(二)倫理先行治理作為價(jià)值紅線
《框架》2.0版提出構(gòu)建人工智能科技倫理準(zhǔn)則,首次把科技倫理治理系統(tǒng)納入人工智能安全治理整體框架,確立倫理先行核心原則為技術(shù)健康發(fā)展劃定價(jià)值紅線,人工智能治理不再局限于算法數(shù)據(jù)算力技術(shù)性監(jiān)管,而是將生命健康、人格尊嚴(yán)、勞動(dòng)就業(yè)等關(guān)涉公共利益和社會(huì)底線要素重點(diǎn)保護(hù)。與《框架》偏重技術(shù)安全不同,《框架》2.0版實(shí)現(xiàn)從單純強(qiáng)調(diào)風(fēng)險(xiǎn)防護(hù)到技術(shù)與倫理并重深度轉(zhuǎn)型,推動(dòng)人工智能治理進(jìn)入更成熟階段,其所確立價(jià)值導(dǎo)向與治理路徑有效地提升了我國(guó)人工智能治理全面性和前瞻性,也在全球范圍提供了具有普遍意義的中國(guó)經(jīng)驗(yàn),為人工智能倫理治理國(guó)際對(duì)話與規(guī)則塑造貢獻(xiàn)制度化的參考方案。
(三)可信可控原則成為安全基石
《框架》2.0版清晰明確地提出“可信應(yīng)用、防范失控”核心原則,系統(tǒng)全面地構(gòu)建涵蓋技術(shù)防護(hù)、價(jià)值對(duì)齊與協(xié)同治理多層次可信人工智能準(zhǔn)則體系,其目的在于確保人工智能技術(shù)演進(jìn)全過程實(shí)現(xiàn)安全、可靠與可控,特別關(guān)注防范可能威脅人類生存與發(fā)展全局性失控風(fēng)險(xiǎn)。通過強(qiáng)化模型魯棒性、對(duì)抗性防御和安全驗(yàn)證等技術(shù)保障措施,積極推進(jìn)人工智能系統(tǒng)與人類意圖和價(jià)值規(guī)范實(shí)現(xiàn)深度對(duì)齊,同時(shí)建立健全跨部門、跨領(lǐng)域協(xié)同治理有效機(jī)制,最終形成可操作、可審查、可干預(yù)的治理閉環(huán),以此確保人工智能在任何階段都處于人類有效控制范圍之內(nèi)。這一原則的提出以及有效落實(shí),不僅體現(xiàn)中國(guó)對(duì)人工智能極端風(fēng)險(xiǎn)具有前瞻性應(yīng)對(duì)舉措,也為全球人工智能治理提供風(fēng)險(xiǎn)防控與可持續(xù)發(fā)展并重的重要實(shí)踐范式。
(四)新增“人工智能應(yīng)用衍生安全風(fēng)險(xiǎn)”
《框架》2.0版對(duì)人工智能風(fēng)險(xiǎn)的認(rèn)識(shí)提升到新高度。在風(fēng)險(xiǎn)分類方面,此次《框架》2.0版保留原有《框架》內(nèi)生安全風(fēng)險(xiǎn)和應(yīng)用安全風(fēng)險(xiǎn)后,新增“人工智能應(yīng)用衍生安全風(fēng)險(xiǎn)”,聚焦技術(shù)應(yīng)用環(huán)節(jié)且將人工智能可能帶來的深層次社會(huì)影響納入治理視野,這一新增維度體現(xiàn)治理視角的拓展與深化,重點(diǎn)包含社會(huì)和環(huán)境層面的系統(tǒng)沖擊以及倫理秩序?qū)用娴纳钸h(yuǎn)影響。在社會(huì)和環(huán)境安全方面,《框架》2.0版重點(diǎn)關(guān)注人工智能應(yīng)用對(duì)勞動(dòng)就業(yè)結(jié)構(gòu)與資源供需平衡的挑戰(zhàn),在倫理層面,不僅涵蓋算法偏見或數(shù)據(jù)泄露等影響個(gè)人合法權(quán)益的問題,更關(guān)注人工智能在長(zhǎng)期運(yùn)行中對(duì)社會(huì)結(jié)構(gòu)、認(rèn)知生態(tài)和公共秩序的潛在影響,比如技術(shù)對(duì)人類情感的擾動(dòng)、智能體發(fā)展對(duì)教育創(chuàng)新的沖擊與抑制以及大規(guī)模技術(shù)應(yīng)用對(duì)現(xiàn)行社會(huì)秩序和可持續(xù)發(fā)展的深遠(yuǎn)影響。
三、《框架》2.0版的意義與展望
《框架》2.0版的發(fā)布在我國(guó)人工智能治理體系里有承前啟后的意義,其不僅延續(xù)《框架》所建立起來的基本治理框架,還在制度設(shè)計(jì)與治理理念方面實(shí)現(xiàn)深度擴(kuò)展。在治理原則上,《框架》2.0版新增“可信應(yīng)用、防范失控”核心治理原則,把人工智能安全性、可靠性和可控性當(dāng)作治理底線,確保技術(shù)發(fā)展始終處在可預(yù)期、可管控的軌道之上,為研發(fā)與應(yīng)用奠定更穩(wěn)固制度保障。在治理理念上,《框架》2.0版明確提出構(gòu)建人工智能科技倫理準(zhǔn)則,并且將“倫理先行”確立成為人工智能治理工作的核心導(dǎo)向,同時(shí)把生命健康、人格尊嚴(yán)、社會(huì)公平、生態(tài)環(huán)境和可持續(xù)發(fā)展等價(jià)值嵌入人工智能全生命周期治理當(dāng)中,進(jìn)而讓倫理審查從原本邊緣化的程序轉(zhuǎn)變成為常態(tài)化機(jī)制,最終真正實(shí)現(xiàn)人工智能技術(shù)與價(jià)值的深度耦合。在風(fēng)險(xiǎn)體系上,《框架》2.0版在原有內(nèi)生安全風(fēng)險(xiǎn)和應(yīng)用安全風(fēng)險(xiǎn)基礎(chǔ)之上新增應(yīng)用衍生安全風(fēng)險(xiǎn),將治理范圍從技術(shù)研發(fā)監(jiān)管與直接應(yīng)用問題拓展到社會(huì)結(jié)構(gòu)、環(huán)境資源和倫理秩序等更深層面,進(jìn)而讓人工智能治理體系實(shí)現(xiàn)從短期防護(hù)向長(zhǎng)期評(píng)估的轉(zhuǎn)型,從點(diǎn)狀應(yīng)急走向全局統(tǒng)籌,凸顯制度設(shè)計(jì)整體性與前瞻性。
展望未來,《框架》2.0版的實(shí)施會(huì)推動(dòng)我國(guó)人工智能治理進(jìn)入制度化體系化國(guó)際化新階段,在國(guó)內(nèi)層面它會(huì)加快人工智能安全標(biāo)準(zhǔn)體系的完善進(jìn)程,推動(dòng)研發(fā)應(yīng)用和監(jiān)管全鏈條的制度能夠順利落地,并且催生合規(guī)審查風(fēng)險(xiǎn)評(píng)估倫理咨詢等新興服務(wù)產(chǎn)業(yè),形成技術(shù)創(chuàng)新與制度供給協(xié)同發(fā)展的良好格局。同時(shí)《框架》2.0版提出的“可信”原則會(huì)逐步內(nèi)化為產(chǎn)業(yè)發(fā)展核心要求,倒逼企業(yè)在技術(shù)設(shè)計(jì)中注重透明性可解釋性和責(zé)任可追溯性,從而在保障安全與倫理的前提之下推動(dòng)產(chǎn)業(yè)高質(zhì)量可持續(xù)發(fā)展。
在國(guó)際層面上,《框架》2.0版著重強(qiáng)調(diào)開放合作與共治共享,既回應(yīng)了全球人工智能治理方面的現(xiàn)實(shí)需求,也為國(guó)際規(guī)則競(jìng)爭(zhēng)提供了相應(yīng)的制度抓手。隨著人工智能于全球范圍內(nèi)得到廣泛應(yīng)用,中國(guó)在風(fēng)險(xiǎn)治理、倫理準(zhǔn)則以及制度創(chuàng)新方面的實(shí)踐經(jīng)驗(yàn),將為國(guó)際社會(huì)提供可復(fù)制的參考路徑??梢灶A(yù)見的是,未來的人工智能治理競(jìng)爭(zhēng)不只是技術(shù)和資本的競(jìng)爭(zhēng),更是制度與價(jià)值層面的競(jìng)爭(zhēng),《框架》2.0版的發(fā)布,不僅為中國(guó)在全球可信人工智能競(jìng)賽里確立制度優(yōu)勢(shì)奠定了堅(jiān)實(shí)的基礎(chǔ),也為推動(dòng)人工智能更好服務(wù)人類福祉和可持續(xù)發(fā)展指明了前進(jìn)的方向。(作者:張平,北京大學(xué)法學(xué)院教授,北京大學(xué)人工智能研究院AI安全與治理中心主任,北京大學(xué)武漢人工智能研究院副院長(zhǎng))