
1月9日,在北京召開(kāi)的中國(guó)網(wǎng)絡(luò)空間安全協(xié)會(huì)人工智能安全治理專(zhuān)業(yè)委員會(huì)工作年會(huì)上,中文互聯(lián)網(wǎng)基礎(chǔ)語(yǔ)料2.0正式向社會(huì)發(fā)布。
在中央網(wǎng)信辦指導(dǎo)下,中國(guó)網(wǎng)絡(luò)空間安全協(xié)會(huì)會(huì)同國(guó)家互聯(lián)網(wǎng)應(yīng)急中心,在前期發(fā)布中文互聯(lián)網(wǎng)基礎(chǔ)語(yǔ)料1.0的基礎(chǔ)上,持續(xù)發(fā)揮企業(yè)、高校和科研單位協(xié)同優(yōu)勢(shì),依托專(zhuān)委會(huì)建立的語(yǔ)料共建共享機(jī)制,匯聚一批新的高質(zhì)量可信數(shù)據(jù),經(jīng)過(guò)信源篩選、內(nèi)容過(guò)濾、數(shù)據(jù)去重等一系列嚴(yán)格細(xì)致的數(shù)據(jù)加工處理措施,形成并對(duì)社會(huì)發(fā)布中文互聯(lián)網(wǎng)基礎(chǔ)語(yǔ)料2.0,規(guī)模120GB,數(shù)據(jù)3800萬(wàn)條。用戶(hù)登錄中國(guó)網(wǎng)絡(luò)空間安全協(xié)會(huì)網(wǎng)站(https://www.cybersac.cn/newhome),點(diǎn)擊“中文互聯(lián)網(wǎng)語(yǔ)料資源平臺(tái)”鏈接,通過(guò)注冊(cè)、認(rèn)證等程序,即可下載相關(guān)語(yǔ)料。
網(wǎng)安協(xié)會(huì)人工智能安全治理專(zhuān)委會(huì)負(fù)責(zé)人表示,數(shù)據(jù)是發(fā)展人工智能的基礎(chǔ)關(guān)鍵資源,中文互聯(lián)網(wǎng)基礎(chǔ)語(yǔ)料2.0是各界協(xié)同共建高質(zhì)量中文語(yǔ)料的又一重要成果。專(zhuān)委會(huì)將持續(xù)加強(qiáng)中文互聯(lián)網(wǎng)基礎(chǔ)語(yǔ)料建設(shè),為人工智能技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展提供有力支撐和保障。
來(lái)自專(zhuān)委會(huì)成員單位、大模型備案機(jī)構(gòu)和相關(guān)領(lǐng)域科研、企業(yè)、社會(huì)組織代表150多人參加發(fā)布儀式。