首頁(yè) > 正文

主流價(jià)值語(yǔ)料庫(kù)

2024-10-14 15:08 | 來(lái)源: 中國(guó)記協(xié)網(wǎng)
【字號(hào): 打印  
Video PlayerClose

  主流價(jià)值語(yǔ)料庫(kù)圍繞習(xí)近平新時(shí)代中國(guó)特色社會(huì)主義思想和中國(guó)式現(xiàn)代化涉及的經(jīng)濟(jì)、政治、法治、科教、文化、民生、生態(tài)等十幾個(gè)領(lǐng)域,在對(duì)國(guó)內(nèi)外主流大模型進(jìn)行安全評(píng)測(cè)的基礎(chǔ)上,針對(duì)大模型普遍遇到的意識(shí)形態(tài)安全問(wèn)題,依托黨報(bào)黨網(wǎng)長(zhǎng)期建設(shè)發(fā)展形成的權(quán)威優(yōu)質(zhì)資源,以及黨和國(guó)家重要文獻(xiàn)資源,科學(xué)歸集、清洗、標(biāo)注、風(fēng)控,重點(diǎn)建設(shè)基礎(chǔ)語(yǔ)料、圖文語(yǔ)料、問(wèn)答語(yǔ)料等多類(lèi)語(yǔ)料,賦能人工智能的價(jià)值觀對(duì)齊,滿足全面性、專(zhuān)業(yè)性、時(shí)效性、導(dǎo)向正確性的要求,為人工智能大模型的安全持續(xù)發(fā)展護(hù)航。

  主流價(jià)值語(yǔ)料庫(kù)總體規(guī)模超過(guò)30T,其中基礎(chǔ)語(yǔ)料超過(guò)300億字,問(wèn)答語(yǔ)料超過(guò)17萬(wàn)對(duì)。與多個(gè)國(guó)內(nèi)主流大模型進(jìn)行集成對(duì)接,糾偏效果明顯。

責(zé)任編輯: 葛燕燕
010090110010000000000000011100001310786610