Video PlayerClose
主流價(jià)值語料庫圍繞習(xí)近平新時(shí)代中國特色社會(huì)主義思想和中國式現(xiàn)代化涉及的經(jīng)濟(jì)、政治、法治、科教、文化、民生、生態(tài)等十幾個(gè)領(lǐng)域,在對國內(nèi)外主流大模型進(jìn)行安全評測的基礎(chǔ)上,針對大模型普遍遇到的意識形態(tài)安全問題,依托黨報(bào)黨網(wǎng)長期建設(shè)發(fā)展形成的權(quán)威優(yōu)質(zhì)資源,以及黨和國家重要文獻(xiàn)資源,科學(xué)歸集、清洗、標(biāo)注、風(fēng)控,重點(diǎn)建設(shè)基礎(chǔ)語料、圖文語料、問答語料等多類語料,賦能人工智能的價(jià)值觀對齊,滿足全面性、專業(yè)性、時(shí)效性、導(dǎo)向正確性的要求,為人工智能大模型的安全持續(xù)發(fā)展護(hù)航。
主流價(jià)值語料庫總體規(guī)模超過30T,其中基礎(chǔ)語料超過300億字,問答語料超過17萬對。與多個(gè)國內(nèi)主流大模型進(jìn)行集成對接,糾偏效果明顯。
責(zé)任編輯: 葛燕燕