首頁(yè) > 正文

阿里王翼:AI語(yǔ)音賦能無障礙劇場(chǎng)

2024-10-16 16:33 | 來源: 中國(guó)記協(xié)網(wǎng)
【字號(hào): 打印  
Video PlayerClose

  優(yōu)酷于2022年1月正式提出“生產(chǎn)好內(nèi)容、共建好行業(yè)、帶動(dòng)好風(fēng)氣”的社會(huì)責(zé)任戰(zhàn)略。優(yōu)酷追求的不僅是內(nèi)容的精品化,更是通過綠色實(shí)踐、科技創(chuàng)新、弱勢(shì)關(guān)懷和文化傳播,為用戶帶來多彩的生活體驗(yàn),為行業(yè)樹立健康的發(fā)展標(biāo)桿,為社會(huì)傳遞正向的價(jià)值引導(dǎo)。

  在弱勢(shì)關(guān)懷方面,優(yōu)酷希望服務(wù)好包括銀發(fā)長(zhǎng)者、未成年人、殘障人士和邊遠(yuǎn)貧困等不同社會(huì)群體的需求,先后推出了 “光明優(yōu)酷藝術(shù)教室”“優(yōu)酷無障礙劇場(chǎng)”“優(yōu)酷銀發(fā)劇場(chǎng)”“微光入夢(mèng)·無障礙劇場(chǎng)鄉(xiāng)村公益行”等一系列可持續(xù)的公益項(xiàng)目,并帶動(dòng)了越來越多的同行業(yè)者成為了公益同路人。

  明星AI解說是優(yōu)酷無障礙劇場(chǎng)的一個(gè)功能。優(yōu)酷無障礙劇場(chǎng)上線于2021年12月3日,劇場(chǎng)致力于讓全國(guó)1750萬(wàn)視礙用戶可以像普通人一樣平等地享受精神文明成果。優(yōu)酷努力追求在新熱影視作品上線平臺(tái)后,可以同步推出無障礙版本,使得視障用戶在優(yōu)酷首次體驗(yàn)到了“追劇”的樂趣。同時(shí),我們還舉辦了“尋找最酷的聲音——視障者朗讀展示評(píng)選活動(dòng)”“阿炳杯-盲人器樂獨(dú)奏大賽”等線下助殘活動(dòng),我們希望有才華的視障藝術(shù)家能夠在優(yōu)酷平臺(tái)被全世界看見。

  說起AI解說,它緣起于我們?cè)?023年9月為電影《不虛此行》舉辦的一場(chǎng)無障礙首映禮,在首映禮現(xiàn)場(chǎng)我們看到視障觀眾也有著強(qiáng)烈的追星需求。在與視障觀眾的交流互動(dòng)過程中,導(dǎo)演劉伽茵一度哽咽,她說《不虛此行》原名叫《傾聽》,在這場(chǎng)特殊的放映中,大家用另外一種方式接收到這部電影,“希望大家看完之后心里能有安慰和力量。”

  在文娛產(chǎn)業(yè)全面擁抱AI的背景下,優(yōu)酷看到了AI賦能公益的潛力,我們可以邀請(qǐng)有愛心的明星來為影視節(jié)目做無障礙解說,并利用AI技術(shù)將其延展到更多內(nèi)容上,使得視障觀眾可以聽到由她喜愛的明星為她講述的影視節(jié)目。經(jīng)過前后三個(gè)月的技術(shù)研發(fā)和產(chǎn)品打磨,明星AI解說功能于5月19日正式發(fā)布。

  我們不僅制作了明星AI解說版,還制作了多部由普通視障朋友解說的AI無障礙電影。

  研發(fā)AI語(yǔ)音解說的過程不是一帆風(fēng)順的,我們解決了很多關(guān)鍵問題,其中包括:如何高效分離人物聲紋特征、如何準(zhǔn)確模仿人物音色、以及如何讓解說聲音達(dá)到影視級(jí)清晰度等問題。經(jīng)過探索,優(yōu)酷自研了一套聲音分離系統(tǒng),結(jié)合了聲紋聚類、背景音分離、語(yǔ)音降噪技術(shù),構(gòu)建了自動(dòng)處理數(shù)據(jù)的完整管線;自研了音色訓(xùn)練大模型,實(shí)現(xiàn)了跨語(yǔ)種的靈活轉(zhuǎn)換,減少音色泄露和不穩(wěn)定性,可實(shí)現(xiàn)更高的人聲相似度和情緒控制;我們還實(shí)現(xiàn)了模型訓(xùn)練采樣率從16khz清晰度到48khz的清晰度升級(jí),力求最終達(dá)到影視級(jí)別的聲音清晰度。

  每一部無障礙節(jié)目,我們都提供多個(gè)版本的AI解說,用戶可以自由切換,但是這個(gè)切換會(huì)引起視頻重新起播,體驗(yàn)存在頓挫感。這看起來是個(gè)小細(xì)節(jié),但是我們力求把它做到極致,我們采用CMAF音視頻分離技術(shù),切換配音的時(shí)候只切換音頻,視頻一直保持播放,實(shí)現(xiàn)了聲音的無縫順滑切換。

  通過在AI語(yǔ)音賦能無障礙劇場(chǎng)方面的探索,我們看到了AI科技與文藝的融合可以為殘障用戶打開一扇新的大門。隨著AI的不斷進(jìn)步,我們有責(zé)任確保每個(gè)人都能享受到科技帶來的便利,無論他們的身體狀況如何。AI語(yǔ)音技術(shù)在無障礙劇場(chǎng)的應(yīng)用,不僅是一項(xiàng)技術(shù)革新,更是一種人文關(guān)懷,我們相信“公益?zhèn)魃婆e、AI有溫度、文藝觸人心”。

  弱勢(shì)群體的關(guān)懷和信息無障礙的建設(shè)是一個(gè)長(zhǎng)期過程,它需要我們每一個(gè)人的參與和支持。讓我們攜手同行,用AI科技的力量,為殘障用戶搭建起一座座通往藝術(shù)世界的橋梁。(作者王翼系阿里文娛ESG工作委員會(huì)秘書長(zhǎng))

責(zé)任編輯: 葛燕燕
010090110010000000000000011124141310786734