11月24日,由中央網(wǎng)信辦、中央廣播電視總臺、廣東省委網(wǎng)信委聯(lián)合主辦的2021中國網(wǎng)絡(luò)媒體論壇在廣東省廣州市開幕。在技術(shù)論壇上,人民日報(bào)社傳播內(nèi)容認(rèn)知國家重點(diǎn)實(shí)驗(yàn)室與人民中科共同發(fā)布了全球首款面向內(nèi)容安全的跨模態(tài)視頻搜索引擎——“白澤”,人民日報(bào)社傳播內(nèi)容認(rèn)知國家重點(diǎn)實(shí)驗(yàn)室主任,人民網(wǎng)黨委書記、董事長、總裁葉蓁蓁介紹了相關(guān)情況。
據(jù)悉,內(nèi)容風(fēng)控大腦是對全網(wǎng)海量內(nèi)容進(jìn)行高通量感知、機(jī)器理解、智能檢索并自主進(jìn)化的計(jì)算平臺,“白澤”則是該計(jì)算平臺的核心組件。內(nèi)容風(fēng)控大腦全部技術(shù)組件均實(shí)現(xiàn)國產(chǎn)化部署,提供視頻搜索、內(nèi)容風(fēng)控、開源情報(bào)、反詐反恐、內(nèi)容溯源、版權(quán)保護(hù)、實(shí)訓(xùn)靶場等多功能。鑒于跨平臺、跨模態(tài)的視頻搜索引擎是探索數(shù)字世界的重要工具,有巨大社會價值和商業(yè)前景,該引擎擬獨(dú)立運(yùn)營,以“白澤”作為商品名對外提供服務(wù)。
葉蓁蓁表示,當(dāng)前,各大主流媒體已進(jìn)入多模態(tài)階段,可實(shí)現(xiàn)文字、圖片、視頻搜索,但相互間的壁壘依然存在,人民網(wǎng)率先進(jìn)入跨模態(tài)搜索領(lǐng)域,實(shí)現(xiàn)文字、圖片、音視頻互聯(lián)互通。
當(dāng)前,基于單個模態(tài)的內(nèi)容提取及簡單規(guī)則匹配的內(nèi)容分析策略,已無法滿足實(shí)際工作需要。對此,各廠商紛紛推出基于多模態(tài)融合和復(fù)合規(guī)則判斷的多模態(tài)策略,但仍面臨依賴大規(guī)模算力、模態(tài)之間信息相互隔離、運(yùn)行和維護(hù)成本高、資源復(fù)用率低等問題。此次發(fā)布的“白澤”引擎,基于跨模態(tài)視頻檢索的策略,其跨模態(tài)引擎可實(shí)現(xiàn)單模態(tài)語義理解、多模態(tài)信息融合、跨模態(tài)語義關(guān)聯(lián),補(bǔ)全單一模態(tài)信息不足的現(xiàn)狀,打破模態(tài)間信息孤島。
據(jù)介紹,“白澤”引擎將文字、圖片、語音和視頻等不同模態(tài)信息映射到一個統(tǒng)一特征表示空間,以視頻為核心,學(xué)習(xí)多個模態(tài)間統(tǒng)一的距離度量,跨越文字、語音、視頻等多模態(tài)內(nèi)容的語義鴻溝,自動關(guān)聯(lián)多模態(tài)間關(guān)鍵要素。
在此背景下,“白澤”引擎無需配置傳統(tǒng)內(nèi)容搜索所需的復(fù)雜匹配規(guī)則,通過自然語言描述即可快速檢索出相同語義的視頻,在不需要依賴大規(guī)模算力的情況下,有效應(yīng)對新事件和突發(fā)事件,資源復(fù)用率高。
此外,面向內(nèi)容安全,“白澤”結(jié)合對境內(nèi)外多平臺內(nèi)容的檢索,可跨平臺實(shí)現(xiàn)文本搜圖片、文本搜視頻、圖片搜視頻、視頻搜視頻、圖片搜文字、視頻搜文字等功能。在論壇現(xiàn)場,葉蓁蓁展示了“白澤”在視頻搜索、溯源和辟謠、版權(quán)監(jiān)測、視頻生產(chǎn)等商業(yè)化應(yīng)用場景的功能。
同時,為提升“白澤”引擎的安全和效率,人民中科基于華為昇騰芯片研發(fā)了面向內(nèi)容理解的“雨燕”智能計(jì)算加速卡,并采用全自主研發(fā)的模型壓縮和加速算法,同等條件下能夠?qū)崿F(xiàn)4倍效率的提升。
轉(zhuǎn)自:人民網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀