近日,阿里巴巴在數(shù)字人領(lǐng)域動作頻頻,推出了多款創(chuàng)新產(chǎn)品和技術(shù),進一步推動了數(shù)字人技術(shù)的發(fā)展和應(yīng)用。
其中,EchoMimicV2實現(xiàn)了從數(shù)字人頭到數(shù)字人的飛躍。用戶只需輸入圖片、手勢視頻和音頻,即可生成一個完整的數(shù)字人。這一技術(shù)的突破,使得數(shù)字人的生成更加便捷和高效,為數(shù)字人在各個領(lǐng)域的應(yīng)用提供了更廣闊的空間。
同時,阿里云推出的Live Portrait數(shù)字人視頻生成工具也備受關(guān)注。該工具允許用戶通過上傳照片和文本或語音,即可生成數(shù)字人視頻。這一工具的應(yīng)用場景非常廣泛,可以用于在線教育、虛擬主播、數(shù)字營銷等多個領(lǐng)域,為用戶帶來更加生動、真實的數(shù)字人體驗。
此外,阿里巴巴還在積極研發(fā)“數(shù)字人+終端”新形態(tài),探索數(shù)字人在可持續(xù)、大規(guī)模、組合式場景與用戶的交互。這一舉措將進一步推動數(shù)字人技術(shù)的發(fā)展和應(yīng)用,為數(shù)字人走進人們的生活提供更多可能性。
除了阿里巴巴,其他企業(yè)也在數(shù)字人領(lǐng)域積極探索。美圖推出的DreamAvatar AI數(shù)字人生成工具,能幫助用戶實時生成文章、繪畫等內(nèi)容,為用戶提供更加豐富的創(chuàng)作體驗。FlipSketch則旨在將草圖轉(zhuǎn)換為草圖風格動畫,雖然效果還有提升空間,但其開源的特性為開發(fā)者提供了更多學習和探索的機會。
此外,MangaEditor作為多功能漫畫創(chuàng)作工具,連接了多個平臺,功能齊全且開源,為漫畫創(chuàng)作者提供了更加便捷的創(chuàng)作環(huán)境。InstantX推出的RAG-Diffusion能夠精確布局與圖像重繪,效果出色,還支持與LoRA一起使用,為圖像生成和編輯提供了更多可能性。
在視頻處理方面,Runway推出了全新擴展視頻功能,支持縱橫比轉(zhuǎn)換,類似于PS的內(nèi)容填充視頻版,為視頻編輯者提供了更多創(chuàng)意空間。LTX-Video則是最新開源的視頻生成模型,生成速度快但質(zhì)量遜于商業(yè)模型,不過其開源的特性仍然吸引了眾多開發(fā)者的關(guān)注。Image2Body則能將繪畫圖片轉(zhuǎn)為線稿草圖,適合學習繪畫的用戶使用。
綜上所述,隨著技術(shù)的不斷進步和應(yīng)用場景的不斷拓展,數(shù)字人技術(shù)正在逐漸走進人們的生活。阿里巴巴等企業(yè)的積極探索和創(chuàng)新,將進一步推動數(shù)字人技術(shù)的發(fā)展和應(yīng)用,為數(shù)字人產(chǎn)業(yè)的蓬勃發(fā)展注入新的活力。