【明報專訊】進軍韓娛之外,騰訊於人工智能(AI)研發及應用層面持續有進展。最新是旗下混元發布並開源語音數字人模型HunyuanVideo-Avatar,可藉由用家上傳的圖片及音信生成高一致性、高動態性的影片。
藉圖片音信生成全身動作影片
騰訊指,HunyuanVideo-Avatar相關技術由騰訊混元視頻大模型及騰訊音樂天琴實驗室MuseV技術聯合研發,支持頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向影片創作者提供高一致性、高動態性影片生成能力。用戶可上傳人物圖像與音信,HunyuanVideo-Avatar會自動理解其中人物所在環境、音信所蘊含情感等,並讓圖中人物自然地說話或唱歌,生成包含自然表情、唇形同步及全身動作影片。
另一邊廂,騰訊公關總監張軍在微博發文表示,旗下AI智能助手「騰訊元寶」已打通微信讀書和起點讀書,用家於元寶搜索回答的書名會添加下劃線,點擊即可直接跳轉至上述兩款App,方便用戶了解書籍信息或直接開始閱讀。
有內媒稱,早前騰訊雲AI產業應用峰會上,騰訊旗下的混元大模型等矩陣產品已獲全面升級,是次元寶打通微信讀書和起點讀書,則體現騰訊產品矩陣的生態融合正在加快。