admin 2025-01-04
109
机器之心报道
这几天,大洋彼岸杀疯了!
Luma的热乎劲儿还没过去,昨晚Runway就甩出一个王炸——Gen-3Alpha。(查看详情请移步:Runway版Sora发布:高保真、超强一致性,Gen-3Alpha震撼到网友了)
音频提示:紧张刺激的恐怖片配乐,脚步声在混凝土上回响。(Cinematic,thriller,horrorfilm,music,tension,ambience,footstepsonconcrete)
黑灯瞎火的废弃仓库中,一个黑衣人犹如鬼魅般缓行,再配上诡异的音乐和脚步声,恐怖气氛拉满。
音频提示:狼在月光下的长嚎。(Wolfhowlingatthemoon)
音频提示:汽车打滑声、引擎轰鸣声,伴随着天使般的电子音乐。(carsskidding,carenginethrottling,angelicelectronicmusic)
这种灵活性让用户对音频输出有了更多的控制,可以快速尝试不同的音频输出,并选择最佳匹配。
音频提示:一艘宇宙飞船在浩瀚的太空中疾驰,星星在它周围划过,高速飞行,充满科幻感。(Aspaceshiphurtlesthroughthevastnessofspace,starsstreakingpastit,highspeed,Sci-fi)
音频提示:一艘宇宙飞船在广袤的太空中高速穿梭,星星在它周围飞速掠过,具有科幻感。(Aspaceshiphurtlesthroughthevastnessofspace,starsstreakingpastit,highspeed,Sci-fi)
同时,他们也在优化唇形同步功能。
音频提示:音乐,文本转录「这只火鸡看起来好极了,我好饿。」(Music,Transcript:“thisturkeylooksamazing,I’msohungry”)
或许是由于深度伪造技术带来诸多社会问题,GoogleDeepMind求生欲满满,一个劲承诺将负责任开发和部署AI技术,在向公众开放之前,V2A技术将经过严格的安全评估和测试。
此外,他们还整合了SynthID工具包到V2A研究中,为所有AI生成的内容添加水印,以防止技术的滥用。