利兹大学的研究人员使用机器学习创建了一个自动化的视频头像,在其中灌入角色的声音说话
这可能令人不安?利兹大学的研究人员使用机器学习创建了一个自动化的视频头像,在其中灌入角色的声音说话。结果这个系统,利用这些角色信息,产生了视频聊天机器人:乔伊。
研究人员詹姆斯·查尔斯·德里克·麦基和大卫-豪格提供了一个概念证明他们所谓的“生成计算模型的一个人的运动,外表,演讲,语言和他们的交互和行为风格。
“解构了所有朋友的模式后,他们创造了语言模型,能够建立新的句子的乔伊。然后他们匹配新的演讲与相应的嘴位置,使他具有原始性能。
在未来,像苹果和亚马逊这样的公司将使用这样的技术来创建视频表示他们的语音助手,Siri,Alexa。
这项技术也可以用来创建更多的交互性。“这个模型可以产生全新的互动内容,有效地渲染大家,你可以把他想象成是与活生生得人在聊天”
乔伊说一对句子生成的语言模型。模型根据指示应对事情。比如他在交谈时会模拟出说“我喜欢奶酪披萨”和“老兄,我不在乎。"的性格。这可能达不到的噼啪声对话系列的最佳剧集,但它仍然指向未来,我们都将能够创建完成,fan-scripted朋友(未来可能尝试出更多的人。)
豪格,利兹,人工智能教授在接受采访时表示,下一步将是建立一个交互式机器人的部分研究人员组装。用户可以问乔伊一个问题,和模型开发的研究人员将尝试生成一个响应。
“乔伊知道所有东西”
但模型不会真正引人注目,直到他们有更好的理解他们的世界,无论是虚构或真实,豪格说。研究人员可以大致模拟乔伊可能使用的短语,但是他们还不能模拟他的性格。
“主要的问题是都是表面建模,”他说。“它需要更深层次模型来做任何事情真的很有趣。“更好的模型可能知道罗斯和莫妮卡是兄弟姐妹,例如,或者菲比的词曲作者是“臭猫。
“乔伊知道各种各样的东西,这些东西影响他在节目中说,”豪格说。
豪格说,研究人员计划提交他们的工作发表在杂志上。与此同时,我们还有很长的路从接收视频明信片离开所爱的人对我们的生日。但利兹研究者的概念证明显示状态的艺术推进的速度有多快。