
一份内部泄露资料揭露了索尼为 PlayStation 进行的人工智能驱动角色技术实验。据称,一段机密视频展示了《地平线》系列主角埃洛伊所具备的高级对话式人工智能能力,随后该视频被迅速从 YouTube 撤下。
索尼人工智能角色原型背后的故事
科技媒体 The Verge 获取了一段影片,展示了 PlayStation Studios 的技术演示,其中出现了由人工智能驱动的《地平线》主角埃洛伊版本。据报道,该演示由索尼互动娱乐的先进技术团队与 Guerrilla Games 合作开发。
在收到与索尼有关联的版权执行公司 Muso 提出的版权主张后,该视频随即被撤下,这增加了其真实性。当 IGN 联系索尼时,索尼拒绝对泄露材料发表评论。
在演示中,软件工程总监 Sharwin Raghoebardajal 使用一个结合了以下技术的多模态系统与人工智能埃洛伊进行对话:
- 利用 OpenAI 的 Whisper 进行语音识别
- 使用 GPT-4 和 Llama 3 进行对话处理
- 索尼专有的情感语音合成技术
- 利用 Mockingbird 技术进行面部动画制作
人工智能埃洛伊的“恐怖谷”效应
该演示揭示了人工智能游戏伙伴的潜力与当前的局限性。尽管这位合成的埃洛伊能够就《地平线》的故事线保持连贯的对话,但她表现出了机器人般的语音表达和僵硬的面部动画——与原配音演员 Ashly Burch 的标志性表演相去甚远。
尤其令人感觉不协调的时刻发生在 Raghoebardajal 在游戏中操控埃洛伊,同时与她的人工智能版本进行对话的时候。该演示显著地借用了《地平线》系列中的克隆叙事前提,同时展示了人工智能角色的复制。
游戏行业的人工智能军备竞赛
尽管索尼尚未确认将此技术商业化的计划,但这起泄露事件符合更广泛的行业趋势:
- 微软正在开发用于游戏设计的 Muse AI
- EA 宣布人工智能是未来发展的核心
- 卡普空正在测试将生成式人工智能用于环境设计
索尼 PlayStation Productions 负责人 Asad Qizilbash 此前曾强调人工智能在满足年轻玩家对个性化体验期望方面的作用:“非玩家角色可以根据玩家的行动与之互动,让 Z 世代和 Alpha 世代受众感觉体验更加个人化。”
然而,该技术面临着重大障碍,正如 Keywords Studios 完全依赖人工智能开发游戏的实验失败以及社区对《使命召唤》中人工智能生成素材的抵制所证明的那样。游戏社区对于人工智能的创作局限性和伦理影响仍存在分歧。
索尼的演示似乎更侧重于内部研发,而非即将进行的产品整合,正如 Raghoebardajal 所言:“这只是对未来可能性的一个缩影。” 该原型表明 PlayStation 对人工智能伙伴的兴趣,但当前的技术限制和创作担忧可能会推迟其实用化进程。