团团资源网
当前位置: 首页>科技资讯>腾讯发布首创语音操控FPS游戏AI队友,智能解析指令实现意图协同

腾讯发布首创语音操控FPS游戏AI队友,智能解析指令实现意图协同

时间:2024-08-27 13:06:47

人气:3

编辑:团团资源网

近日消息,在最近举办的2024科隆游戏展上,备受瞩目的《暗区突围》端游以海外版《Arena Breakout: Infinite》的姿态精彩登场,吸引了众多游戏爱好者的目光。

腾讯发布首创语音操控FPS游戏AI队友,智能解析指令实现意图协同

更值得关注的是,魔方工作室群技术团队与《暗区突围》项目团队携手合作,震撼发布了名为F.A.C.U.L.的语音指挥FPS AI系统,该系统被誉为全球首创,预示着游戏内战术指挥与交互体验将迎来革新升级,为玩家带来前所未有的沉浸式战斗策略体验。

据官方介绍,该产品是全球第一个“能听懂人类语言”的 FPS AI 队友,应用了生成式 AI 技术,包括语音输入、大语言模型、实时语音合成和环境识别等。其支持玩家用语音直接输入复杂战术指令,还能以此推测玩家意图并用 AI 语音实时反馈。

相比于此前 FPS 玩家只能通过快捷键、指令轮盘来向 AI 队友下达“跟随”“防守”“撤退”等命令,玩家可以在全局游戏过程中直接通过语音指挥该工具,也可以同时输入一系列不同的指令。在完成这些复杂指令后,该工具还会用语音告诉玩家更多有关的信息。

此外,其应用了环境实时感知技术,号称可以实现“如同真人队友”的各种行动。该工具能够识别超 10000 个游戏内物体,包括建筑物,汽车,可收藏物品等,还能分辨不同的颜色和材质;对玩家的对话做出有趣的反馈,进行实时环境天气的感知与辨认,做出丰富多样的动作。

例如“重复起立蹲下吸引火力“你去舔包”“给我一把枪”等指令,该工具还能够通过分析目前形势,灵活选择听从或拒绝。

《智影》小程序新玩法:AI魔法打造个性化视频,限时体验免费创作!

腾讯智影小程序在7月9日迎来了一项创新升级,正式推出了智影AI视频特性。这一新功能让用户得以轻松创作个性化视频内容,仅需简单操作即可赋予视频独特的日漫风格,为视频作品增添一抹二次元的魅力。

《智影》小程序新玩法:AI魔法打造个性化视频,限时体验免费创作!

目前,该风格化处理服务正处于限时免费推广期,尽管未来可能采取收费策略,但具体的费用标准尚未公开透露。

视频风格化就是在原视频的基础上进行风格化处理,官方称风格化视频可以提升视频美感、增强趣味性、提升传播力。

只需导入视频并一键“变身”,就能快速生成风格化视频(支持 10s 视频),智影 AI 提供了多种模板,让视频更加多样化。

据此前报道,腾讯智影上线于 2023 年 3 月,是一款集成了 AI 创作能力的智能创作工具,提供虚拟数字人、文本配音、智能去水印、文章转视频、模板创作、在线视频剪辑等功能。

腾讯AI实验室VTA-LDM:开创视频到对齐音频的革新之路

近日消息,腾讯AI实验室近期展示了其前沿项目VTA-LDM,这一创新技术能够实现从视频输入到同步生成对应音频的跨越。通过深度学习与模式识别的融合,VTA-LDM系统能够精准捕捉视频中的动态元素,将其转化为高度匹配的音频输出,实现了视频内容与声音信息的无缝对接。

腾讯AI实验室VTA-LDM:开创视频到对齐音频的革新之路

VTA-LDM模型的核心理念是通过隐含对齐技术,使得生成的音频与视频内容在语义和时间上相匹配。这一方法不仅提升了音频生成的质量,还扩展了视频生成技术的应用场景。研究团队在模型设计上进行了深入探索,结合了多种技术手段,以确保生成音频的准确性与一致性。

该研究着重分析了三大关键方面:视觉编码器、辅助嵌入和数据增强技术。研究团队首先建立了一个基础模型,并在此基础上进行了大量的消融实验,以评估不同视觉编码器和辅助嵌入对生成效果的影响。这些实验的结果显示,模型在生成质量和视频与音频同步对齐方面表现出色,达到了当前技术的最前沿。

在推理方面,用户只需将视频片段放入指定的数据目录,并运行提供的推理脚本,即可生成对应的音频内容。研究团队还提供了一套工具,可以帮助用户将生成的音频与原始视频进行合并,进一步提升了应用的便利性。

VTA-LDM模型目前提供了多个不同的模型版本,以满足不同的研究需求。这些模型涵盖了基础模型和多种增强模型,旨在为用户提供灵活的选择,以适应各种实验和应用场景。

VTA-LDM模型的推出标志着视频到音频生成领域的一个重要进步,研究者们期望通过这一模型推动相关技术的发展,开创更加丰富的应用可能性。

相关推荐
热门应用排行榜
热门游戏排行榜