ICML25 | 让耳朵「看见」方向!仅依靠360°全景视频,就能生成3D空间音频

空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提升沉浸式体验的关键。

空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提升沉浸式体验的关键。

然而,现有的技术大多基于固定的视角视频,缺乏对360°全景视频中空间信息的充分利用。

在这样的背景下,一项在空间音频生成领域具有里程碑意义的研究应运而生——OmniAudio:它能够直接从360°视频生成空间音频,为虚拟现实和沉浸式娱乐带来了全新的可能性。

相关代码和数据集已开源:

https://github.com/liuhuadai/OmniAudio

给TA打赏
共{{data.count}}人
人已打赏
AI新闻资讯

53 年、4 次转型、0 次掉队:SAP 跑进 AI 时代

2025-5-15 10:45:04

AI新闻资讯

裁员 22%,Chegg 输给了 AI ?

2025-5-15 11:00:06

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索