元宇宙技术调研报告

定义虚拟世界

3D建模

常规建模

通过对模型的矢量定义建模

标准化建模

将部分组件标准化,通过简单的拼装实现复杂世界的建模;

目前主要的建模组件,可以在10分钟内构建一个大约20平米的可交互空间

成熟度:4

主要的技术实现:

  • 沙盒建模游戏:如Roblox、Minecraft
  • 3D引擎:Unreal Engine、Unity

渲染

基本视野渲染

本质上是将空间直角坐标系的建模,渲染为以双眼为原点的极坐标系,再合并角度采样并输出为平面坐标。

高级渲染让世界更真实

基本视野渲染是以眼睛为出发点,向外直线扩散,将直线碰到的实体像素信息转化为可见的像素,这种方式简单的认为是每个物体都在发光,光沿着直线传递到人的眼睛。但真实世界,眼睛的成像是由光源发出的光,经过不同物体表面的反射,最终传入到人的眼睛的,非光源只会反射自身不会发光,这就造成了直极坐标转化的方式无法表达很多真实世界的细节,如物品的阴影,水的倒影,水底的折射等等,造成人很容易的区分出真实世界和模拟世界

成熟度:2

主要的技术实现:
光线追踪:是记录光的轨迹参与3D还原渲染的技术,这需要经过无比庞大的计算,目前的计算能力也只能追踪个位数的光源和有限个反射数量的光。这是目前的VR走向真实瓶颈之一

人与虚拟的链接

视觉连接

清晰度

PPD (Pixels Per Degree) 角分辨率,指视场角中的平均每 1° 夹角内填充的像素点的数量。
PPD = 单眼成像外接圆的直径像素点数量 ÷单眼成像的对角线的视场角 FOV。

人类视网膜模PPD的极限为70,通常在50

成熟度:3

但是目前主流的技术离这个目标相差甚远,以4K的VR显示器来讲,假如FOV=110度,PPD只有19.6,甚至不如两块1080P的电脑显示器。

相信随着工艺的提升,未来一定会有视网膜VR产生

参考https://m.paoka.com/info/478

景深

景深是指当焦距对准某一点时,其前后都仍可清晰的范围;根据凸透镜原理,固定的焦距决定了能成实像的距离,由于人类的视觉处理的宽容度,前后一定范围仍然是“感觉清晰”的,这个就是景深,景深同样受瞳孔大小等影响。
所以景深是决定视觉真实度的关键因素,现在主流VR的平面显示器类似于照片,只能现实出一个固定景深的视觉信号,眼球的晶状体是动态的调整焦距的,这样就会产生真实与虚拟的差异

图片来自网络

成熟度:2

主要的技术实现:

  • 模拟景深:通过捕获人眼睛焦点,动态计算景深的成像,转化为平面显示器像素点
    • Oculus正在研发中的解决方案即将会在Siggraph大会上展示,名为“focal surface display(焦平面显示)”。这项技术旨在更准确地模拟我们人类眼睛的工作原理
  • 光场:通过光纤矩阵替代平面显示器素点矩阵,投影完整光场

无论哪种技术,都需要庞大的计算量,尤其是光场技术,这同样也是目前的VR走向真实瓶颈之一

不只有视觉

方位感

成熟度:4

主要的技术实现:

  • 相对定位:将标记物放在活动区的周围,发出电波或超声波,由人佩戴的设备检测距离而计算出位置,结合陀螺仪,精确定位;
  • 视觉定位:由人佩戴的摄像头或固定的摄像头,通过视觉计算定位,这种技术的精度对算法有要求,但可识别上限更高,不依赖佩戴的设备,可以精确识别人的每一块肌肉的动作,包括表情。
  • 混合定位

听觉

通过声音在空间的传播,结合空间定位的人耳的朝向和距离,模拟耳朵听到的声音和时间差,分别向双耳朵传递,还原真实声音。

成熟度:5

空间声学已非常成熟。

主要的技术实现:

  • Dolby
  • DTS:X

触觉及力回馈

成熟度:1

主要的技术实现:
力反馈手套:Dexmo
Dexmo是世界上最便携的力反馈手套,为研究者,企业和消费者而生。它所提供的自然、直觉的触感可以让每一个人都能亲密地触碰真正的沉浸式VR世界。

嗅觉

成熟度:1

主要的技术实现:
气味模拟:Architecture of Scent
OVR Technology工作室推出名为Architecture of Scent(AOS)的VR气味模拟系统重为130g,可模拟250种气味,从而大大提升VR体验的沉浸感 ;Architecture of Scent结合了硬件、软件和气味套件,并旨在精确复制数字世界中的复杂感官体验

部分资料来自网络,