在今年的谷歌I/O开发者大会上,我们有机会短暂体验了谷歌即将推出的AI眼镜——不是该公司宣布将于今年秋季发售的仅支持音频的眼镜,而是同时提供音频和视觉体验的版本。
这些Android XR眼镜在去年的大会上首次公布,其镜片内置显示屏,可将实用信息叠加在真实世界之上,直接呈现在用户视野中。这包括可显示天气、步行导航、Uber接驾信息、实时翻译等内容的小组件,甚至是用户自己用AI设计的自定义小组件。

prototypes已经相当成熟
我们测试的眼镜仍然是非常早期的原型,但已经足够成熟,可以进行外部测试。演示XR眼镜的工作人员解释说,原型机让公司不必担心与不同款式、造型相关的外观设计细节,因此可以更自由地试验显示技术,以及它对电池续航的影响。
这意味着这些样机在佩戴贴合度、造型、尺寸和设计细节方面,和任何未来发售的正式版本都会有很大不同。更像是可以在基础、舒适的镜框内对眼镜的”内部构造”进行试验。
这款带显示屏的眼镜是今年晚些时候推出的第一代音频眼镜的下一步迭代产品。眼镜是与Warby Parker、Gentle Monster和三星合作开发的,将谷歌的技术与这些品牌的设计美学相结合。
实际使用体验
要激活Gemini,需要长按眼镜镜框右侧2秒,启动提示音会响起,告知用户Gemini已经开启并正在监听。在演示版本中,启动Gemini的同时也会启动摄像头,但正式发售版本将允许用户配置是否在启动Gemini时同时开启摄像头。
在第一次测试中,我们要求Gemini播放一位我们喜爱的艺术家的音乐。由于场地太吵,无法评估音质,即使音乐开到最大音量,仍然很难清晰、有细节地听到。但从这次有限的体验来看,初步印象是这款眼镜无法替代更高质量的耳塞,但如果只是想在外面散步、徒步或在家做家务时听点音乐,它可以满足需求。
要关闭音乐,只需轻敲镜框侧面中间的位置,就像敲击太阳穴一样。
拍照和AI处理
在第二次测试中,我们按下拍照按钮给一个人拍了照片。当时显示屏是关闭的,所以照片被传输到了我们的手机和手表上。(之后你可以通过长按来拍摄视频,但原型机暂不支持这个功能。如果是拍视频,你会看到视频缩略图预览,而不是照片。)
你也可以直接让Gemini拍照,无需按拍照按钮,还可以对拍摄结果进行一些AI处理。比如你可以说”拍张照片,把这个人物变成动漫角色”。照片会先发送到手机,再发送到Gemini和Nano Banana服务器,之后返回编辑后的版本。
在谷歌I/O的场地里,Wi-Fi负载很高,整个往返过程大约需要45秒。
显示屏体验
开启显示屏后,你会在视野中看到一个简单的主屏幕。演示版本预装了一些小组件,显示天气和谷歌I/O活动的倒计时。如果你是眼镜的主要使用者,也可以把谷歌地图、翻译等特定应用的快速启动器设置好。
原型机只有右眼上方的单显示屏,但该平台同时支持单显示、双显示以及仅音频的眼镜模式。显示屏的图像有点模糊,我们认为这和我们佩戴的处方隐形眼镜有关——我们一只眼睛的镜片是优化远距离视物的,另一只优化近距离视物。当我们闭上一只眼睛时,图像会更清晰,但这种体验几乎立刻就让我们右眼上方产生了视疲劳。
翻译功能表现突出
最出色的演示之一是眼镜的语言翻译功能,它依托手机上的谷歌翻译应用。一位演示人员语速很快地说西班牙语,眼镜自动检测到了语言,并在显示屏上显示英语翻译文本,同时Gemini会在我们耳边用英语说出来。
我们认为很多出境旅行者会为了这个功能购买这款眼镜。需要指出的是,仅音频的眼镜也支持翻译功能,只是不会在眼镜上显示文本,如果需要的话,你可以在手机上看到转录文本,同时还有实时音频反馈。
导航体验不挡视线
另一个演示是使用眼镜导航。你可以通过要求Gemini导航到某个目的地来启动谷歌地图体验——甚至可以模糊到比如”最近的咖啡店”这样的指令。
Gemini会激活手机上的谷歌地图,在体验加载的短暂延迟后,眼镜会显示转向导航信息。当你向前看时,会显示下一个转向的信息。但如果你需要在空间中定位,低头看地面就能看到地图上的蓝色圆点。你也可以左右转动身体来在空间中旋转,就像你在手机上调整蓝色圆点的方向一样。
然后当你再抬头时,可以继续行走,地图不会挡住你的视线。因为这个体验是和手机上的谷歌地图绑定的,所以”家””公司”等已保存的目的地已经可以直接使用。
物体识别还需优化
我们还短暂地用眼镜识别视野中的各种物体,并向它提问。眼镜最初很难识别我们面前架子上的莫奈画作复制品,这是因为原型机没有自动开启摄像头——必须从应用中手动开启。
不过即使我们凑近去聚焦画布左下方的莫奈签名,Gemini还是问了几个问题之后才说它看起来像莫奈的作品。其他测试更顺畅,眼镜立刻识别了架子上的植物,还回答了关于书上不同食谱的问题。
后续规划和市场背景
谷歌表示,今年晚些时候它会分享更多关于Android XR显示眼镜的信息,届时它会扩大其可信测试者计划。
与此同时,该公司认为音频功能已经可以满足部分用户的需求,这可能是面对Meta和Snap在该领域的竞争,它还没有准备好显示眼镜的巧妙说法。
和显示版本一样,仅音频眼镜也可以访问谷歌的Gemini AI,你可以通过眼镜的镜框扬声器私密收听。你可以通过眼镜听音乐、按按钮拍照、打电话,或者访问手机应用,这些功能和未来的显示版本一样。
