2025年的理想智能体,是什么样子?就在昨天,两款「AI耳机」彻底打破了人们的想象!全新的viaim大脑,直接让贾维斯成真,成为打工人的万能办公搭子。
一款理想的AI耳机,应该是什么样子?
5月13日,北京郎园station橙色空间。
在几位中国爱乐乐团年轻音乐家精湛优美的演奏声中,未来智能给出了他们的理解——讯飞AI会议耳机iFLYBUDS Pro3、iFLYBUDS Air2。
作为一款耳机,好音质是其最基本,也是最重要的素质。
未来智能此次发布的两款全新耳机,由中国爱乐乐团首席音乐家们打造专属调音方案,大大提升了音质效果和听感。
两款耳机不仅音质卓越,同样搭载了强大的AI能力。
就在发布会现场,未来智能CTO王松正式发布了他们的最新力作——viaim大脑。
这个面向个人的商务办公AI智能体,背后包含的是公司的一脑多终端战略。看来,贾维斯时代距离我们真的不远了!
viaim大脑,无比接近科幻
许多人都幻想过,能拥有一个属于自己的贾维斯,而viaim大脑,就是要打造这样一个面向商务办公场景的AI智能助理。
为此,未来智能自研了一个整合四大核心模块的架构,使viaim大脑不仅仅是一个工具,更是一个能够主动辅助、甚至可以在一定程度上自主完成工作的「智能伙伴」。
用句时髦的话说,viaim大脑可以成为你的「办公搭子」,大大提升个人工作效率和智能化水平。
具体来说,这四大核心模块分别是:
1. 端到端的智能感知处理能力(如同「感官」——眼睛、耳朵):通过高精度传感器、多麦克风阵列(支持波束成形、噪声抑制、回声消除)、高动态范围(HDR)广角摄像头以及边缘AI视觉处理单元,精准捕捉和理解来自邮件、文档、语音、图像、视频等多种来源、多种模态的信息。
2. 智能Agent的协同推理能力(如同「大脑」):既然是大脑,它能够深度理解用户的意图,进行多步逻辑推断和自主任务规划。不仅如此,利用强化学习的反馈,这个「大脑」还能持续学习与优化提升。
3. 实时多模态能力(如同「血管」):能确保异构数据(文本、音视频流、图像特征、指令等)在内部模块与外部应用间实现亚毫秒级实时传输。
4. 数据安全和隐私保护能力(如同「皮肤和免疫系统」):确保用户数据安全与系统运行可靠。
注意,viaim大脑的整套框架,是全部自研的。在这套框架上,团队利用开源底座大模型,构建了viaim大脑的能力。
这样做智能体,思路太别致了
「2025是智能体之年」,这样的结论,业内已经预言了很久。硅谷大厂都在不断探索的Agent,实践落地的可感形态,究竟是怎样的?
有了这样的前置疑问,当viaim的概念呈现之时,给我们最大的感觉就是惊喜。
在硬件层面,它有了感官;基于动态知识图谱和上下文感知NLU引擎,它又有了大脑——既能深度理解用户意图,还有长期和短期记忆。
因为有了短期交互记忆和长期用户画像,viaim在未来极有可能记住我们的习惯、预测我们的需求,给出量身定制的建议。
「感官」、「大脑」、「血管」、「皮肤免疫」,viaim大脑的这四种核心能力,既相辅相成,又缺一不可。
这种架构隐喻,无疑体现出公司对「智能交互」的一种独特思考。
耳机,只是第一只「感官」。
未来,视觉、触觉乃至气味模块都将把实时数据输送给viaim大脑。它学习你的工作节奏,决策你的待办优先级,久而久之,像极了懂你心思的秘书——只是永不疲倦。
这就是未来智能的「一脑多终端」战略。
再下一步,团队还将围绕办公会议场景,基于Agent形式不断在垂直场景上拓展。
可以想象,所有人的办公需求都是无数个小任务,通过完成这些任务,版图就会不断完善,实在是未来感爆棚。
那么,搭载了viaim大脑的耳机,在实际应用中能带来哪些颠覆性的体验呢?
便捷记录、智能助理、畅快翻译
想象一下,早上刚上班戴上耳机,它就能告诉你今天的日程安排、待办事项,并帮你总结好了昨天一整天的会议记录要点。
甚至在通知你今天要参加5个会议后,温柔地劝你一句,「宝,要不咱今天请假吧!」。
开个玩笑。
不过这便是在viaim大脑支持下的讯飞AI会议耳机在办公中的真实能力。
办公最常见的场景,当然就是记录了。打工人的日常中充斥着各种会议、领导讲话、日程,纷复繁杂,需要记录的内容很多。
这时候,就轮到讯飞AI会议耳机登场了!
打开耳机搭配使用的viaim APP后,最显眼的就是记录按钮,按一下便可开始记录。
捏住左/右耳机感应区或者按下iFLYBUDS Pro3充电盒上的红点按钮,也可瞬间开启闪录。
新款讯飞AI会议耳机Pro3和Air2,都仍保持3种录音模式:通话录音、现场录音和音视频录音。
支持主流会议平台,可实现多平台实时录音转文字,方便会后查看,并对所有记录内容进行统一管理。
记录完成后,viaim AI助理会自动分析记录内容生成标题、和内容摘要概览。
并且,还会深度理解行业需求,根据不同职业人生产个性化摘要定制,方便之后操作,一目了然。
内容多了,还可以通过万姆助理针对单条或多条记录进行提问,快速获取记录关键信息,准确检索个人关注要点,妥妥是职场利器一枚。
AI耳机的另一个常用场景则是翻译。
两款新品耳机均支持多达32种语言的翻译,还有3种翻译模式,分别是同传听译、面对面翻译、通话翻译。
不管是线上线下会议、看视频听音频还是面对面沟通,都能够顺畅地翻译。
我们以一段TED演讲,来实测一下同传听译功能。
在听到英文后,viaim AI能够同时将原文(英文)和中文流式显示在屏幕上。