当 AGI 向着 Physical AI 物理具身方向演进,一场重塑未来认知的风暴正在悄然兴起。在 2025 SENSETIME TECH DAY 商汤技术交流日上,灵宇宙创始人兼首席执行官顾嘉唯做了分享。他认为在当下 AI 技术从“工具属性”向“伙伴属性”跃迁,人机交互范式正在变化:从“人适应机器”到“机器理解世界”,人们和世界的交互会随之发生巨变,而率先适应变革的人群就是下一代年轻人。
当下,他们学习方式就已经发生变化。灵宇宙给他们提供了一个新的解决方案,就是通过类似 Her 电影中的 AI 终端,改变他们和物理世界的交互。“把世界变成教材,把世界变成教室”会是下一代年轻人的全新的学习体验。
在这个背景下,灵宇宙开发出一款新产品「Ling!灵宇宙 AI 学伴(昵称:小方机)」(以下简称:Ling!),它是一个随身的 AI 助理和伙伴,搭载的一套物理世界的 AI-OS,叫做 LingOS,让学习的对象从一平米书桌来到更广域的整个物理空间,给孩子构建了一个专属的 4D 空间交互智能的“世界模型”,让他们在学习认知的成长的过程中获得更好的体验。
Luka 卢卡与 Ling!两大教育陪伴 AI 终端,产品规划路线图完整。前者以“读万卷书”为核心理念,通过绘本识别技术实现桌面交互学习;后者则以‘行万里路’为目标,将物理世界转化为互动课堂,让学习突破书桌局限。
灵宇宙是一家专注于空间交互智能的创新公司,目标是打造新一代的物理世界的 AI-OS,给机器人注入灵魂,让万物在 AI 的加持下让世界充满“灵性”。2023年,公司于 AI 大模型风潮下成立,不到半年就完成三轮融资,受到资本市场的极大关注。
在创立灵宇宙前,顾嘉唯的智能 AI 机器人生涯已经持续10年。他先后在微软研究院,百度人工智能研究院工作,主导前沿 AI 人机交互产品的研发。之后,他与 A 股上市公司合作创办了「物灵科技」担任 CEO,打造了消费级服务机器人矩阵,他还曾在创业期间投资了包括 Knightscope、Rethink、Jibo 在内的全球最知名AI机器人明星项目。
创始人顾嘉唯佩戴着 Ling!在大会现场
以下是他本次大会上的演讲内容:
各位领导好,商汤的同事们,大家好,我是灵宇宙的创始人顾嘉唯。很高兴来到商汤这个舞台,讲讲“百姓日用,AI 之道”的其中一个环节。我们都知道下一代是我们全社会很关心的人群,2010 年以后出生的孩子在人口统计学里叫做“Generation Alpha 阿尔法世代”,他们是智能时代的 AI 原住民,代表了未来,是看得到光芒的一群人。
但作为这群孩子的家长,怎么带娃是我们很头疼的问题。就像刚才在舞台上散发光芒的徐立,他还有一个标签是“科技奶爸”,我也有这样的标签。这个身份也让我们更加关注孩子们是如何同 AI 共同成长这个课题,因为在这个 AI 快速发展的时代,家长都很焦虑:人类该如何与 AI 共生共存?孩子到底该怎么学、学什么? 另一方面,对于大多数的父母,我们有没有机会能够更好地使用 AI 来解决好带娃的这个重担?随着大模型和具身智能技术日渐成熟,有没有机会给我们的孩子打造一个哆啦 A 梦?
解答这些问题之前,我先介绍一下我们灵宇宙在做的事情。在过去十年,我们探索过各种各样的陪伴家庭的机器人,有一个爆款叫「Luka 卢卡猫头鹰绘本阅读陪伴机器人」(以下简称:Luka 卢卡),是针对0 ~ 8 岁孩子的产品,已经卖了近千万台了。Luka 卢卡是利用多模态人工智能技术,OCR 文字识别、VQA 图像识别等,猫头鹰眉心处有个摄像头去识别桌面上的绘本进行互动阅读和陪伴,“读万卷书”是我们对这款产品的定义。
Luka 卢卡也是伴随着过去十年 AI 的发展一步步演进的,从最早的感知、分析型的 AI(Perception AI),到生成式的 AI (Generative AI)的时代。今天的 Luka 卢卡可以实时的在桌面上看到任何东西,并且可以讲读出非常有意思的故事内容创作给孩子。
有了长记忆、强推理、强交互的大模型能力之后,更加智能的AI终端也会让带娃这件事变得更加松弛且富有创造性。就像徐立刚才演讲提到的,一个好的绘本讲读师,对于一本绘本的延展,可以比爸爸妈妈讲得好很多。而 Luka 卢卡比家长更擅长读绘本讲故事,今天的 AI 不仅在表达发散能力、创造能力方面带来的惊喜超过了之前的绘本讲读师,还具备对上下文的长记忆能力,这使得互动感更强。
当下是智能体的 AI (Agentic AI)时代,并且我们正在加速往具身物理世界的 AI (Physical AI)发展。在感知型 AI 和生成式 AI 的时代,手机依然会是绝大多数人们的智能 AI 终端。但是在智能体 AI 和具身物理 AI 的时代,手机的形态会进一步演进,也会有新的 AI 物种诞生。
我们的公司名为灵宇宙,「万物有灵」是我们秉持的理念,也是我们在追求通用人工智能 AGI 方向上,从哲学层面的一种思考。伴随着具身物理 AI 的发展进程,未来我们灵宇宙的产品也会推出各种形态的 AGI 原生的 AI Native 智能终端,可能是人形机器人、穿戴眼镜或者视网膜的投屏。
在通过 LingOS 改造下一代人机交互的过程中,我们也交出了这个阶段的答卷——— Ling!这个产品。它是一个随身的 AI 助理和伙伴,能够让新一代的孩子们、青少年们随时随地得到“十万个为什么”解答的超级智能体,类似科幻电影 Her 里面,胸前能看得懂世界的智能终端。我们将这个随身 AI 智能陪伴的产品定义成“行万里路”。
当年 Luka 卢卡引领了教育行业,让桌面阅读变成了一个交互范式,随之带来了开创式的桌面多模态 AI 交互空间。在后续的产品创新中,我们也强烈感知到具身 AI 的时代整个教育电子和 AI 教育行业会迎来一波新的重大机遇。所以在今天我们又开创了随身的 AI 学习伙伴这样一个新品类,来引领这个行业。
我们认为 Ling!是符合当下 AGI 演进阶段的 PMF(Product-Market Fit 产品与市场匹配)方式。虽然它还不是“万物有灵”的最终形态,但它是目前的最佳解决方案。今天大模型时代下家长想给孩子一个“豆包”,给孩子用DeepSeek、日日新,但因为当下大多数家长是不放心给孩子手机直接使用,所以它解决了孩子在 AI 时代需要一款新的智能 AI 终端的问题,陪伴孩子去认知世界。下一代的 AI 智能手机的交互范式变革会从青少年的随身 AI Agent 智能体开始。
可以从视频中看到,我们跟李白打一通 Facetime 实时视频电话,让他跨越时间的长河来到你身边,在今天这样的一个春天的景象上跟你来一场实时对话和互动,我们希望给孩子创造第二个大脑,第三只眼睛,与用户同源感知包括视觉、听觉等第一视角感知与处理能力,让多模态大模型技术实现拟人化实时交互,实现全场景捕捉孩子的每一个可教时刻,让他的好奇心永远不掉在地上。
Ling!除了实时的 Facetime 外,还有很多丰富的交互。孩子可以不断在刷到更多自己喜欢的角色产生的丰富内容,实现把“把世界变成教材,把世界变成教室”,让孩子活在和真实世界的智能交互中。灵宇宙通过 “点物赋灵” 技术,为每个物理实体赋予智能属性,当儿童与绘本、玩具、家具、空间互动时,不同的 IP 角色 Agent “人”可实时解析物体的形态、功能、背后的知识图谱,将其转化为个性化学习内容,例如达尔文扫描恐龙玩具自动生成进化史互动故事。身边的现实世界如自然景观、历史文物、日常物品本身就是最佳的学习素材。例如,观察一片树叶可学习生物结构,触摸一块岩石可理解地质变迁,这种 “具身认知” 比书本教材或屏幕上的二维内容更具冲击力。
比如,当孩子到了植物馆,会有一个达尔文角色主动来找他,为他布置一个探险「百科类」任务,让他一步步去解锁;当他参观博物馆时,可以将眼前的静态展品激活,使其变成一个丰富且生动的历史动态场景;英语老师能够采用实时沉浸式环境的「语言类」学习方式,带着孩子前往任何地方学习语言,把物理空间的场景转化为一个角色扮演的实时直播场景;此外,Ling!还可以通过图像生成的方式,将物理世界的实物变成孩子喜欢的画作,陪伴孩子一起「艺术类」创作,并且利用晒角色和 Multi-agent 的朋友圈,增加“孩子们社交圈”的粘性。
在创造Ling!的背后,我们会发现今天的AI时代有两层很大的变化:
第一,未来会有无感的交互出现。无感交互指 AI 会让你不再需要学习设备怎么去用,以前我们通过在设备上了解怎么用微信,用鼠标键盘来操作信息联系人,是在屏幕上交互信息。但有了 LingOS 之后,孩子都不需要进入 APP 获取信息和服务,他们只要习惯“找人”做事的交互方式。通过我们的产品,小孩只要开口去呼唤Ling!里面的24小时在线的角色伙伴,就可以解决问题,我们把它定义成叫“万物有灵”的 AI 人机交互赋能体验。 第二,设备会越来越隐形化甚至不可见化。通过设备去跟物理世界完成更丰富的多模态实时交互。没有延时的情况下甚至可以让物理世界“活”过来。未来还会有新的变化,不只限于讲话解读,而是场景中的物体,比如那束花,自己跳出来给你讲它的故事内容和它的阅历,这就是我们所描述的“点物赋灵”的体验。未来,孩子可以跟世界模型打交道的场景,会让万事万物活过来,跟孩子直接互动。
LingOS的“世界即交互界面,万物皆有灵” 就是灵宇宙定义的交互范式的变革,人机交互层是 AI 时代的 AgentOS “操作系统”,而新一代的年轻孩子是率先适应具身智能AI时代新交互范式的人群。
通过 Luka 卢卡和 Ling!这两个产品矩阵,灵宇宙希望帮助成千上万的家庭完成高质量的带娃体验,率先进入具身物理世界 Physical AI 的时代。Luka 卢卡是通过图像识别解读和互动书桌上的内容,Ling!正在让交互从一平米的书桌来到更广域的物理空间,让孩子真正能够向世界去学习。不只是在设备的屏幕上交互信息,而是透过屏幕跟物理世界交互,以“世界”为中心而不是以“设备”为中心,定位为现实世界的游戏化的探索交互式学习引擎,“点物赋灵”技术给孩子去构建一个专属的非常好的世界模型,让他们能够在具身认知世界和成长的过程当中有更好的体验,让现实世界比游戏更迷人。
灵宇宙的核心价值在于“定义下一代人机交互”,而非制造硬件设备。硬件是载体,交互是灵魂,数据是燃料。通过 AI AgentOS 构建一个类似 iOS 和 Android 的物理世界 AI-OS —— 这套操作系统核心逻辑在于:物理实体本身成为智能载体,用户无需通过手机、电脑等中间设备,直接与环境中的物体,如绘本、玩具、家具、电器、动植物等进行自然交互。从 Luka 卢卡一开始的无屏触控技术在桌面上形成的绘本阅读及桌面交互场景,到 Ling!将世界成为课堂,这种“无设备感”的交互体验,本质上是将整个物理世界转化为可交互的界面,实现“世界即课堂,世界即教材”的愿景。
整个AI电子教育行业会迎来一波新的非常大的机会。因为大家都知道今天教育是整个“百姓日用”里面供需两侧都变化最大的行业之一,这时候恰恰有一个非常好的“iPhone moment”,交互方式的变革让教育内容的连接发生了本质的变化,让每个小朋友在 AI 的陪伴下,完成和世界的每一次交互。坚持原创,引领行业,一直以来是我们的使命,从几年前 Luka 卢卡的创新让上千万家庭孩子爱上阅读,到今天我们又开创了这样一个新品类来引领这个行业——随身的 AI 学习伙伴。
开启下一代智能 AI 新终端:让 “随时在线的聪明大脑” 成为智能时代原住民的成长标配。当他们从小习惯了无感交互,习惯于找“人”做事,基于伙伴关系式交互和长期记忆,一个 AI 学伴团,既超级懂你又超级会解决问题,还提供情绪价值,再也回不到 APP 的使用习惯。更多在物理世界基于空间交互智能,会让下一代年轻人发现身边的真实世界居然那么好玩,而不是一刻不停地刷手机、刷 Feeds 流被投喂内容。而灵宇宙“万物有灵”的终极形态也会随着 AI 技术的演进,不断优化我们这套 4D 空间人机交互操作系统 LingOS inside 推出各种形态的家用陪伴 AI 机器人和随身智能 AI 终端。
还没有评论,来说两句吧...