3 月 20 日, 声网亮相 2025 年中国家电及消费电子博览会 (AWE2025),正式推出对话式 AI 开发套件, 此套件专为智能硬件开发者量身打造, 旨在助力其快速构建 AI 实时语音交互产品, 提升人机实时互动体验。同时,声网宣布已将对话式 AI 开发套件软硬件全面开源。
对话式 AI 开发套件基于博通集成 (Beken) 的高性能 AI 芯片 BK7258 , 实现强大的端侧音频处理, 同时深度融合了声网的对话式 AI 引擎, 让智能硬件设备实现自然流畅的实时语音对话、智能停顿及打断处理、以及超低延时响应, 为开发者提供「对话式 AI + 智能硬件开发」一站式解决方案。
对话式 AI 开发套件方案架构图
目前, 声网已将对话式 AI 开发套件的软件、硬件全面开源。硬件侧, 将原理图、位号图等相关的硬件设计图全面开放;软件侧, 提供一整套面向开发者的开发工具箱, 包括丰富的示例代码和最佳实践。开发者只需下载开源代码, 即可将对话式 AI 能力集成到自己的智能硬件设备中。1 小时即可跑通 Demo,1 天完成产品原型送样, 大幅缩短开发周期, 降低开发门槛。
对话式 AI 开发套件
声网对话式 AI 开发套件应用场景广泛, 从 AI 玩具到智能家居, 可实现全场景适配, 让所有智能硬件开口说话。例如,AI 玩具、AI 教育硬件、AI 陪伴设备、家居语音助手、穿戴设备-个人助手等多种应用场景。
自然流畅、告别机械应答, 定义下一代 AI 硬件交互体验
AI 玩具、AI 机器人等智能硬件产品在实时互动时会面临诸多技术挑战, 如背景噪音干扰语音识别的准确性, 导致指令接收偏差;对话延迟破坏交流的流畅性, 影响用户体验;模型缺乏灵活性, 导致交互模式单一, 难以根据实际场景做出动态调整。
针对这些问题, 声网对话式 AI 开发套件给出了有效的解决方案。其先进的语音活动检测 (VAD) 技术, 能够精准识别语音信号, 降低背景噪音的影响, 确保语音识别的高准确率。实时语音合成功能实现了快速响应, 让交互更加流畅自然。智能打断处理则赋予了设备灵活的对话能力, 可根据用户的表达实时调整, 极大地提升了交互的适应性与流畅度, 告别「机械式」应答, 助力 AI 玩具和 AI 机器人实现更流畅、更迅速的交互体验。具体来说声网对话式 AI 开发套件具备 5 大优势:
极致 AI 对话体验
AI 与用户的对话延迟最低可达 650ms, 打断响应低至 340ms, 拥有近乎真人般的对话响应速度与节奏, 极大提升交互的流畅性。精准的语音识别, 能够屏蔽 95% 的环境人声及噪声干扰, 实现对话人声的精准识别, 确保在复杂环境下也能准确获取用户指令。
多模态交互体验
提供丰富的接口配置, 例如内置麦克风、摄像头以及传感器接口, 还可提供文本、音频、视频和触控等多种交互功能。通过「听、说、看、触」全维度交互形态, 充分满足亲情陪伴、家居控制等不同场景下的多样化需求。
主流 AI大模型支持
对话式 AI 开发套件对大模型实现广泛兼容, 支持通义千问、豆包、DeepSeek 等主流 AI 大模型服务, 同时也可灵活接入自研大模型, 为开发者提供丰富的选择。
极速产品原型送样
仅需 1 小时即可跑通 Demo,1 天便能完成产品原型送样, 极大地缩短了产品开发周期, 降低开发门槛。同时, 软硬件开源的特性助力开发者快速完成从设计到上市的全流程。
低功耗设计
采用低功耗设计方案, 支持超长待机, 有效解决设备续航焦虑, 为用户提供更持久稳定的使用体验。
全场景适配, 让所有智能硬件「开口说话」
声网的对话式 AI 开发套件应用场景广泛, 从 AI 玩具到智能家居, 可实现全场景适配, 让所有智能硬件开口说话。
在 AI 玩具领域, 可支持动态调整游戏难度与剧情, 保持趣味性, 激发儿童创造力, 还能即时解答儿童提问, 将知识学习融入日常互动。
在 AI 教育硬件方面, 能够根据学生水平调整讲解深度与节奏, 实现自适应教学与个性化学习, 还能进行语言能力训练, 实时纠音纠错, 模拟真实对话环境, 提升口语表达。
对于 AI 陪伴设备, 让 AI 通过自然闲聊与情绪共鸣, 成为部分人群的情感寄托, 同时记录用户习惯, 主动提醒用药、作息, 降低健康风险。
在家居语音助手场景中, 支持连续对话与模糊指令, 如「调暗灯光, 放点音乐」, 还能通过复合指令实现跨设备协同, 像「观影模式」联动灯光、投影仪等。
在穿戴设备-个人助手场景, 可提供实时翻译、实时字幕、实时会议纪要功能, 并结合日程管理、任务提醒, 实现工作流全链路智能化。
赋能 Robopoet AI 萌宠, 开启全新陪伴体验
2024 年 AI 玩具市场规模已达 181 亿美元, 权威机构预测, 全球 AI 玩具市场将迎来爆发式增长, 预计到 2033 年, 市场规模将增长至 600 亿美元。AI 玩具的快速发展为互动娱乐创造了新机遇, 通过实时陪伴、沉浸式故事体验和动态剧情开辟了全新的人机互动体验。
专注于 AI 情感陪伴机器人的初创公司珞博 Robopoet, 近日发布了一款口袋 AI 毛绒宠物 Fuzzoo。Fuzzoo 搭载其独创的 MEM(多模态情感模型), 能倾听、感知并抚慰人心, 具备养成属性, 提供实时个性化的陪伴。
借助声网的对话式 AI 技术,Fuzzoo 大幅优化了 AI 交互的实时性和稳定性, 使得这款 AI 陪伴机器人能够进行自然流畅的对话, 提供实时情感陪伴和个性化交互, 从而为用户带来全新的陪伴体验。
Robopoet 联合创始人兼 CTO 潘雨楠表示,「声网的对话式 AI 技术赋予了下一代 AI 玩具和机器人实时感知、思考、反应和交流的能力。凭借超低延迟响应、智能打断、以及先进的语音处理能力, 声网让人机互动变的更加自然流畅, 并始终为互动体验的稳定性和可靠性保驾护航。」
除此之外, 目前已有数家客户集成了声网的对话式 AI 开发套件, 相关智能硬件产品也即将量产发布。例如集贤科技最近发布的「灵语灵珠」AI 玩具, 同步使用了声网的对话式 AI 开发套件, 实现了 AI 语音互动能力, 助力其打造了更智能、更灵敏、更安全的 AI 玩具。
未来声网将持续完善对话式 AI 开发套件, 为更多智能硬件场景赋予实时互动能力, 注入数字灵魂。通过不断地优化实时互动体验, 使 AI 硬件不再是机械工具, 而是有情感交互的生活挚友, 满足用户多样化需求, 适应不同生活场景, 推动智能硬件行业迈向人机互动新时代。
来源:互联网
还没有评论,来说两句吧...