2026年7月2日,科大讯飞在深圳发布三大核心交互平台升级,构建面向智能硬件与机器人时代的新一代多模态AI交互基础设施。

▲讯飞机器人超脑平台总经理刘可为分享机器人超脑平台升级
三大平台升级要点
1. AIUI交互平台(从语音走向多模态)
-
听得清:优化低算力RTOS设备支持(100MHz主频/140KB存储稳定运行,-5dB噪声唤醒率97%);推出产品级定制唤醒(50人录音达94%唤醒率,周期缩至几周);全双工双流VAD升级,高噪场景误响应降低95%。
-
说得像:开放100+超拟人音色,MultiTurn模型支持轻笑/停顿等副语言;Prompt驱动角色音色生成;可联动数字人表情动作实现人格化交互。
-
多模态理解:融合图像理解智能体(看图问答/描述/翻译)和图像生成智能体(自然语言生图),支持语音+视觉输入。
-
开发工具:首发AIUI Code及声学检测工具,形成接入—调试—验证闭环,降低开发门槛。
2. AIUI多语种交互平台(正式开放,助力出海)
-
语种覆盖:支持40+语种(英/法/西/德/韩及哈萨克语等区域语),英语唤醒率97%、小语种95%,识别准确率95%。
-
场景打通:聊天(免切多语种+文化适配)、设备控制、知识问答、多语种翻译、多模态交互(语音生图支持多语种)。
-
全球部署:新加坡/东南亚/中东/欧美等服务节点,支持公有云&私有化部署,适配GDPR/CCPA/PDPA合规。
-
商务模式:按台付费,提供测试资源与本地化调优。
3. 机器人超脑平台(感知·理解·执行,加速落地)
-
多模态交互:全景摄像头+环形麦阵实现360°全向拾音与视听融合,多人高噪环境精准锁定对话人(5人语音分离准确率90.1%,-10dB噪声识别准确率90.1%),支持人脸/人体追踪/手势识别。
-
行业方案:针对陪伴机器人(高情商对话/情绪识别)、扫地机(说哪扫哪/指哪扫哪)、四足机器人(脚步噪抑/360°定位)、人形机器人(仿生麦阵/交互戒指)定制优化。
-
硬件集成:推出麦克风阵列封装和多模态一体机,缩短开发周期;同步亮相搭载该平台的导览机器人Guide01。
原创文章,作者:狐呼网,如若转载,请注明出处:https://www.ihuho.cn/13109.html

