AI感知与行动:考拉悠然发布空间智能世界模型,让AI走进物理世界

article/2025/7/18 11:49:52

本文转自:《封面新闻》

5月,2025福布斯中国人工智能科技企业TOP50评选结果发布,成都考拉悠然科技有限公司成功入选,成为榜单中唯一专注“空间智能”的企业。

,时长02:55

而在近日,考拉悠然发布了面向空间智能的多模态世界模型——悠然无界大模型及MAGX空间智能硬件产品家族,标志着该公司在空间智能领域的技术突破。天虎科技专访了考拉悠然CEO沈复民,了解了空间智能技术的市场前景、产业格局及布局。


从区域创新到全球视野:中西部AI产业崛起


据悉,此次福布斯榜单入选企业分布呈现新特点:除北京、广东、上海、浙江等传统科技高地外,武汉、成都两地企业入选数量同比激增,显示中西部地区在AI领域的崛起态势。

考拉悠然于2017年在成都创立,经过八年发展,已构建涵盖AI工具链、世界模型、智能体应用及行业AI硬件的技术体系。

“考拉悠然的成功入选,是中西部地区在人工智能领域创新突围的典型代表。”沈复民表示,“近年来,成都在人才、资本、政策等方面的综合优势逐渐显现,为我们提供了良好的发展环境。”

不仅如此,在赛迪顾问发布的“2025人工智能企业综合实力TOP100”榜单中,成都市有华鲲振宇、创意信息、数之联、考拉悠然、恒图科技5家企业上榜,数量排名全国第5。据统计,2024年四川省AI产业规模突破1300亿元,同比增长25%,增速高于全国平均水平。

作为成都市人工智能产业链“链主”企业,考拉悠然不仅自身发展迅速,还积极带动区域AI产业生态建设。“凭借多模态大模型及空间智能技术,我们为高端屏显、半导体、轨道交通等超500家客户提供服务,推动传统产业智能化转型。”沈复民介绍,“同时,我们牵头制定技术标准并联合省内企业共建空间智能产业链,带动上下游协同发展。”

沈复民认为,此次入选“2025福布斯中国人工智能科技企业TOP 50”榜单,表明空间智能正在成为人工智能技术突破和产业应用的重要方向。“相比传统的人工智能技术,空间智能突破了二维感知的限制,能够实现对三维空间的感知、推理和交互,为产业升级提供了强大的技术支撑。”他解释道。

据介绍,此次入选企业具备多元化投融资背景,其中既包含了多家已上市或具有深厚行业背景的企业,也有众多初创和成长型企业入选。

除了考拉悠然和恒图科技两家成都企业入选主榜单外,在子项目评选榜单上,也有一些川企的身影。例如,易府if医疗通过建立口腔专用设备制造与服务商,弥补了中国在世界口腔器械设备产业空白,成功入选创新技术企业榜单;道川传媒则因推动AIGC技术在传媒、影视领域的创新应用,入选创新场景应用企业榜单。


空间智能:跨越数字与物理空间


据德勤《2025年技术趋势》报告,空间计算和人工智能正成为未来技术发展的主要趋势。亿欧智库预测,到2030年,空间智能市场规模将超过5000亿美元,成为AI产业的重要增长点。

沈复民透露,在大语言模型(LLM)引领AI产业变革的背景下,考拉悠然选择了差异化竞争路线——空间智能。

“如果语言大模型是AI的‘哲学家’,擅长推理和表达,那么空间智能就是AI的‘探险家’,能感知环境、规划路径并主动探索。这种结合让AI既有思考的深度,又有自主行动的能力。”沈复民如是描述。

5月,考拉悠然推出了面向空间智能的多模态世界模型——悠然无界大模型,实现了“跨空间、跨任务、跨本体”三重突破。“‘跨空间’意味着同时感知和理解数字空间、物理空间与社会空间,实现空间上的无缝联通;‘跨任务’是指具备跨模态的泛化能力,支持感知、决策、控制等多种任务的统一处理;‘跨本体’则是具备强大的抽象与迁移能力,能够跨越不同智能体与系统架构之间的差异。”沈复民详细解释。

在技术评测方面,悠然无界大模型在空间智能公开评测集上达到了业界SOTA水平。值得注意的是,在物理常识和具身推理任务上,该模型超越了OpenAI o1、GPT-4o等主流大模型。

“这一成绩源于我们独特的技术路线。”沈复民表示,“通过精心设计包含多样化物理场景和交互的训练数据,结合规则化可验证奖励的强化学习方法,我们显著提升了AI模型的物理常识理解和推理能力,使其能将这种能力泛化到人类、机械臂、人形机器人和自动驾驶汽车等不同实体形态的应用场景中。”

“空间智能目前处于快速发展的初期阶段。”沈复民分析,“2024年,李飞飞团队发布首个能基于一张图生成可交互和编辑的3D场景的空间智能模型,DeepMind的Genie 2也有类似成果,标志着人工智能迈向3D时代。但仍面临诸多挑战,如构建精确世界模型需大量资源、泛化难度大,触觉传感器技术落后等。”

在应用场景方面,基于悠然无界大模型,考拉悠然推出了MAGX空间智能硬件产品家族,包括MAGX Loader智能卸货机器人和MAGXAgent驱动的巡检机器人等。这些产品能在复杂环境下实现精准目标识别、自适应位姿估计、实时障碍物评估、动态任务调度等功能,全程无需人工干预。

“目前,MAGX Loader正在烟草行业进行复杂物流环境下的预研。”沈复民介绍,“悠然无界大模型在产业的逐步落地,正深刻推动相关产业向更高阶的智能化跃迁,具体变革体现在从‘感知世界’迈向‘操作世界’,让AI不仅理解场景,还能执行任务,真正实现从认知到行动的闭环;推动从工具智能向智能体演化,例如物流卸货、智能巡检等任务,从被动执行走向自主规划与动态决策,显著提升作业效率与系统韧性;构建跨模态、多主体协同生态,以MAGXAgent为代表的新一代智能体协同框架,实现多机器人、无人机等设备的空间信息共享与协同作业,打破系统孤岛,增强产业柔性与适应性。”

,时长01:18


构建开放协同的空间智能生态


面对空间智能的市场机遇,考拉悠然制定了清晰的发展战略。

“未来3到5年,我们将以‘构建全栈空间智能技术体系’为核心,围绕世界模型能力演进、智能体产品落地、行业生态圈构建三大方向推进技术升级。”沈复民表示。

在模型层面,考拉悠然将持续迭代悠然无界大模型,强化其空间感知、因果推理与任务执行能力,构建具备“看懂、想通、做成”的泛化认知架构;在应用层面,将加速推广MAGX系列智能体产品,在物流、电力、制造、城市治理等场景实现规模化部署;在生态层面,将基于“世界模型+智能体+行业应用”的三层架构,构建开放协同的AI生态。

“我们依托多模态大模型技术优势资源,正在联合人工智能产业链上下游企业,打造集多模态世界模型+智能本体+行业应用于一体的全栈空间智能技术体系,建设开放、协作、共生的空间智能生态。”沈复民表示,“考拉悠然愿与更多合作伙伴携手,为打通大模型与产业真实需求的匹配,推动人工智能全域全时应用落地。”

目前,考拉悠然已在多个重大项目中展现了空间智能的应用价值。

“我们牵头承担了四川省重大科技专项揭榜挂帅项目‘森林防火多模态大模型与智能预警处置平台研发及示范应用’、四川省重点研发科技计划项目‘基于多模态大模型在应急安全行业的应用服务平台研发’项目,参与了四川省科技赋能防灾减灾救灾揭榜挂帅项目‘灾害现场智能化识别研判关键技术研究及应用示范项目’。”沈复民介绍。

随着空间智能应用场景的不断落地和普及,考拉悠然的商业模式正从技术研发向产品服务转型,通过“技术+产品+服务”的组合,构建多元化收入来源。

“空间智能赋予AI感知、理解与操作三维物理空间的能力,使AI能像人类一样通过多模态感知获取环境信息,基于空间推理规划行动路径,并通过具身执行完成物理任务。”沈复民解释,“这种将数字世界的认知能力与物理世界的操作能力深度融合的特性,正是实现通用智能的关键——既需理解抽象概念,又需处理复杂现实,而空间智能作为连接两者的桥梁,推动AI从‘看见世界’到‘理解世界’最终向‘协作世界’跃迁。”

谈及未来规划,沈复民表示,考拉悠然将继续专注空间智能技术创新,推动AI“看得懂、听得懂”世界到“理解、认知”世界,最终到“决策、执行”的演进,为中国空间智能产业发展贡献力量。


http://www.hkcw.cn/article/kTXemwQMYh.shtml

相关文章

Arduino学习-跑马灯

1、效果 2、代码 /**** 2025-5-30 跑马灯的小程序 */ //时间间隔 int intervaltime200; //初始化函数 void setup() {// put your setup code here, to run once://设置第3-第7个引脚为输出模式for(int i3;i<8;i){pinMode(i,OUTPUT);} }//循环执行 void loop() {// put you…

CAD多边形密堆积2D插件

插件介绍 CAD多边形密堆积2D插件可在AutoCAD内建立模拟重力堆积状态的随机多边形颗粒及界面过渡区&#xff08;ITZ&#xff09;模型。 模型可分为多边形颗粒、界面过渡区&#xff08;ITZ&#xff09;、长方形试件三部分&#xff0c;各部分在CAD内分图层绘制&#xff0c;可批…

特伦斯 S75:重塑钢琴体验的数码钢琴之选

当传统钢琴的典雅质感与现代科技的精准赋能相遇&#xff0c;特伦斯 S75 立式数码钢琴应运而生。这款专为追求品质的演奏者与音乐爱好者设计的高端乐器&#xff0c;以 “还原三角钢琴灵魂&#xff0c;革新数字钢琴体验” 为核心理念&#xff0c;在音色、触感、音质与智能交互间达…

methods的实现原理

一、直观的感受methods的使用 首先直观的感受methods方法的使用&#xff0c;同样以计数器为例&#xff0c; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widt…

晨控CK-FR03与TwinCAT3配置EtherCAT通讯连接手册

晨控CK-FR03与TwinCAT3配置EtherCAT通讯连接手册 晨控CK-FR03系列作为晨控智能工业级别RFID读写器,支持大部分工业协议如RS232、RS485、以太网。支持工业协议Modbus RTU、Modbus TCP、Profinet、EtherNet/lP、EtherCat以及自由协议TCP/IP等。 本期主题&#xff1a;围绕CK-FR03…

大模型-attention汇总解析之-MLA

一、核心思想 先看下初始的MLA的一般性公式&#xff1a; 我们一般会缓存的是投影后的k_i, v_i而不是投影前的x_i, c_i &#xff0c;根据 MLA 的这个做法&#xff0c;通过不同的投影矩阵再次让所有的 K、V Head 都变得各不相同&#xff0c;那么 KV Cache 的大小就恢复成跟 MHA …

多线程(3)

1volatile关键字: 1.1volatile的功能 volatile关键字能够保证内存可见性 当变量被volatile修饰后: 写操作--->会将寄存器内的值修改后会第一时间将新值写回内存(主内存),不会引起一个另外一个线程去读的时候还读个旧数据,导致出现bug,比如将01改为1后就应该立马写回内存…

WIN11+VSCODE搭建c/c++开发环境

搭建c/cby win11vscode 前面试过了ubuntuvscode,macosvscode,win11visual studio搭建&#xff0c;本来以为win11vscode是手到擒来的&#xff0c;没想到颇有些周折。可能解决方案也并不完美&#xff0c;先记录下来&#xff0c;以后有改进再来修改。 安装vscode https://code.v…

20250530-C#知识:String与StringBuilder

String与StringBuilder string字符串在开发中经常被用到&#xff0c;不过在需要频繁对字符串进行增加和删除时&#xff0c;使用StringBuilder有利于提升效率。 1、String string是一种引用类型而非值类型&#xff08;某些方面像值类型&#xff09;使用“”进行两个string对象的…

04-redis-分布式锁-edisson

1 基本概念 百度百科&#xff1a;控制分布式系统之间同步访问共享资源方式。 在分布式系统中&#xff0c;常常需要协调他们的动作。如果不同的系统或是同一个系统的不同主机之间共享了一个或一组资源&#xff0c;那么访问这些资源的时候&#xff0c;往往需要互斥来防止…

01 Netty简介

文章目录 概要1 Hello World1.1 什么是netty&#xff1f;1.2 Netty 的核心特性1.3 初识 netty 2 Netty 的核心组件2.1 EventLoop 和 EventLoopGroup2.1.1 基本概念2.1.2 与 Channel 关联2.1.3 EventLoopGroup 的实现2.1.4 常用方法 2.2 Channel2.2.1 Channel 的类型2.2.2 Chann…

熵最小化Entropy Minimization (一): 基本认识

文章目录 1. 前置知识Softmax函数信息熵&#xff08;Entropy&#xff09; 2. 熵最小化3. 案例理解4. 总结 熵最小化是一种利用未标记数据的策略&#xff0c;其核心思想是鼓励模型对未标记数据做出“自信”的预测&#xff0c;即预测概率分布尽可能尖锐&#xff08;Peaky&#xf…

jmeter:登录接口的token用于下一个接口

1、创建线程组 -》 添加 登录请求&#xff0c;在登录请求里面添加【正则表达式】 正则表达式提取器 引用名称&#xff1a;newtoken 正则表达式&#xff1a;token"."(*?) 模板&#xff1a; 1 1 1 匹配数字(0代表随机)&#xff1a;0 缺省值&#xff1a;null 2、创建…

Leetcode 2005. 斐波那契树的移除子树游戏

1.题目基本信息 1.1.题目描述 斐波那契树是一种按这种规则函数 order(n) 创建的二叉树&#xff1a; order(0) 是空树。 order(1) 是一棵只有一个节点的二叉树。 order(n) 是一棵根节点的左子树为 order(n - 2) 、右子树为 order(n - 1) 的二叉树。 Alice 和 Bob 在玩一种…

类 Excel 数据填报

类 Excel 填报模式&#xff0c;满足用户 Excel 使用习惯 数据填报&#xff0c;可作为独立的功能模块&#xff0c;用于管理业务流程、汇总采集数据&#xff0c;以及开发各类数据报送系统&#xff0c;因此&#xff0c;对于报表工具而言&#xff0c;其典型场景之一就是利用报表模…

TreeMap、TreeSet和HashMap、HashSet

目录 一、TreeMap&TreeSet 1.数据结构&#xff1a; 2.时间复杂度&#xff1a; 3.键/元素: 4.TreeMap基本操作: (与 HashMap 类似&#xff0c;但 put, get, remove 等操作会根据键的顺序进行)&#xff1a; 5.TreeMap遍历&#xff1a; 6.TreeSet基本操作 (与 HashSet 类…

电工基础【2】自锁、互锁、正反转电路

04 自锁、正反转电路 我们讲一下这个自锁和正反转。 自锁电路图示例图 加了一个这个 KM1 自锁。加了 KM1 的辅助触头&#xff0c;它怎么实现呢&#xff1f;它怎么就自锁了呢&#xff1f;没加它的时候为什么是点动&#xff1f;加它为什么自锁&#xff1f; 讲解一下。首先我们…

【计算机网络】传输层UDP协议

&#x1f525;个人主页&#x1f525;&#xff1a;孤寂大仙V &#x1f308;收录专栏&#x1f308;&#xff1a;计算机网络 &#x1f339;往期回顾&#x1f339;&#xff1a; 【计算机网络】应用层协议Http——构建Http服务服务器 &#x1f516;流水不争&#xff0c;争的是滔滔不…

day40python打卡

知识点回顾&#xff1a; 彩色和灰度图片测试和训练的规范写法&#xff1a;封装在函数中展平操作&#xff1a;除第一个维度batchsize外全部展平dropout操作&#xff1a;训练阶段随机丢弃神经元&#xff0c;测试阶段eval模式关闭dropout 作业&#xff1a;仔细学习下测试和训练代码…

2022-2023-2-移动机器人设计与实践-期末B

2022-2023-2-移动机器人设计与实践-期末A-CSDN博客 本文介绍了《移动机器人设计与实践》课程期末考试试卷B卷的内容与参考答案。试卷包含分析题、设计题、实践题和编程题四部分&#xff0c;总分100分。分析题考察学生对空中、水面和地上三种移动机器人模型运动机制及应用场景的…