bannerbanner
新闻动态
新闻资讯 新闻详情
新闻资讯
2025-03-07 20:00:00

左手训AI右手造机甲!这届年轻人正在重构未来→”

2025年政府工作报告发布

“具身智能”这一创新热词

首次出现政府工作报告中

政府工作报告中提到:

建立未来产业投入增长机制

培育生物制造、量子科技

具身智能、6G等未来产业

作为全国高新技术产业发展的一面旗帜

具身智能是

深圳这些年来一直在发力的领域

图片

来源:深圳特区报记者 杨浩翰 摄

今天

“青年×新质生产力”栏目

对话自变量机器人

创始人兼CEO王潜

了解这群“机器人+大模型”顶尖人才的

年轻组合

是如何一路披荆斩棘

成长为行业引领者?

又是怎样在行业中搅动风云

向着“解放人类双手”的伟大愿景迈进?

新时代青年,新质生产力。青年以其前沿的思维、无限的创意和不懈的奋斗,成为培育和发展新质生产力的主力军。他们敢于追梦,勇于担当,用智慧和汗水书写着青春的华章。“青年×新质生产力”栏目将聚焦新时代青年的成长与发展,展现他们的风采与力量,激励广大青年在高质量发展的大潮中勇立潮头、挺膺担当。

你见过机器人

用简易的末端夹爪轻松拾取衣架

像人一样精准“拿捏”Polo衫

巧妙地将衣架

“穿”进狭窄的领口吗?

在这过程中

机器人实时判断柔性物体的形变

智能调整摩擦力

仿佛“自己学会了”晾衣服

这项家务绝活!

图片

是的,你没看错!

这不是科幻渲染

而是真实发生的场景!

这一令人惊叹的操作背后

源于自变量机器人研发的

具身智能通用大模型

图片

赴美求学工作近十载,王潜毅然决然选择回国,带领一群年轻人,自研具身智能大模型给机器人装上超级大脑。目前,自变量机器人已经研发出了世界上最大规模的端到端统一具身大模型——Great Wall系列(GW)的WALL-A模型 ,在多个性能上已达到世界级领先水平。

自变量机器人成立于2023 年12月,研发训练具有高泛化性的具身智能通用大模型,为具身智能接入一个通用的底层模型。当前,公司自研的WALL-A模型,可以实现机器人自主感知、自主判断、自主操作完成复杂而精细的物理世界任务。

人这一生再也没有第二次这样的机会了

王潜本硕均毕业于清华大学,硕士期间在导师指导下,成为全球最早在神经网络中引入注意力(Attention)机制(Transformer结构的核心)的学者之一。在南加州大学攻读博士期间,他在美国顶级机器人实验室参与了多项 Robotics Learning(机器人学习)和Human-robot interaction(人机交互)的研究,方向覆盖了机器人操作的多个前沿领域。

2017年,谷歌的研究团队提出Transformer模型,用于处理语言数据的神经网络,适合用于翻译、文本生成和理解等任务。如今,Transformer模型已经成为自然语言处理(NLP)领域的主流方法,是GPT等众多先进模型的核心。

图片

早在谷歌之前,由王潜提出的架构,远比谷歌的架构要更接近今天的Transformer模型,但可惜他当时没有进行工程化落地,而选择赴美求学研究机器人,也因此错过了人工智能领域的重大机遇。

由于那一次的失之交臂,他深感遗憾,“这也让我更加坚定在这一波AI发展浪潮中要做点什么的决心。”

王潜坚信,人的一生中,能遇到真正有意义、有价值的事情并不多。机器人+大模型的新领域给了他再来一次的机会,他毫不犹豫地要紧紧抓住。王潜坚定地说:“再也没有第二次这样的机会了,所以我一定要去做。”带着对AI前沿方向探索的坚定热爱,王潜再次踏上了从零到一的征程。

深圳帮忙不添乱办事效率高

2023年底,王潜回国,在深圳正式创立自变量机器人。

具身智能是一个软硬结合的新领域,中国在供应链上的优势可能要领先美国一个数量级。王潜表示:“像我们在深圳,定制一个零件几天就搞定了,在美国就需要几个月甚至更久。”成本方面,仅是数据收集工作,中国的成本基本上是美国的1/10。“效率叠加成本,中国的综合成本一定是全世界最好的,美国很多时候可能比中国就不只差一个数量级了,要慢更多的时间。”


选择深圳作为回国创业的大本营,王潜看重的是这里良好的创业环境和硬件生态。“具身智能的技术栈和之前完全不同,我们既需要优秀的大模型人才,也需要成熟的硬件供应链配套,深圳就是非常好的交汇点。”王潜说,“深圳的人才密度非常高,所有人都在努力向前,我们公司和深圳的城市调性很契合。”

图片

在支持科技创新创业方面,王潜也颇有感触,他说:“深圳政府帮忙不添乱,办事效率非常高。”自变量机器人自成立以来,一年内完成多轮融资,融资总额数亿元。深圳的多个基金参与投资了自变量。

从深夜到黎明,打螺丝过春节

王潜清楚地记得自己第一次来到深圳的日期——2023年12月18日,那也是自变量机器人正式成立的时间。回忆起踏上这片热土的情形,他笑谈道:“那天天气非常好,12月的深圳甚至有点热。”这样热切的氛围也让他对在这座城市打拼的未来充满了期待。

公司成立后,一切尚在起步阶段,最开始的团队仅有五个人,大家都迫切希望能尽快研发出第一代模型产品,在激烈的市场竞争中抢占一席之地。

图片

切黄瓜(2倍速播放):在一种物体上习得的能力直接泛化到不同物体的操作上。

2024年春节期间,自变量刚成立一个多月,当大多数人都在享受与家人团聚的温馨时光时,初创成员却选择了留在公司,全身心投入到研发工作中。当时由于人手紧缺,公司的几位创始人都纷纷参与到数据收集工作中,CTO、COO也亲自上阵“打螺丝”,修机械臂,并为模型贡献了第一批高质量数据。

当时,王潜身处美国,他也调整作息,克服时差与国内团队进行跨国协作。

美国的下午时段,正是国内的上午,王潜便与国内团队进行线上视频交流,一直到美国时间的晚上,此时国内已是下午。王潜则继续熬夜,直到天刚蒙蒙亮,国内时间也已来到后半夜。就这样,王潜每天靠下午三小时左右的睡眠维持,晚上又起身投入工作,一直忙到第二天的中午。

国内的团队成员们,亦是如此。每天后半夜才离开公司,早晨又早早地回到岗位。整个春节假期,他们都是这样度过的,大家心中怀揣着对具身未来的坚定信念,乐此不疲。“当我们在做对的事情时,肯定是从最艰苦开始,但事情肯定会越做越顺的。”王潜表示。

仅成立两个月,自变量就成功训练出第一版具身智能操作模型,该模型能够实现切菜、倒水等复杂的操作任务。在2024年中,模型在特定任务上已显现出少样本学习和自发的跨任务迁移能力。

2024年底,自变量实现了全球目前最大参数规模的具身智能通用操作大模型 ——Great Wall 系列(GW)的 WALL-E 模型,在多个性能上已达到世界级领先水平,可以实现机器人自主感知、自主判断、自主操作完成复杂而精细的物理世界任务。

“机器人+大模型”顶尖人才组合目标解放人类双手

在过去一年多时间里,自变量的高速迭代发展,离不开“机器人+大模型”人才团队的组合。目前自变量机器人团队有80多人,平均年龄在30岁左右,团队汇聚了来自世界著名人工智能 / 机器人学习实验室以及国内外顶尖高校的人才,他们在机器人和大模型领域拥有成熟的技术和产业经验。

图片

自变量机器人创始人兼CEO王潜

图片

自变量机器人联合创始人兼 CTO王昊

除了王潜在机器人领域的技术储备,自变量机器人联合创始人兼CTO王昊长期深耕在大模型领域,博士毕业于北大计算物理系,曾在粤港澳大湾区数字经济研究院(IDEA研究院)担任封神榜大模型团队算法负责人,领导了国内第一个百亿级大模型和最早一批千亿级大模型之一Ziya的研发。

“我们的核心不是制造人形的外壳,而是用AI大模型给机器人装上‘大脑’。”王潜说:“从工厂的电子组装工到餐厅服务员,再到日常家务,我们的目标是让机器人接手所有简单繁琐的重复性体力劳动。”通过不断的技术创新和产品优化,让通用机器人成为人们生活中不可或缺的一部分。

图片

展望未来,无论是在家庭、商业还是工业领域,自变量机器人都有望发挥重要作用,改变人们与机器交互的方式,创造更加智能化、便捷化的生活和工作环境。“我们要让通用机器人走进千家万户,成为人类生活中不可或缺的助手。”

为了实现这一目标,自变量机器人正在致力于研发的机器人通用模型,既不是简单地将已有的语言模型接入到机器人中,也不是让机器人在某一动作指令上重复训练。他们的模型专注于在通用性、泛化性上可以做到用极少的样本,完成各种物理环境变量、动作模式的泛化和迁移,同时在长序列复杂操作上有绝对优势,真正使机器人逐步具备类似人类的操作能力、思考能力和推理能力。

对于自变量机器人而言,未来充满无限可能。王潜判断,从技术上来看,在未来三到五年时间内,人们能够看得到具身智能通用机器人出现。而从商业化和产品的落地来看,十年之内,或许能够看到通用机器人规模化应用到生活和工作中。