想到人形机器人,你眼前浮现的,是一台面无表情的钢铁机器,还是一个活灵活现的“类人”?
一个在面部表情、语气语态上更接近人类的人形机器人,是否更容易赢得你的心,更好地走进社会和家庭?
2025年前后,中国的人形机器人公司如雨后春笋般冒头,有的专注本体,有的发力大模型,还有一开始就想要“软硬”一体的。
一家成立于2024年3月、名为“数字华夏”的机器人公司,选了一个有些“偏门”的方向——他们试图聚焦人形机器人的“交互”,做出外观和行为更类人的人形机器人,专注解决与人类深度互动的各类场景,比如运营商、金融、能源、教育和商业零售等。
目前,他们一共推出了三款机器人:仿生机器人夏澜,能够模仿人类的绝大部分表情,提供“高颜值、高智商、高情商”陪伴;半仿生通用机器人夏起,通过领先的交互智能,可应用于多个场景;IP系列机器人星行侠,甚至在2025年世界机器人大会(WRC)现场开设了“科普讲堂”。
不同于AI出身的“纯血”创业者,数字华夏创始人沈健此前深耕计算领域近20年。在他看来,机器人的本质也是计算。
第一,包括机器人在内的很多科学技术创新,例如大数据、计算机视觉、无人驾驶或者低空经济,内核不能离开计算;
第二,“人形机器人”定义服务人类,因此产品无论外形还是交互能力都要尽量与人类接近,包括仿生皮肤、双足形态、情商、智商、心智等;
第三,当机器人软硬件能力有限的时候,企业没必要过度追求泛化性和通用性,更不必执着于机器人的“ChatGPT”时刻,从实用角度找到小切口做深就好。
他在计算领域工作近20年,从头部计算机整机厂商基层起步,管理过销售、产品、供应链、服务等上下游业务,后来担任公司CEO,曾主导信创业务实现0到100亿元的跨越式发展。
随着公司规模逐步扩张,组织管理却陷入内耗。沈健坦言,员工数从百人扩张到千人,组织发展趋势很难做到统一,导致错失很多业务机会。
恰逢2023年11月,工信部印发《人形机器人创新发展指导意见》,提出人形机器人有望成为继计算机、智能手机、新能源汽车之后的颠覆性产品。发展目标指出,到2025年,人形机器人创新体系初步建立,“大脑、小脑、肢体”等一批关键技术取得突破;到2027年,人形机器人技术创造新兴事物的能力明显提升,形成安全可靠的产业链供应链体系。
沈健随即去做了产业链调研。他发现,机器人虽然是人工智能、高端制造、新材料等技术的集大成者,但本质上还是计算,自己在计算领域积累的技术、产品、产业以及客户资源,都可以与之互通。
相较于出身AI的创业者,沈健在计算领域的经验更接近一门“基础学科”——并非深耕某个AI细分赛道,而是致力于解决跨行业的产业问题。他解释说,“我们现在看到的很多科学技术创新,包括大数据、计算机视觉、无人驾驶或者低空经济,它们的内核不能离开计算。”
按照应用场景,机器人能分为作业智能和交互智能,前者聚焦生产线组装、分拣、搬运等工业环境,后者面向陪护、养老、展厅讲解、前台接待、商场导购等服务场景。
沈健在机器人产业链调研时发现,工业机器人足够成熟高效,很多中国工厂生产线的人工占比已经很低,人形机器人进入的市场空间存在限制。同时,工业场景的机器人训练需要投入大量人力、时间和资源,并不适合勇于探索商业模式的公司。相比之下,交互场景下的机器人的未来空间更大。
2024年3月,他下定了决心,聚焦“交互”机器人的数字华夏正式成立。一年半来,公司完成了天使轮融资,股东方包括同创伟业、智元机器人等,资金重点投向研发,组成了一支约70人的团队。
按照沈健的想法,在与人类交互的场景中,无论产品外形还是交互能力都“类人”的机器人,更能贴近用户,也更能提供价值。正因如此,数字华夏提出“有温度的人形机器人”口号。
2024年8月,数字华夏首款仿生人形机器人夏澜亮相,采用仿生面部皮肤材质,搭载29个主动自由度以及若干被动自由度的精密控制管理系统,可以模仿高兴、悲伤、惊讶、愤怒等七类22种高精度面部表情和动作。
沈健认为,面部是集中人类情感的关键载体,也是人机交互的直接方式。具备自然表情的人形机器人才能更好地理解、传递情感。
但面部仿生也面临一系列技术挑战:面部皮肤的硅胶材料,电机与驱动系统的运动控制,视觉、语音、触觉的交互,表情生成与还原算法的开发……总系统需将硬件、算法与交互深层次地融合。如果处理不当,非常容易造成“恐怖谷效应”。高昂的研发投入与制造成本也是一大障碍,例如定价50万-100万的夏澜,头部成本就大约占到10%。
目前,业内对于仿生机器人尚无明确定义。如果说夏澜是皮肤、五官高度接近人类的面部“仿生”机器人;他们还有一款“半仿生”、佩戴墨镜的通用机器人夏起,在面部融入一些机械元素。
在肢体方面,夏澜和夏起都选择了更接近人类的双足形态。沈健指出,机械臂、轮式和双足机器人是逐渐演进的过程:一个六轴机械臂只能转动传递物料,轮式可以在平稳、有限的范围内移动,双足则能在崎岖不平的路面行走,适应度最高。
夏澜的大脑整合了表情计算引擎、情商模型、心智模型和垂域大脑等核心模块,并与多家行业客户合作建立了庞大的数据库。通过视觉或语音感知人类的面部表情,夏澜可以识别高兴、不悦甚至“假笑”等复杂情绪,这一些信息输入各类模块构成的“情商中枢”生成响应策略,最终实现拟人化的实时反馈。
这也是“有温度”的具象化——这款机器人不仅通过双臂完成递水等服务动作,还具备体贴关怀、主动问候等情感交互能力。
2024年年底,人形机器人开始走向小型化,以更好地融入日常生活和工作空间。2025年5月,数字华夏也顺势发布了IP系列机器人星行侠,全身共54个自由度,采用本体、轮式相结合的双形态,围绕客户的关键场景并推出定制化服务。
机器人的运动控制靠小脑,交互智能靠大脑。小尺寸人形机器人的运动控制更易实现,算法可以在全尺寸人形机器人上通过微调快速复用;交互智能同样如此,语音对话和系统对接等功能基本无需调整即可转移到其他本体。
售价近20万元的星行侠成为数字华夏的商业化主力,在K12教育场景提供科普课程、校园巡逻及心理辅导等服务。
目前,数字华夏的机器人已经服务于银行、运营商、教育、电网、商业零售、康养等场景。沈健对南方周末表示,公司在2024年和2025年分别完成了数十台和数百台机器人的商业交付。
目前业内的数据大致上可以分为三种:真实数据、仿真数据和互联网数据。真实数据通过机器人实时采集物理交互数据,高度依赖开放场景;仿真数据是利用工具生成虚拟环境数据,也许会出现误差和效率问题;互联网数据则是整合互联网开放资源。它们的效率和获取难度依次递减。
“仿真数据训练模型,就像在浴缸里学习游泳。”沈健表示,一个人在家里搭一个浴缸,让孩子在里面扑腾;一段时间后,孩子来到了环境复杂的大海,他要面对不同密度的水质、海上风浪,很难顺利游起来。
但真实数据匮乏,一直是行业的痛点。相较于华为、小米、比亚迪、特斯拉等“大厂”,初创公司更难找到规模化应用场景。
即便如此,数字华夏训练机器人仍有约80%为实采数据。2025年3月,他们在南京建立了基于真实交互场景的人形机器人数据采集及应用中心,通过模拟商业零售、银行营业大厅等真实的客户场景,通过遥操、动捕等方式,操控人形机器人进行数据采集。
沈健坚持,先利用真实数据训练有限场景。比如,教会机器人叠被子,需要6000条数据。每人每天抓取约400条数据,15天能完成训练;如果有10个人,一天半就能完成。
机器人模型训练,目前行业通常有两种方式:一是直接训练通用模型,机器人能学到非常多的技能,但技术路线还不成熟;二是采用分层分级的方式,训练模型从一种技能做起,通过累积逐步具备各项技能。
“当机器人软硬件能力有限的时候,我们别过度追求泛化性和通用性,或是所谓的‘ChatGPT’时刻,从实用角度找到小切口做深就好。”沈健对南方周末说,随着小模型的堆叠发展,机器人能先实现场景需要的特定能力,再逐步推广到更多能力。机器人学会叠被子后,下一步是否能把被子放到衣柜,甚至整理衣物?
越来越多的人形机器人找到了小切口场景,例如翻跟头、跳舞、泡咖啡、倒红酒等。沈健观察到,机器人公司不再执拗于某个技术细节或者是通用性,而是都在向着应用端靠拢,通过小模型切入。
目前,业内普遍预计机器人5-10年才能规模化落地,但在沈健看来,机器人的普及并不是说每个家庭都要有一台,而是它能真正解决实际问题,在某个场景解决特定问题。他对南方周末表示,“在某个场景大范围落地,三年就可能实现。”