发布信息

人工智能与操作系统融合下,李治军教授剖析国产操作系统突围路径

作者:软荐小编      2025-05-25 21:01:01     196

_双向系列_双向操作是什么意思

文 观察者网心智观察所

人工智能操作系统紧密融合的趋势中,我国自主研发的操作系统如何跨越技术难关、打造独立生态系统?作为人工智能发展的关键领域,具身智能(Embodied AI)又将如何革新人机互动模式及产业格局?哈尔滨工业大学计算机科学与技术学院的李治军教授,作为观察者网“年度科创人物·年度求索者”的获奖者,近期受邀至心智观察所进行讲座。在讲座中,他多角度深入分析了国产操作系统的突破之道,涉及技术发展、生态困境以及人才培养等方面。此外,李教授还探讨了具身智能在工业和服务领域的应用前景,并揭示了高校科研与产业需求之间紧密相连的挑战及潜在机遇。

_双向系列_双向操作是什么意思

心智观察所:尊敬的李教授,您好。您目前担任哈工大的教职,而且您在求学期间也是哈工大的学子。多年来,您持续关注的学术领域是?目前,您最关注的问题又是什么呢?

李治军表示,自本科时期起,他对操作系统就抱有浓厚的兴趣。那时,他认为操作系统是软件领域中一个复杂的系统。从研究生阶段到博士阶段,再到后来的工作与科研,他的研究始终围绕着操作系统展开。自1995年Windows 95问世以来,他亲身经历了Windows系统的成长、Linux的崛起,以及中国鸿蒙系统的诞生。

目前,机器人作为未来关键终端设备,同样离不开操作系统的支持。从我国发展的视角来看,我国长期遭受“芯荒魂缺”的挑战,这里的“芯”指的是芯片,“魂”则是指操作系统。近年来,国家、政府、行业以及市场对操作系统的关注度持续上升,这让我感到无比振奋。操作系统领域的研究始终是我的专业追求,同时,它也是我内心深藏的梦想。我渴望能够将具有身临其境智能特征的操作系统真正实现。

心智观察所:对于一般用户而言,我们对电脑操作系统,尤其是PC和手机移动端的操作系统较为熟悉。我想询问您,您所开发的操作系统是否已经应用于机器人,并且是否已经进入批量生产阶段?此外,它的主要应用场景是什么?在哪些具体情境中,我们会需要使用到您的操作系统呢?

李治军指出,操作系统在软件领域属于极其复杂的类别。无论是个人电脑上的Windows、Linux,还是移动设备中的安卓、iOS,乃至我国自主研发的鸿蒙系统,这些操作系统都逐渐被公众所熟知,并有效解决了诸多问题。而在未来,机器人被视为人类迈向具身智能时代,乃至人工智能时代的关键设备。机器人操作系统需具备创新特性,其中最为关键的一点即是具备自主能力。机器人应当能够自行运作,无需像手机或个人电脑那样依赖人工干预。

目前,全球尚未形成完善的机器人操作系统,整个行业正持续进行探索。我国在这一领域较早展开研究,并已取得一定成绩,然而,这些成果仍需经受实践的考验。机器人的应用领域主要聚焦于自动化场景。以工厂为例,由于老龄化趋势加剧和生产环境的恶劣,迫切需要替代人工,因此,机器人在B端市场的应用需求正逐步上升。

人类能够感知并理解周围的环境,并具备自主做出决策的能力。然而,目前尚无任何机器人能够独立完成此类任务。我们的目标是开发出一套操作系统,并与之结合机器人,使其能够在工厂环境中实现对人力的替代以及自主决策,同时具备适应不同场景变化的能力。我们已在部分工厂进行了原型展示,但尚未实现大规模生产。

心智观察所:您所提及的,是机器人引领我们步入一个融合了具身智能与人工智能的新时代。那么,能否请您对此进行简要的介绍?关于“机器人”与“具身智能”,它们之间是否具有等同性呢?

李治军指出,二者不可简单划等号。具身智能指的是一种内在的“内涵”,而机器人仅仅是这一概念的一种外在体现。单纯进行对话并不能等同于人工智能。人工智能的具身化,指的是与物理世界的结合,具身智能着重于人工智能与物理世界的紧密结合,机器人则是实现这种结合的典型工具,但并非唯一。展望未来,具身智能或许将以多智能体融合的形态出现。未来或许将不再有传统的道路,取而代之的是飞行车、无人机以及机器人;以我们现今的录影棚为例,它未来将拥有众多自主智能功能,灯光系统也将实现自我调节,这一切都可以被称作具身智能。展望未来,或许就会呈现出这样的景象。

机器人代表了具身智能的一种外在体现,当然,这种体现并不局限于机器人本身,无人机视角同样能够实现。未来或许还会出现其他形态的智能实体,它们未必需要具备人形特征,亦或是我们可以称之为智能体的存在。

心智观察所:请问您是在何时产生了创业的念头,打算从教育工作者转变为一位企业家呢?

李治军表示,这个问题提得相当出色,他本人也深思良久。他从事操作系统领域的研究,深知操作系统是一个规模庞大的项目,其开发往往需要通过实际效果来验证,必须在实际环境中应用并进行不断的迭代优化,而绝不仅仅是停留在理论或实验室的初步阶段。

它并非如同人工智能其他领域的研究那样,诸如构建数据集、开发算法,能够迅速得出结论。这涉及一个复杂的系统,必须在现实场景中展现出其效能,否则便不能算作一个真正的算法。即便你向其提供一组数据集,并在该数据集上实现了结果输出,也不能断言其在A点有效,而在B点却无效。

优秀的操作系统犹如智能手机,它能够适应多种应用场景,具备低功耗、高负载等特性;无论是用于游戏还是社交,都应经受住多方面的考验。此类系统不应仅限于实验室研究,必须投入实际应用中,通过不断实践与优化,才能逐步提升其性能,实现更完善的改进。

因为这个专业领域独特的性质,以及我个人浓厚的兴趣,我总感觉仅仅构建一个原型系统,总感觉少了些什么。我渴望将其真正投入使用。而要实现这一目标,仅凭学校的资源是远远不够的,还需要产业的支撑,乃至整个社会的共同参与。

在创业之旅中,您是否察觉到您所憧憬的领域与您过往的认知存在差异?抑或,创业是否使您对研究领域有了全新的洞察?

李治军在创业历程中察觉到,实际需求与理论研究所揭示的内容之间存在着不小的差距。身为教师,起初常常怀揣着理想主义的信念,全球的科技工作者或许都持有相似的心态。理想主义者倾向于提出解决方案,这恰恰是人类科技追求的终极目标——即解决所有问题。然而,在创业的实际操作中,人们会逐渐意识到创业是一项复杂的活动。客户更加关注解决方案的可行性与成本效益,而不仅仅是技术参数的先进程度。这推动了我对问题进行重新界定,将焦点放在实际需求上,并通过持续的改进来提升产品品质。创业活动是一项复杂的任务,它要求我们同时考虑技术发展、市场动态以及客户的具体需求。

我们或许曾对某个问题进行过界定,从理论层面来看,这确实是一个问题,相关指标设定得相当完美,然而在实际情况中,客户可能并不在意这种界定。

现今,许多学校和公司对创新以及产业或应用领域的重视程度可能日益提升。创新与产业,或者说应用,理应形成一种相互促进、相互影响的良性循环。当然,这对教师来说也带来了一定的挑战,即我们需更加深入地探究需求,而非仅凭个人主观臆断。

心智观察站:在回顾您的创业历程中,您认为有哪些陷阱是您曾遭遇并希望今后不再陷入的?同样,您也希望其他创业者能够避免重蹈覆辙,不再犯这些错误。

李治军指出,创业者应迅速将产品投入市场,借助用户反馈实现快速更新,而非执着于打造完美无瑕的产品。他们应当聚焦于真实需求,而非仅凭个人主观认识来界定问题。

新兴的具身智能领域为创业者和产业界带来了众多启示。有投资者曾询问我国是否可以借鉴国外某些公司的经验,经过深入调研,我们发现目前很难找到一种完全成熟的模式可以直接复制。比如,微软、亚马逊等企业的成功案例虽然曾为我国提供了一定的借鉴,但在具身智能这一特定领域,还缺乏一个明确的参照模板。鉴于此,在产业发展过程中,我们不应一味追求模仿,而应更加重视创新精神的培育。

创新者必须迅速将研究成果转化为实际产品,在合作过程中,双方应相互包容并积极交流意见,以此促进产品的持续改进与升级,这对于推动产业进步极为关键。

在机器人这一崭新领域,国内外尚未确立起完善的运作模式,创业者们应当把握住发展良机,勇于探索,并重视将产品开发与市场需求的紧密融合。

心智观察所:您曾供职于一家规模庞大的手机制造商,并担任首席科学家一职。在手机行业,人们正试图将具身智能技术融入其中,那么这种做法仅仅是作为一种营销手段,还是说市场对此有着真正的需求呢?

李治军指出,从行业发展的视角来看,小米等知名手机品牌已顺利踏入汽车行业,这一现象反映出产业融合与技术创新持续向前推进。同时,诸如微软等科技巨头亦在积极投资人工智能企业,例如OpenAI。基于此,我认为,无论是计算设备、个人电脑,还是手机等,它们都在随着社会的进步而持续发展。手机企业涉足机器人领域并非仅仅为了炒作,未来这一行为或许会成为一种新的趋势。手机制造商与机器人存在相似之处,比如,尽管手机的成本和产业链相对机器人来说更为简单,但其生产过程仍包括从芯片制造到封装、通信模块、电路设计以及存储系统等多个硬件与软件的组成部分。

机器人产业的未来走向与手机产业颇为相似,它将从基础的机械组件逐渐扩展至整个生态系统,进而深入到应用开发的层面,其发展轨迹与手机产业相仿。甚至有观点预言,未来的手机将进化成一种超级动态设备,能够替代或增强机器人的功能。基于此,手机制造商凭借其在人才和技术方面的积累,有望成功进军机器人领域。然而,这并不代表手机制造商必然能在机器人领域取得成功,因为机器人产业拥有其特有的行业属性,目前主要聚焦于B端市场,未来或许会转向C端市场,例如家庭保姆和养老服务等领域。然而,在可预见的将来,B端应用场景仍将占据主导地位,行业所积累的专业知识和技能显得尤为关键。

手机厂商在机器人生产方面所面临的机械工艺和生产流程问题,是他们所不甚了解的。这就需要B端行业的专家,例如工业互联网领域的专业人士,为他们提供指导和协助,以便他们能够进入机器人领域。鉴于此,我认为手机厂商向机器人领域转型并非不可能,然而,要实现这一目标,必须依赖多个行业的共同努力与合作。

截至目前,全球范围内尚未有机器人操作系统领域的明确竞争对手。海外部分企业正在尝试开发类似的技术方案,比如通过整合多种模型来促进机器人的协作能力以及对环境的理解。我们正专注于将系统与模型相结合,力求在这一领域实现创新,并与国际上的同行进行竞争。

心智观察所指出,在我国在具身智能这一领域,并不一定处于劣势,或许在某些方面,我们与西方国家正并肩前行,甚至可能在某些方面取得了领先。那么,西方国家是否已经推出了类似的产品呢?

李治军提到,这个问题我们多次被投资者询问。在我所研究的智能机器人操作系统领域,目前国内外正式发布的类似系统并不多。例如,像iOS这样的手机操作系统已经明确公布,但在机器人领域,尚未有类似的明确发布。然而,确实存在一些解决方案,其中一些可能通过模型融合或多种模型融合的方式来实现。

在相关领域,若干国际企业崭露头角,诸如Figure AI,而我们则致力于与它们相媲美。Figure AI在多机型协同作业以及场景认知方面有着卓越表现,其发布的多机器人协同作业视频生动地展现了机器人之间动作的协调性以及对环境的处理效率。我们的团队致力于寻求系统性的解决方案,旨在借助模型的优势达到相似的效果,与此同时,Figure AI则主要从模型的角度进行探索。我坚信,他们未来也会逐步融入系统层面的能力以推动发展。

实际上,我们可以将具身智能视为一个由硬件实体、系统以及算法模型构成的三角结构。这三要素相辅相成,共同构成了一个完整的生态平台。这种结构可以理解为两个领域的融合,一方专注于硬件研发,另一方则致力于系统和算法模型的结合。在这方面,Figure AI的表现尤为出色,其经验值得我们借鉴,而且他们的成长速度同样令人瞩目。

心智观察所:您所提及的“本体论、算法、系统”三者必须相互配合,这让我联想到硬件与软件之间的相互协调。在您的团队中,成员们来自各式各样的学术领域,他们是如何实现有效合作的呢?他们的学术背景又是怎样的?他们又是通过何种途径加入您的团队的?

李治军表示,他的团队由校内团队和外部合作者共同组成。起初,他的研究重点在于操作系统领域。然而,随着人工智能技术的迅速发展,他们意识到有必要与该领域的人才进行合作。

因此,团队中存在专门负责构建模型的人员,这些模型既有大型也有小型,它们的应用领域涵盖机器人控制、强化学习等多个方面。尽管我们无法成为各个领域的权威,然而,我们必须对模型的特性有深入的认识,这样才能挑选出最适宜的模型,并将其与系统进行有效集成,从而实现技术的纵向整合。

学校团队以系统研发为中心,由我指导的硕士研究生、博士研究生以及青年教师组成。这些成员一直在我身边,致力于操作系统的开发。此外,我们还特意吸纳了与模型构建相关的人才,尤其是擅长自然语言处理和视觉理解模型的专业人士,以便更深入地解析和应对场景中的信息。

在机器人技术领域,硬件的紧密连接至关重要。为此,我们迫切需要两种不同类型的硬件专业人才。首先,我们需算力方面的专家,他们需精通计算机体系中的中央处理器(CPU)、图形处理器(GPU)、网络技术以及输入输出(I/O)等核心组件,并且能够确保这些组件与机器人各个关节之间的顺畅衔接。

机械人才属于另一类别,他们需掌握机器人关节的自由度及机械构造知识。即便我们并非机械设计的从业者,仍需将机器人的机械性能转化为计算模型,这样才能与机器人制造商实现顺畅的沟通与合作。

总体来看,我们的团队由四个主要部分构成:以系统技术为支柱的专业人才、专注于模型开发的人才、擅长算力优化的人才以及机械领域的专家。这样的团队构成,使得我们能够在机器人操作系统以及人工智能这两个领域进行更为深入的研究与开发工作。

心智观察所:您所提及的,是那场在北京举行的机器人马拉松比赛,它是世界上此类活动的首创。对于这场比赛,网友们的看法各异,有的指出机器人跌倒的问题,有的则认为它们的外观不够美观。面对这些负面的评论,作为一位创业者,您又是如何处理这些不利的声音的呢?

李治军表示,他个人的教学理念近期有所调整。人们普遍期待产品从诞生之初就完美无缺,然而技术的进步却依赖于不断迭代。回顾早期,尽管手机和PC存在诸多不足,但正是通过不断的优化升级,才成就了今日的产品。因此,创业者应当勇于公开展示尚不完善的产品,积极面对外界的质疑,并不断进行改进。

爱因斯坦曾以三只简陋的小板凳为例,讲述了一个故事,其中前两只虽然制作简陋,却同样至关重要。这种精神对于社会的发展至关重要。在机器人领域的发展过程中,现有的不足正是迭代进步的必经阶段。

心智观察所:将人形机器人的发展过程比作一场马拉松,那么我们目前所处的位置是怎样的?离完成的目标还剩下多长的距离?

李治军指出,若以人类在奥运会等赛事中展现的运动能力作为衡量标准,目前的机器人技术尚处于初级阶段。尽管这个差距看似遥远,但科技的快速发展正在不断缩短这一距离。例如,大型模型技术已显著提高了药物研发的速度,而量子计算等领域也在逐步实现突破。尽管前进的道路仍然漫长,但科技的爆发式进步有望大幅缩短这一进程。无论是保守还是乐观的预测,未来十年内,我们或许将见证一场颠覆性的变革。

心智观察所:在人形机器人领域创业之路漫长且充满挑战,然而,这份坚持是值得的。对于创业者来说,在这样一场持久的马拉松中,他们需要哪些助力以及哪些同行者的陪伴呢?

李治军提到,人形机器人堪称人工智能时代的杰出象征。人类文明的精髓在于智慧,一旦机器人或其他智能体得以充分发展,有望引领社会迈向一个全新的时代。

未来机器人或许能够独立生产火箭,甚至有可能开启宇宙文明的篇章——这将是一个人类未曾预料到的崭新领域。当然,这样的宏伟目标需要我们全面而深入的投入。以手机行业为例,从诺基亚的功能手机发展到如今的智能设备,其背后涉及到基础设施、人才储备以及资本运作等多个方面的系统工程。人形机器人的进步涉及一个更为繁杂的链条:政府需指明前进的方向,资本需要保持持久的耐心,科技人员需不断进行创新,甚至还需要与职业教育机构协同合作。比如,我们正在推动高中生参与到具身智能数据收集的工作中——就像互联网依赖于海量数据一样,物理模型同样需要更多真实世界的数据来支撑。只有当整个社会共同努力,这一目标才有可能达成。

心智观察所指出,商业运作的根本法则始终聚焦于推动企业的扩张与进步。然而,对于身为教授或技术追求者而言,如何在日常工作中协调企业增长的需求与技术的不断更新进步,这无疑是我们必须深入研究的核心议题。

李治军表示,这确实是一个值得深入探讨的矛盾所在。在学术界,有些学者虽然发表了高质量的论文,但他们的研究成果往往过于领先,难以转化为实际产业。这种现象并非消极,而是社会现实的一种客观反映——比如,在产出数千篇论文的过程中,可能只有一两篇能够真正实现产业化。然而,我们必须注意到,如果没有这数千篇论文作为基础,那为数不多的突破性成果也就难以问世。

还有一点值得注意的是,一些学者与企业之间的合作相当紧密,他们的产业化成果非常显著,然而却很难产出具有创新性的论文。这一现象揭示了社会整体对于创新的耐心不足。从长远的角度来看,在成千上万的论文中,总有一篇具备实际应用价值,所以我们没有必要过分纠结于当前的研究是否具有实用性。重要的是坚持长期主义,这意味着要允许阶段性成果的发表和接受反馈,并且坚信最终能够产出真正有价值的成果。但需警惕为发论文而发论文、为创新而创新的形式主义。

在企业的层面上,情形亦是如此。若企业只顾追求眼前的利益,过度挖掘客户当前的价值,这样的做法难以长久。真正能够吸引并留住用户的,是那些通过创新所创造的深层价值。以早期的操作系统研发为例,由于研发周期较长、效果显现较慢,一度难以获得投资。然而,现在企业开始逐渐认识到,仅仅优化表面的交互设计并不能显著提升用户体验,真正关键的是底层的技术创新。

当前的发展态势已经显示出融合的潜力。以人形机器人为例,若只注重其运动能力,比如马拉松比赛,而忽略其在工业领域的应用,或者仅仅专注于替代人工劳动而缺乏技术革新,这样的发展路径都是难以持续的。而大模型的发展,则带来了一种新的创新模式——企业通过在行业中的应用来促进技术创新,从而形成一个正向的循环。这种产学研相结合的模式,或许将变成未来创新与产业发展相结合的主要趋势。

心智观察所:您反复强调“耐心”这一品质,近段时间,“耐心资本”这一理念广受瞩目。那么,作为一位创业者,您是否已经获得了这种资本的助力呢?

李治军表示,他对投资者的信任和支持深表感激。公司已经成功完成了天使轮融资,并且计划未来将进一步增加投资。然而,在投资决策会议上,关于具身智能操作系统项目确实出现了一些分歧——一些投资者对操作系统的盈利模式提出了疑问。毕竟,像Windows这样的系统主要依靠Office软件来盈利,而安卓系统则是通过应用生态来获得收入。相比之下,鸿蒙系统的研发投入已经超过百亿,但其盈利能力却难以直接体现。项目虽历经争议,最终还是顺利通过了审批,尤其是那位经验丰富的投资人,他不顾众人反对,坚信这是未来的发展趋势。正得益于这种持久的耐心资本投入,公司才能成功建立并持续至今。

操作系统领域的投资回报周期严重失衡,这在业界已成为普遍观点。以Windows和鸿蒙系统为例,前者需要数千人的研发团队,而后者则投入了数百亿的资金。机器人操作系统也面临着商业化的挑战,众多投资者坦言盈利困难。然而,那位坚定投资的前辈却认为,这正是从事艰难却正确之事所具有的价值。对技术长远价值的坚定信念,彰显了资本市场成熟度的不断进步,同时也映射出社会各界对深度创新的迫切期望。

心智观察所:我们位于长三角地区的上海,观察到长三角国家技术创新中心与贵方存在合作关系。请问能否请您简要阐述一下双方的合作方式?

李治军指出,长三角国家技术创新中心作为我国的一项国家级关键创新基地,肩负着至关重要的使命。该中心的主要职责在于通过项目的孵化以及创新资源的对接,促进科技成果与产业化的紧密结合。在为我国提供支持方面,长三角国创中心的作用主要表现在两个方面。

资金支持是首要之选。该项目经过国创中心的严格筛选,成功获得其直接投资,并以天使轮注资的方式落实,这不仅是对项目价值的肯定,同时也为项目的初期发展注入了强劲动力。

接着,涉及资源对接环节。长三角国创中心打造了一个集创新资源、研发平台与产业需求于一体的创新生态系统。因此,该中心为我们搭建了众多客户资源、行业应用场景等,并提供了市场推广等服务,全方位支持企业的发展。这种支持对于初创企业技术的实现和市场的融入尤为关键。

心智观察所:您持续关注着青年一代的成长和教育问题。对于那些怀揣着进入具身智能领域梦想的年轻人,或是那些已经选择了相关专业的学子,您能给出哪些建议呢?

李治军表示,具身智能领域是引领未来的尖端科技,其中既蕴含着诸多挑战,也孕育着无限机遇。他不仅指导自己的硕士和博士研究团队全力投身这一领域,还通过举办讲座的方式,向高中生和大学生普及这一领域的重要性。

人工智能技术已广泛融入社会生活的方方面面,例如语音交互的广泛应用,而具身智能技术则更进一步——它实现了数字智能与物理世界的深度融合,通过物联网、机器人等先进技术,实现了对环境的感知和实体的操控。这种“数字与物理融合”的独特特性,使得它成为了一个极具潜力的领域。无论是大学的新生还是行业的从业者,都应当积极投身于这一领域,抓住创造巨大价值的宝贵机会。

心智观察所:您所开发的操作系统,作为微观层面的支撑工具,它与宏观的物联网生态系统之间存在着怎样的联系?目前,我国在实体智能以及人工智能基础设施领域的发展状况如何?为了促进这一领域的进步,需要哪些不同的力量协同努力?

李治军指出,物联网的核心在于将物理世界实现数字化、网络化和智能化。他决定以操作系统为突破口,因为它是硬件与软件之间的底层纽带。就像互联网时代电商平台引领商业变革一样,操作系统在万物互联的时代也将成为至关重要的基础设施。

我国正处在数字化向智能化转型的关键时期,这一进程需要多方面的共同努力。在技术领域,我们需在操作系统、机器人平台、6G卫星通信以及GPU技术等方面实现同步的突破;同时,各个行业也需培育符合各自应用场景的智能系统,构建一个完整的技术体系。这一目标不仅需要底层技术研究人员的不懈努力,还亟需跨学科复合型人才的加入,以推动这些技术的实际应用。

我作为一名从业者,致力于操作系统与机器人技术的结合领域,这一选择既是我个人学术研究的积累,也顺应了当前行业的发展潮流。

心智观察所强调,人工智能与具身智能的发展需持续大量的资金和资源投入,不应仅仅着眼于短期的经济效益。我们期待社会各界对技术创新者展现出更多的包容与鼓励,携手推动这一将深刻影响人类生活模式的领域不断前行,并对李教授接受观察者网的邀请表示衷心的感谢。

相关内容 查看全部