雨宫琴音番号 NEWS
你的位置:调教小说 > 雨宫琴音番号 > 黑丝 91 千寻智能韩峰涛:到2025年底,投资东谈主会更看好具身智能
黑丝 91 千寻智能韩峰涛:到2025年底,投资东谈主会更看好具身智能
发布日期:2025-04-13 07:46    点击次数:172

黑丝 91 千寻智能韩峰涛:到2025年底,投资东谈主会更看好具身智能

2023年6月30日,照旧珞石机器东谈主CTO的韩峰涛在知乎上发表的万字长文《当机器东谈主拥抱大模子》中建议这些疑问。文中黑丝 91,韩峰涛意志到机器东谈主可用性差、浸透率低的根源在于智能水平不够,并找到了AI大模子——这个能够处治机器东谈主智能问题的最终谜底。

数月后,韩峰涛离开珞石机器东谈主再创业,标的是“具身智能”。

韩峰涛找到了高阳。高阳博士毕业于有着“具身智能大本营”之称的伯克利大学,在诡计机视觉和强化学习有多年接洽教会,目下是清华交叉信息接洽院的助理老师和博导。

一个是机器东谈主硬件行业的老兵,期待机器东谈主可以借助AI醒觉智能;一个是接洽AI十多年的科学家,但愿AI能够赋能物理全国,韩峰涛与高阳两东谈主一拍即合,千寻智能就此创立。

△千寻智能公司前台  黑丝 91        起首:作家拍摄

两个技巧诞生的创举东谈主,给千寻智能赋予了浓郁的“理工男”气质。

千寻智能位于西二旗软件园的办公室,前台并无过多的装潢,最吸睛的则是一台自家的东谈主形机器东谈主正在门口进行调试。

从创举初期几个东谈主的团队,到目下快要60东谈主,公司范围的快速推广让办公空间略显褊狭,使命日里,会议室真的全满,采访今日甚而很难找到温情会议室。

在这样极简的办公空间中,韩峰涛在与《智能泄露》采访中应景地说谈 “这是我二次创业,资金使用效能在业内是很高的。”

可为了继承东谈主才,千寻智能也可以不吝重金。

前不久,千寻智能挖来前字节越过 AI 技巧巨匠解浚源,担任具身智能部发扬东谈主。在韩峰涛看来,终了具身智能需行业最优秀的东谈主才,这些东谈主才很贵,但值得费钱。

咱们也和韩峰涛聊到脚下投资机构对具身智能的复杂热枕(采访发生时,朱啸虎对具身智能的“看空”言论还未出现)。赛谈虽火,但投资机构关于其中的智能化、营业化远景,仍无共鸣。

“到本年年底,他们深信就看好和信赖了。”韩峰涛对《智能泄露》自信地说谈。

追想第一次创业的历程,韩峰涛描述那是“拿着锤子找钉子”,主若是为了用上终生所学的学问;第二次创业,韩峰涛想要总结到最真确的市集需求——处治机器东谈主的智能问题,提高机器东谈主的泛化材干和可用性。

同期,韩峰涛还学会了更灵验率地“费钱”。他的教会是,公司绸缪最大的奢靡来自于“重作念”,要幸免这个问题,握住层关于要落地的决策必须深度想考、锦上添花,还要信守政策定力,把钱花在公司荆棘齐情愿的一致主张上。

当下,具身智能公司正扎堆发布东谈主形机器东谈主新品,轮番快的,则忙着送机器东谈主进工场和营业门店,它们也被外界和媒体更多地原宥和商酌。

千寻智能则奋战在另一条跑谈上。千寻既作念软件,也作念硬件,但把更多元气心灵投向了具身智能模子研发。韩峰涛一直对峙的不雅点是“如果一家作念机器东谈主内容的公司不作念具身智能模子,它也不知谈什么是好的硬件。”

“咱们目下在模子训练和机器东谈主内容研发上的元气心灵分派,未必在8:2。如果一产品身智能企业的主张是达到GPT3.5的水平,企业的主要元气心灵应该放在模子材干上。”韩峰涛暗示。

具身智能是全球顶级的科学家和专科东谈主才发奋攻克的前沿问题。它代表着东谈主类在AGI以外的另一个终极生机——让机器东谈主像东谈主一样通过交互、感知和行为自主推行千般复杂任务,匡助或替代东谈主类。

正因“终极”,通器具身智能一度并不被投资机构所信赖和招供。与AI大模子相似,这是个斗胆的、长周期的、省略情趣高的赛谈,直到2024年10月好意思国具身智能公司Physical Intelligence(以下简称PI)的一场发布会。

在发布会展示的demo中,PI把叠衣裳作念到了基本实用化的水平,终显明机器东谈主前所未有的泛化材干,这让许多投资机构、从业者们看到了通器具身机器东谈主的但愿。

PI的新模子发布成为里程碑事件。具身智能界限此前存在着多条的不同的技巧门道,它们驱动渐渐向PI的“长入端到端大模子门道”拘谨。

具身智能赛谈在一级市集的热度也在PI的发布会之后飙升,成为继大讲话模子后新的投资热点赛谈。2024年10月于今,国内的星动纪元、星海图、自变量机器东谈主、它石智航等多产品身智能创业公司拿到数亿元的新一轮融资。

千寻智能亦然其中之一,它于近期完成5.28亿元Pre-A轮融资,投资方包含了阿好意思旗下Prosperity7 Ventures(P7),招商局创投、广发信德、靖亚本钱、东方富海、华控基金等。

本年3月中旬,千寻智能对外皮露了Spirit v1 VLA 模子一镜到底叠衣裳的demo(样片)视频,复现了好意思国公司PI的泛化操作材干。这亦然公司自建树以来获取的最大的阶段性技巧后果。

韩峰涛承认通器具身智能的终了还很远,但他并不操心在短期内会遭受瓶颈。

“具身智能跟大模子一样也存在Scaling Law,模子材干主要取决于数据的质料和数目。而在目下行业内高质料数据很少的情况下,以PI为代表的厂商也曾达成了可以的效果。异日跟着数据质料进步和数目增多,模子材干还将赓续进步。” 他对智能泄露暗示。

要对东谈主类产生价值,结出营业化果实,也并不需要万能的具身智能。韩峰涛认为,异日2-3年具身智能就可以在一些细分场景落地和营业化,从而让企业发展和融资愈加可赓续。

在咱们的采访和知乎的万字长文中,韩峰涛齐提到了刘慈欣的演义《朝闻谈》。

在这个短篇演义里,原始东谈主因为仰望星空的时刻越过了某个预设的阈值,而触发了外星高档时髦——寰宇排险者的告诫。因为在高档时髦看来,当人命意志到寰宇巧妙的存在时,距它最终解开这个巧妙只消一步之遥了。

韩峰涛以为通常的哲理也稳妥当下的具身智能赛谈。“经过半个多世纪的发展,今天的机器东谈主产业也许正迎来仰望星空的那一刻。”他在文末抒怀地写谈。

以下是《智能泄露》和千寻智能创举东谈主韩峰涛的对话。内容略经裁剪:

“具身智能的价值很快会成为共鸣”

《智能泄露》:关于具身智能,投资机构好像还有比较大的不对,真格戴雨森说通用东谈主形机器东谈主还太早,Coatue叙述里提到具身智能可能不会有 ChatGPT 时刻。你怎么看?

韩峰涛:我以为到本年年底,他们深信就看好和信赖了。

就好像部分投资东谈主底本的格调是“不投大模子,中国大模子公司没戏。”关联词DeepSeek火了之后格调发生很大改变,甚而不珍贵估值也但愿参与其中。

第一个,这些投资东谈主此前没看到中国企业能把东西作念出来;第二个,从技巧发展来看,具身智能也曾具备落地的基础技巧材干了,仅仅产品形态界说,主张东谈主群,包括技巧开辟回要再完善一些。

要开辟一个通用东谈主形机器东谈主还很远,但异日2-3年具身智能就可以在一些细分场景落地,但不一定放在东谈主形这个形态上。

《智能泄露》:你说异日2-3年具身智能就可以落地。能例如证明一下哪些细分场景吗?

韩峰涛:比如说叠衣裳的场景,服装厂、洗衣房齐需要叠大齐的衣裳。我在上一家公司处理过这个需求,原先的工业机器东谈主处治不了,但具身智能大模子可以,至于发扬推行的内容是不是东谈主形无所谓,能处治问题就可以。

《智能泄露》:是以具身智能和东谈主形机器东谈主是两回事,并不是同步发生的。

韩峰涛:对,东谈主形机器东谈主和具身智能是两个不同的标的:东谈主形机器东谈主更强调内容的形态,而具身智能则不局限于东谈主形机器东谈主,更驻扎模子材干和AI材干。

在具身智能的看法中,机器东谈主可以呈现多种形态。

《智能泄露》:你操心具身智能下一步的智能进步遭受瓶颈吗?

韩峰涛:我以为不会。第一个,叠衣裳也曾是一个相配难的操作了,如果具身智能可以叠好衣裳,那其他许多任务齐可以完成得相配好,异日深信会解锁越来越多材干。

第二个,具身智能跟大模子一样也存在Scaling Law,目下的模子材干主要取决于数据的质料和数目。

目下行业内具身智能的高质料数据还很少,在比较少的情况下也曾获取了很可以的效果。而咱们相配明确料猜测,具身智能数据的质料和数目还会大幅增强、增多,在此基础上,模子材干深信会变得更强。

《智能泄露》:比较AI大模子公司,具身智能大模子公司拿到的融资额要少。是不是作念具身智能大模子不怎么烧钱,可以花的少一些?

韩峰涛:融资金额和发展阶段是密切关连的,AI大模子也曾发展7、8年了,具身智能大模子才一年多,融资金额深信不如前者。具身赛谈目下融的这些钱是不够的,异日深信还要再接着融资。

从费钱金额上来说,作念具身智能大模子可能不像AI讲话大模子花那么多钱。

一方面,AI大模子当初踩的坑、聚集的教会,咱们可以模仿学习,比如怎么作念工程化、怎么培养东谈主才,这就能省不少钱。另一方面,具身智能需要的算力少,因为模子范围小,咱们目下范围在10B以内。

就千寻来说,这是我二次创业了,资金使用效能在业内是很高的,咱们第一个模子只花了很少的钱,关联词获取了可以的效果。

《智能泄露》:好意思国具身智能公司的估值更高,资金更多,要与其竞争,是不是得走性价比门道,像DeepSeek一样?

韩峰涛:是的,从全球竞争来看,中国具身智能企业深信照旧要讲性价比,得用中国相对比较好的工程师团队、供应链团队、工程化技能,才能追逐。

关于千寻的发展阶段来说,目下咱们融资的情况比较乐不雅,也充足支撑咱们技巧的快速迭代。

具身智能的异日深信是在中国。因为中国的硬件、供应链、蚁集数据工东谈主的工资齐更低廉;中国的阁下场景相配多。在数采几百几千台的时候,中好意思可能还能PK一下。

如果咱们栽种一个1万东谈主、10万东谈主的数据工场,或者采用众包的款式去蚁集数据,好意思国深信是比不外的。

“不管在营业照旧技巧上,优秀的具身智能企业一定是软硬件齐作念的。”

《智能泄露》:你离开珞石机器东谈主,再创业为什么遴选了具身智能?

韩峰涛:第一次创业作念工业机器东谈主,我以为是拿着锤子找钉子,我是学机器东谈主甩手的,是以上一家公司等于搞机械臂。但此次不是,第二次创业我以为要回到市集的真确需求,创业的契机起首于那处,以及市集上需要什么样的产品。

具身这个赛谈创业的契机起首于AI的进步,AI讲话大模子、图像模子,包括一些视频生成齐是在假造全国。自关联词然,在假造全国取顺利利之后,AI深信是要延长到物理全国的。是以此次创业的中枢推能源照旧AI。千寻智能的中枢业务等于具身智能大模子。

《智能泄露》:千寻会自研机器东谈主硬件吗?

韩峰涛:天然。关于一个软硬一体的产品,只作念软件深信不行。从营业化闭环上来说,行业再往后走的时候,如果只消软件就很难卖出去,莫得营收,就莫得办法支撑你企业异日的发展。

第二个在技巧上,目下咱们通过一些网上的视频以及我方的数据工场的数据来训练模子。但异日模子的进化取决于咱们卖出去的产品汇集到的、真确的场景里边的数据,这些数据会匡助模子赓续进化。

如果莫得我方的终局硬件产品,就拿不到这些数据。在自动驾驶行业,民众也曾看到只作念软件的缺陷了。

是以不管从营业上照旧从技巧上,一个顺利的或者有后劲的具身智能企业,一定是软硬齐作念的。

反过来,如果一家作念机器东谈主内容的公司不作念具身智能大模子,它也不知谈什么是好的硬件,它可能会作念好的零部件,但不知谈什么是好的整机。不知谈什么样的硬件瞎想和迭代标的稳妥具身智能。

△千寻智能的机器东谈主内容       起首:作家拍摄

《智能泄露》:你怎么看宇树最近这样火,它在许多东谈主看来是家硬件内容公司。

韩峰涛:宇树爆火给偏硬件的公司深信是带来一波红利。关联词,机器东谈主要走向通用和万能,中枢不在硬件。

硬件火了之后,民众率先会追问这个机器东谈主能作念什么,就会发现具身智能的问题不处治,绝大多数事情照旧作念不了。稍许拖沓下来之后就会发现,机器照旧很笨,还得依赖于大脑的冲破。

《智能泄露》:机器东谈主内容部分,千寻智能见长的是什么?是手照旧足?

韩峰涛:内容部分咱们是上半身见长。咱们的具身模子和硬件齐更原宥于操作,主若是机械臂和奢睿手这些。

千寻的主张是异日十年让10%的东谈主领有我方的机器东谈主,咱们想让机器东谈主去匡助东谈骨干活或者代替东谈骨干活,干活其实主若是靠上半身。身体的迁徙款式对干活有影响,但不重要。

《智能泄露》:目下具身智能发展的瓶颈在什么地点?

韩峰涛:咱们以为是东谈主才败落。高阳之前说过一个不雅点,三年内东谈主才将成为具身智能重要瓶颈。因为技巧和know-how在快速迭代,你必须得找到一流的东谈主才能加速贯通迭代和技巧迭代的程度。

具身智能赛谈处于一个无东谈主区,天然技巧门道梗概详情了,但到底将讲和哪个标的走,内部还有许多小的点。这需要在最前沿的理智的、优秀的东谈主才来完成。

追想深度学习从2012年到目下的发展历程,真的整个大的进展齐是那时在接洽这个标的的优秀博士接洽出来的,等于是高校课题顺利促进了产业化的进展。是以关于校招,咱们就盯着中国一流的前几个高校的优秀博士,接洽标的作念诡计机和东谈主工智能的。

“具身智能Scaling Law还有很大红利,模子材干将赓续进步”

《智能泄露》:具身智能大模子存在一些技巧门道的不对,有的信赖端到端模子,有的信赖大小脑分层,还有讲话系统和感知系统等不同模块,千寻智能采用了什么样的门道?

韩峰涛:咱们是莫得诀别大脑小脑的,就顺利一个端到端大模子VLA (Vision Language Action),讲话、图像、看成齐在内部。

接洽到这个模子要跑在机器东谈主上,端侧的算力有限,如果讲话部分太大,运行速率就没那么快,会影响机器东谈主响应速率。咱们就需要作念个遴选,在机器东谈主端侧放一个小的讲话模子,未必3B到7B,咱们基本上用开源的也曾训练好的讲话模子。

模子大小,取决于你需要这个模子对环境的和会有多深。如果机器东谈骨干个松弛任务,咱们就跑端侧的小模子,加上看成这部分,加起来统统是10B以内的VLA模子就行了。

《智能泄露》:我发现目下越来越多具身智能企业驱动讲“端到端”了,这也曾是行业共鸣了吗?

韩峰涛:是的,行业的技巧门道也曾相对拘谨了。触发要素是旧年10月好意思国公司PI的新模子,它把叠衣裳这件事作念到了基本达到实用化的水平,这是个很大的技巧进步,是里程碑式的事件。

在PI之前,具身企业的demo(样片)齐是一些很松弛的握取。类似叠衣裳这种联结的、长程的、关于复杂对象的操作,底本的具身智能一直终了不了。而PI的训练要津,等于端到端大模子VLA。

趁机提一句,PI的两位主要创举东谈主是咱们贯串创举东谈主高阳的师兄,他们兼并个导师。

《智能泄露》:你们对具身智能的物体识别准确度,目下条款高吗?

韩峰涛:看场景条款吧,一般来说,具身智能模子关于识别的精度、准确度条款比自动驾驶要低一些,比如让机器东谈主拿个纸巾,识别错了再握一次也可以,不会像自动驾驶一样变成交通事故。天然咱们深信会赓续进步它的识别度。

《智能泄露》:你们目下怎么训练具身智能大模子?

韩峰涛:千寻目下训练具身智能大模子,跟训练大讲话模子的范式和要津基本是一样的。

先用质料没那么高,但千般性很好的海量数据作念预训练,让模子对全国有一些基本贯通,但这个阶段顺利干活精度还不够,是以需要高质料数据作念微调,微调完之后再通过强化学习提高顺利率。这个进程对应于大讲话模子的预训练、SFT(监督微调) 和RLHF(强化学习)。

《智能泄露》:预训练和微调分别用什么数据?

韩峰涛:预训练用大齐的互联网上东谈主类干活的视频,比如YouTube和爱奇艺这些,数据质料可以差小数,但一定要大,千般性一定要好;微调就用高质料数据,咱们用的是真确的遥操作数据,是在数采工场真确蚁集出来的。

举个学游水的例子,可以先看视频去了解基础的姿势也等于预训练,再请的游水教悔手把手教学也等于高质料数据微调,最终学会游水。

《智能泄露》:有的厂商用仿真数据,这类数据质料怎么样?

韩峰涛:每种数据源有我方的优错误。视频数据量很大但精度不高;遥操作数据精度很高,但量不大。仿真数据的特色是比较易得,但精度不太好。咱们也用仿真,把视频和仿真用在预训练。

总体来说,目下莫得任何一种单一数据可以支撑大模子的训练。最合理的决策是把不同数据用在不同的训练阶段。

仿真数据关于刚性物体师法的还可以,稳妥训练对刚性物体的握取。但关于柔性物体,比如叠衣裳场景,衣裳动了怎么变形和畅通,仿真数据的可用性不行。

《智能泄露》:有一些厂商,如智元机器东谈主开源了一些数据库,这些数据其他家可以用吗?

韩峰涛:这类数据可以拿来作念预训练,但不稳妥作念微调。

在现时阶段,数据质料和硬件是强关连的,别家在他的硬件上蚁集的数据,在千寻的硬件上不成顺利用,因为包括数据蚁集的频率、位置、精度、末端推行器规格等齐不一样。

这亦然为什么我说,好的具身智能企业,一定要软硬件齐作念,因为它是软硬贯串优化的。

西西人体艺术摄影“具身智能2-3年可以落地阁下,但汽车整机厂不是合适场景”

《智能泄露》:有些事情传统工业机器东谈主可以作念得很好,为什么目下照旧器具身机器东谈主来作念,比如在特斯拉工场搬电板。

韩峰涛:底本的工业机器东谈主和目下具身智能的中枢各异,在于具身智能有材干和会环境变化并转变看成。但传统工业机器东谈主不可以,它是被编程写死的,只可几年如一日的访佛看成。

就搬东西来说,搬运物品的位置、时势发生了变化,传统工业机器东谈主不成我方转变,但具身智能可以。

《智能泄露》:特斯拉让东谈主形机器东谈主搬电板,这个场景是真确的需求吗?

韩峰涛:是真确存在的需求。不同产线的锂电板的规格、摆放的姿态、位置可能齐不一样,是以工业机器东谈主没法处理。关联词营业上不一定算得过来账,东谈主形机器东谈主价钱太高,用东谈主工可能效能更高、更低廉。

《智能泄露》:前段时刻有个很热的话题:东谈主形机器东谈主进汽车工场。你怎么看东谈主形机器东谈主进汽车工场?

韩峰涛:率先从营业化这个角度,汽车主机厂(即整车厂)其实不是一个异常好的客户,因为底本主机厂的自动化程度也曾相配高了,那内部天然说有不少工东谈主,但工东谈主操作复杂,用机器东谈主或者自动化相配难替代的,不稳妥机器东谈主早期落地。

相背,汽车零件厂,例如电板厂是更好的落地场景,用东谈主更多,工序松弛。

具身智能产业才刚刚驱动,东谈主形机器东谈主硬件也刚刚驱动,两个相配早期的技巧和会一块,去干一个相配复杂的事,这相配难。是以汽车主机厂不是很好的落地场景,马斯克我方造车,是以机器东谈主在我方工场用,但国内许多东谈主随从这样作念,我以为是没搞瓦解。

《智能泄露》:有机构建议了具身机器东谈主落地的先后礼貌,认为技巧难度上to G小于to B小于to C,你怎么看?

韩峰涛:从技巧难度上如实是,G端政府可能更多是支撑行业和企业发展,给一些示范神志,可能会选一些相对比较禁闭的场景,对安全性条款没那么高。

To B的工场场景亦然相对固定,但to C的场景因为每家的装修齐不一样,环境愈加复杂,是以难度也更高。

关联词从市集范围来说,C端大于B端大于G端,是以在选营业化主张的时候,要抽象来看,均衡好落地难度和市集空间。

《智能泄露》:具身大模子熟识而况可用之后,通用东谈主形机器东谈主是不是就可以终显明?硬件上还有哪些卡点?

韩峰涛:关于现时来说,比较成为卡点的有奢睿手、双足的高动态性能、外界抗扰材干、续航材干,然后一些力传感器、数据传感器、电子皮肤这些其实齐是卡点。而且这些卡点齐不是AI进步可以处治的。

东谈主形机器东谈主要朝上冲破,是卡在材料、电机功率密度等一些基础学科问题上。具身智能朝上冲破,是卡在模子材干上。

封面起首|企业官方