21对话| Zhuo Yu和Chen Xiaozhi:使用有限的计算能力来

继续讲述“价格比”的故事。 21世纪的《先驱报》记者乔·温朱恩(Jiao Wenjuan)报告说,从比亚德(Byd)分配了向70,000级市场的驾驶援助,OEM追逐了明智的驾驶和乘车,供应商经常进入台湾市场的前面,而汽车市场则散发出一波智能行动。与市场上的其他智能驾驶解决方案相比,朱欧的技术是追求“价格比率”的普通参与者,也就是说,使用低计算强度来实现更强烈的驾驶援助功能。去年3月,Zhuoyu Technology(以前的“ DJI汽车在车内”)提供的7V(7台相机) + 32台调整开始是模型中80,000至150,000元的标准调整。 MAAIT的模型至少有80,000元的型号具有诸如城市记忆中的导航,高速导航和驾驶功能。 Sa oras na Iyon,Ang Mga Modelo Na Gawa Ng Masa Ay Kasama Na ang Baojun Yunduo,ICAR03。Kumparasa Merkado,UpangMakamit Ang Mga Pag-andar tulad ng Pag-ng ng lunsod在Pagmamaneho的高速航行中需要254台计算能力。 “今年,朱尤的重点是在有限的硬件和有限的计算强度中实施强烈的计算能力,并实现最终功能和性能。”朱尤技术的首席AI技术官陈小维对记者说:“这是我们的血液中的东西。”在自开发的硬件和软件中都可以看到朱尤技术(因此从称为“ zhuoyu”)最终控制能力。他们将自己作为供应商,包括软件和硬件。在硬件成本方面,以上海汽车展开始发起的Zhizhou盲目填充雷达为例,它的成本可以在1,000元人民币范围内控制。按照软件通过自开发的模型,朱尤也降低了成本。删除这些功能来自“ DJI汽车”时期的积累。在自由之前,Zhuo Yu的前任是DJI中的一个团队,致力于研究,开发和探索驾驶方面的智能技术。该部门成立于2016年。在早期,它依赖于DJI在无人机领域的传感器,计算机视觉和导航算法的积累,它逐渐将其扩展到刻度的智能系统驾驶中。在此期间,团队开始部署基本技术,例如双眼视觉和对BEV的理解,并训练了Zhuo Yu的视觉技术的优势。 2024年11月,朱尤(Zhuoyu)推出了“ Chengxing平台”,该平台为7V和9V提供了解决方案,涵盖了高速导航,没有地图,跨层停车场和其他功能。它的特征是,它可以减少高精度和激光地图的希望H BEV和双眼视觉技术,并实现了驾驶援助和高级阶段。 2024年,中国FAW,大众汽车,SAIC-GM-GM-GM-GM-GMULT,Chery Automobile和Dongfeng Automobile成为了所有客户。 5月9日,Zhuo Yu首次宣布了九个主要合作社客户。除了上述五家主要汽车公司(包括Thebyd,Great Wall Motors,Audi和Baic Group)外,每个人都加入了Zho Yu的手。根据朱尤(Zhuoyu)发布的数据,质量制作了20多个模型,并且有30多个模型即将产生质量。此前,Zhijia公司的一名高管在21世纪的《先驱报》中被认为是2025年中期和低端市场将成为一个更大的市场。这是朱尤很棒的地方。 Baojun Yunhai于去年下半年推出,该标准配备了DJI的Lingmou Zhijia 2.0 Max,这使Zhijia达到100,000元。但这也意味着较低的市场有更多的眼球,Zhuo yu iS在很大的压力下。这种压力不仅来自智能游戏解决方案的供应商的同行,还来自继续促进自我开发的智能游戏沉没的OEM。在PPayon成本中,Zhuo Yu仍会产生更多的计算强度演变。在今年的上海汽车展上,Zhuo Yu提出了基于Nvidia Thor的VLA模型。即使对于具有较高计算能力的NVIDIA THOR平台,Chen Xiaozhi也认为,尽管Thor的域控制具有巨大的计算强度并增加了成本,但与Orinx的双重解决方案相比,单个Thor域控制的成本较低,但也是成本降低解决方案。根据Zho Yu先前揭示的信息,随着NVIDIA高计算能力的增强,Zhuo Yu将进一步促进智能驾驶领域的世界模型的制造。世界模型的力量,朱Yu的明智驾驶解决方案是可能的。 Chen Xiaozhi认为今年Zhuo Yu将会专注于促进强化和全球模型的研究,该模型使用思维和缓慢推理方法的思维链。如果实现这一目标,它将大大提高安全性。从3月底到上海车展,我们与Zhuoyu Technology的首席AI技术官Chen Xiaozhi博士进行了两次交流。他今年与我们分享了朱尤技术的技术优先事项和路线。以下是采访的笔录。摘录:继续讲述“价格绩效比” 21世纪商业先驱的故事:今年,我们看到Byd促进了所有人对辅助驾驶的赞美,而华为还建议L3条件自动驾驶。 Zhuo Yu还产生了生成辅助的驾驶,该驾驶接近更高水平的经验。在朱的观点上,今年的主要战场在哪里? Chen Xiaozhi:今年,我们的技术和产品将集中于最终的L2辅助驾驶功能和FlagshiP Thor的P平台,并从两种尺寸的安全性和智能中付出努力,以实现辅助驾驶功能。 21世纪商业先驱:在今年的上海汽车展中,朱u启动了盲目的雷达知识周。你要花多少钱? Chen Xiaozhi:周的盲点激光的成本不到1,000元。 -21世纪的《商业先驱报》:除了以前的视觉解决方案外,朱Yu现在还为封面推出了解决方案。这条道路扩展的考虑是什么? Chen Xiaozhi:我们对激光的看法没有改变,我们始终认为这是一个安全又多余的角色。过去,Theour项目并未使用许多激光器,但是今年的一些项目也将与配备JIM 1.0的系统进行大规模制定。我过去没有做太多事情,因为我们认为愿景本身仍然有很大的探索空间,因此我们专注于视觉解决方案。 21世纪的《商业先驱报》:Zhuo Yu一直比C有很大的优势OST控制。最近,Zhuo Yu发起了托尔(Thor),JIMU 2.0的巨大计算强度,具有激光雷达(LiDAR)的整合和视力。 Zhuo Yu会继续他以前的成本优势吗? Chen Xiaozhi:只要看传感器本身,我们认为它仍然具有成本和有效性的好处。我们激光 +惯性导航三个项目组装解决方案的总成本不会高于单独的激光器,因此我们认为这是独特的成本。 Thor的域控制具有很高的计算强度,并且确实成本很高,但它针对了两个常见的500台Orinx解决方案。它可以用700台Thor-U代替它,并以更多的计算和较低的成本替换。因此,从这两者之间的基准观点来看,这实际上是一个降低成本计划。 21世纪的《商业先驱报》:朱欧的成本是否会在未来继续下降? Chen Xiaozhi:我们今天更关心的是Navi城市的登场及其成本当然更低。例如,Zhuo YU目前使用7V摄像头以及32ops Computing Power Platform可以导致城市航行。对于通常可以看出,人们经常使用激光和道路交通计算能力的平台也可以节省很多成本。但是,将车型用于降低价格仍然会有一些压力和挑战。我们可以支持更简单的硬件来统治城市,我们的客户更容易促进标准调整。 21世纪的《商业先驱报》:我们宣布的指定公司是基本的独立品牌和大众汽车,但昂贵的品牌现在正在寻找本地化的驾驶供应商。接下来在朱尤有可能合作吗? Chen Xiaozhi:除了我们目前正在从事的客户外,我们还被一些全球客户所取代。相关合作肯定会在未来增加。我们还在国外扩大客户,他们的L国外模型和模型。 -21世纪的《商业先驱:华为》在几个小时前发布了一项针对L3条件自主行驶的商业计划。朱尤有计划吗? Chen Xiaozhi:我们今年要做的是制造L3和L4硬件,包括控制器和传感器,以满足L3和L4 Architecture的冗余需求。除了视觉摄像机外,该传感器还将添加LIDAR以解决冗余。我们今年需要做的就是首先使用硬件前进行伯爵。 21世纪的《商业先驱报》:您认为这需要L3需要多长时间? Chen Xiaozhi:我们认为,基础在L2岛岛L3和自主驾驶条件之前,L2联合辅助驾驶做得很好,但我们看不到时间的时间fortime。加强研究是《 21世纪先驱报》的未来趋势:工业和信息技术部对智能驾驶的监督已经严格过去。你怎么认为?这对朱有什么影响哦? Chen Xiaozhi:工业和信息技术部的新法规确实对技术和产品没有影响。我们认为这确实是一件好事。该行业总是有很多无尽的声音,但是实际上,当人们说这些话时,没人知道他们的代表和意识到。 21世纪的商业先驱:朱尤今年的技术重点是什么? Chen Xiaozhi:我们今年将重点关注的是对加强和世界其他地区的研究,或者是思考推理和缓慢推理的技术。您相信,如果可以实施这两种技术,它们将有更大的安全性改进。 21世纪的《商业先驱报》:如何提高这种技术的安全性能? Chen Xiaozhi:对于以前长时间尾部场景中看不到的数据,模仿研究可以执行一些意外的行为。但是,研究加固,您可以探索一些您从未见过的州n,以便您可以做出更合理的决定。我们认为,通过数量级将提高安全性。 21世纪的《商业先驱报》:几个小时前,朱尤(Zhuoyu)发行了Gendrive的生成智能操作,可以实现个人驾驶。您如何实现“成千上万的人和成千上万的面孔”? Chen Xiaozhi:智能技能的关键,“成千上万的人和成千上万的面孔”的关键在于我们正在开发世界上端到端的模型。 21世纪商业先驱报:它与传统的世界端到端模型有什么区别? Chen Xiaozhi:传统的端到端是基于模仿的研究。您已经从大量驱动程序数据中学到了他的行为,但是由于数据中有各种驱动程序,因此您所学的样式确实是一个没有什么区别的普通驱动程序,因此很难达到一千个面孔。其推理过程也基于INT端到端。当检测输入传感器时,需要采取驾驶动作。这是一个很容易理解的一个时间 - 动作的预测。 21世纪的《商业先驱报》:您使用世界模式来实现“成千上万的人和成千上万的面孔”的想法是什么?通过世界模型,世界模型的特征是推理的能力,可以产生将来可能发生的情况,例如N平行宇宙。这里可能有意外的事情,有些人不符合用户驾驶目标。您可能需要一个推理过程来根据用户的意图选择最可能的轨迹驾驶。其背后的技术核心是能够推理模型世界的能力,这将引入训练过程中加强的研究,以克服研究模仿本身的局限性。从-21世纪商业先驱:培训ASA模型是否需要很多数据? Chen Xiaozhi:数据量的差异绝对较小。这不仅仅是算法的变化。引入了加固研究后,可以减少数据的积累。由于研究了模仿,您需要效仿某些极端情况的行为。您需要从这种情况中收集数据。一些场景数据很难涵盖。加强的研究可以通过模拟方法产生这种情况,从而可以减少对数据收集的需求。 21世纪商业先驱:如今,许多汽车公司正在推出多个端到端版本,这可以代表模仿研究路线。如今,Zhuo Yu已推出了世界模型,代表了增强研究路线。您认为这两条路线中的哪一条将是mainnext? Chen Xiaozhi:它将随之而来。我们说,强化的教育不是对强化的纯粹研究,而是建模培训仍将分为两个主要阶段。预训练的第一阶段是对模仿的重要研究。有很多数据需要进行预训练。预训练可以达到80分的总体能力,并且大多数情况都表现出色。但是,从80点到95分,持续使用模仿研究的成本较高,攀登的边际回报将减少。目前,使用加固的效率将更高,并且安全所有方面的指标可以大大提高。在对加固的研究结束后,这并不是要放弃模仿的研究,而是关于其整合,即在不同训练阶段的游戏方法。要清楚,从头到尾学习肯定不是最好的解决方案。 21世纪的《商业先驱报》:最近,每个人都一直在关注驾驶帮助的安全。 Zhuo Yu应该如何确定使用数据和情况的准确性世界模型生产场景? Chen Xiaozhi:应从两个维度评估准确性,一个是诚实的,另一个是几何或物理准确性。诚实是模仿的形象或视频是错误的,这在技术上解决了。为了获得几何或物理准确性,我们可以使用几何模型,例如深度估计模型或持续变化建立来判断几何一致性。可以通过操作一些几何模型,深度估计模型以及持续变化的建立来找到这种一致性,以确定是否存在问题。 21世纪的商业先驱:许多友好的公司也从事世界模型。世界上的世界模式何时会达成共识? Chen Xiaozhi:我们认为世界模型肯定是下一代更好的建筑,我们认为这将是从今年到明年的技术升级方向。 21世纪的《商业先驱报》:应用时会发生什么变化D对消费者体验? Chen Xiaozhi:目前从停车位到停车位的操作确实不好。现在有一条可以提前记住停车场的路线,甚至要注意整个停车场的地图,以在Paradahan找到空间。但这并不是人们开车的情况。人们通过查看土地箭和标志来开车。世界端到端模型也将具有这种能力。通过查看这些箭头或这些信息,我们认为点对点应该是一种方式。今年,它应该达到这一水平。这仍然是驾驶员协助的L2组合,但是体验应该使一切更自然,更聪明,更连续体验。