特斯拉Autopilot的“引擎”马斯克背后强悍的中国女博士

时间:2024-02-23 08:19:49

谷俊丽毕业于清华大学与美国伊利诺伊大学香槟分校,在清华期间就作为核心人员参与过超长指令字数字信号处理器研究,之后曾在 AMD 中国研究院任高级研究员,带领 AMD 人工智能团队,进行大规模人工智能在分布式硬件系统的实现和大规模物体识别的软件应用研究。

在 2016 年 2 月加入特斯拉之后,作为特斯拉 Autopilot 机器学习技术核心人员,她和团队成功开发了 Autopilot2.0 产品,并实现了在多代特斯拉车上的大规模部署。

2017年10月,谷俊丽正式出任小鹏汽车自动驾驶研发副总裁。加入小鹏汽车后的谷俊丽将全面负责小鹏汽车的自动驾驶研发团队的创建,帮助小鹏汽车搭建拥有自动驾驶功能的汽车。

“特斯拉自动驾驶系统Autopilot2.0的量产,一个中国女博士在其中发挥了极其关键的作用,她以一己之力完成了核心计算单元50%的代码。”

当一个特斯拉的朋友这样告诉车评君时,车评君立马就跪了,因为在其他公司,这通常是100个人的工作量。

“如果你对自动驾驶感兴趣,一定要去见见她,和她聊一聊。”这位朋友郑重地说。

毫无疑问,特斯拉对是一家人类交通行业改变巨大的企业,它的自动驾驶系统,影响尤为深远。截止目前,在地球上有超过20万辆跑在马路上的特斯拉车型,每一辆车上都标配了一个叫做Autopilot的自动驾驶系统。美国高速公路交通安全管理局(NHTSA)认为,安装了Autopilot系统的特斯拉车型,事故率降低一半。

鉴于特斯拉率先将自动驾驶技术大规模地部署在量产车型上,传统车企不得不全力以赴研发自动驾驶技术,掀起全球范围内的自动驾驶技术量产竞赛,人类因此而受益。

钢铁侠Elon Musk,与乔布斯一样,对手下要求极其严格,但对这位女博士工作的评价是“impressive”。

这个强悍的中国女博士是谁呢?没错,就是谷俊丽,特斯拉第一任Machine Learning 的技术负责人。

作为特斯拉Autopilot团队当时最核心的骨干之一,谷俊丽定期向马斯克汇报工作进展,有时甚至天天电话会议。她设计和开发的嵌入式实时人工智能计算引擎使得Autopilot2.0产品在特斯拉车上成功实现大规模部署。

2017年10月23日,知名中国汽车初创企业小鹏汽车对外宣布,原特斯拉Autopilot的技术负责人谷俊丽已加入该公司,出任自动驾驶技术副总裁。

车评君深感高兴,一方面全球最顶尖的自动驾驶技术人才,能够回到中国,投入激动人心的本土自动驾驶事业之中。

另一方面,经过多方努力和争取,车评君能够和谷俊丽博士以及其他的特斯拉朋友取得联系并沟通,才得以终成此篇,与大家一起分享在特斯拉的工作经验,以及钢铁侠马斯克是如何发挥团队潜能,去做胆大包天的创新,去完成几乎不可能完成的任务。

特斯拉新一代自动驾驶系统的“引擎”

整个2016年,对特斯拉乃至人类自动驾驶事业,都具里程碑意义。在这一年,特斯拉终结了与Mobileye的技术合作,全力研发自己的自动驾驶系统。于此同时,大量传统车企也在2016年下半年,宣布了L4级别的自动驾驶技术的研发日程表,人类社会开始一路奔跑,冲向自动驾驶时代。

谷俊丽于2015年底、2016年初离开了AMD,加盟特斯拉,担任人工智能技术带头人。

在AMD,她的团队比英伟达更早地研发出用于AI计算的异构兼容的软件系统,但未能受到公司战略重视。而昔日显卡巨头英伟达将人工智能定位公司第一策略,一举奠定了AI计算平台王者的地位,股价涨了7倍。

2016年初,特斯拉与Mobileye的合作几乎已经终结。谷俊丽的任务就是研发特斯拉自主的Autopilot 2.0的机器学习核心模块。人手非常紧缺,但整个2016年,谷俊丽只招进去了几个人,因为她招的每一个人,马斯克都要亲自把关和审批,要求极高。

马斯克从不降低人才录用的标准。到2016年年中,谷俊丽只成功招到了一名人工智能算法专家,他是世界上运行速度最快DNNWinograd算法的作者,一个极其聪明的技术极客,只通过数学定律看待世界。

只有这样的写出世界上最快DNN算法的天才,才能达到Elon的招人标准。马斯克对招人的要求永远都是:“我们只招最聪明的人。”

车评君带大家回顾一下2016年特斯拉在自动驾驶领域的境况:

2016年7月,正式宣布与Mobileye终结合作;2016年9月,马斯克在TED大会上宣布2017年底时,自动驾驶汽车将横穿美国;

2016年10月,特斯拉发布新一代自动驾驶硬件系统,称将可支持L4级别以上的自动驾驶,然而软件的更新一再跳票。

特斯拉的朋友告诉车评君,那个时候的谷俊丽团队的状态是,谷俊丽带着一个时常需要请假调整的技术极客,和两个是刚招聘的新手。显然,那是一段艰难的旅程。

2016年的最后一个季度,灰暗的天空开始有一些色彩,特斯拉愉快地对外放出一段Demo,他们的车辆在硅谷的道路上,没有人类司机的操控,自如地自主驾驶、自动停车。

谷俊丽设计的计算引擎成功解决了产品大规模部署需要解决的实时计算问题,在向跟马斯克汇报时获得的评价是“impressive”,她们几乎泪崩,因为钢铁侠极少给出这样的评语。

2017年1月1号,Autopilot 2.0产品成功发布到用户车上,那天谷俊丽终于得空休一天假,她到旧金山去玩,是日天空蔚蓝,心情特别激动。谷俊丽说,当时的感觉是,自己终于找到了为之奋斗终身的事业。

完成从0到1的产品研发之后,2017年Autopilot在特斯拉商用车上实现快速产品迭代,谷俊丽带领其逐渐扩大的团队开始承当更多任务,持续提升算法精度、实时计算速度和云端训练软件,提升Autopilot产品体验。谷俊丽为特斯拉的Autopilot 2.0做出的重要工作包括:

1、人工智能的roadmap和核心算法创新。谷俊丽具备将自动驾驶需要的AI算法演进和处理器Rooflinemodel高度融合到一个图中的解析能力,她非常擅长在特定的计算能力范围内设计精度最高的的算法框架,且最终能够被成功高效部署到车里,所以非常得到Elon的认可。这个能力至关重要,在自动驾驶产品研发中直接避免了走弯路。

2、嵌入式人工智能实时计算引擎架构设计和实现。这个引擎能够允许特斯拉的自动驾驶算法满足实时计算需求,并具备和不同公司芯片异构兼容的能力,令马斯克非常高兴。依托强有力的CPU和GPU背景,谷俊丽带领团队将算法在特斯拉车的第二代硬件系统上进行深度优化,性能在业界领先,直接解决了Autopilot在特斯拉车上的量产部署。

3、依托高性能计算背景和人工智能软件研发能力,将特斯拉的云端算法训练时间降低到天。满足高频迭代的Autopilot产品的需求。

特斯拉和“钢铁侠”的工作模式

在加入小鹏汽车之后,谈及特斯拉时,谷俊丽仍然会说“Tesla is a great company”。有很多方面值得中国的企业领导者学习。

1、极度创新、快速执行

在很多公司,公司高管对创新忧虑重重,关注风险多于关注创新所带来的收益。特斯拉是一家极端注重创新的公司。

谷俊丽说,特斯拉每天都在创新,每天都在快速创新,没有一个好的创新会因为有风险而被拍死。“Elon永远觉得创新不够,他招人的时候,永远先看这个人是否具有创新精神,是否在某些领域具有深度见解,而不在意人的性别、肤色和年龄。”

在马斯克创建的众多公司中,不仅仅是特斯拉,包括Space X、Open AI、NuroLink,the Boring Company,都是非常年轻而又具有创见的人担当主力。

谷俊丽说,特斯拉的创新速度和魄力,很多合作公司都能够被吓死,根本就跟不上。特斯拉具备这样的魄力自己做很多东西,这也是为什么特斯拉有很多垂直业务。

当被车评君问及,目前业界的终端AI处理器,在可控的价格内,能否支撑L4级别的自动驾驶时,谷俊丽认为还需要2-3年时间。

马斯克极其注重执行力,问题提出后很快就需要有结果,除非你给出非常合理的解释和理由。

向马斯克汇报工作,是压力很大的。提供技术解决方案时,试图给出maybe yes maybe no的方案时,是绝对不能够被接受的。谷俊丽开玩笑说她感觉在特斯拉每个周三都是新的开始。

此时此刻,科技即将颠覆百年汽车产业。创新和执行力,对于中国的车企而言,变得愈发重要。任何一家传统车企,无论你多么有资源,现有的市场地位看起来多么有利,但如果没有优秀的创新能力和执行力,将会被凶猛的新生力量拍死在沙滩上。

2、工作强度极大

谷俊丽说,她在特斯拉的一个季度的工作量,相当于在其他公司时1年的工作量。

马斯克是一个工作狂,他管理着如此之多的公司,每天接触大量的信息,依然能够快速决策。哪怕是在凌晨2点时,你给他发邮件,只要是他认为重要的事情,会立刻回复邮件。

他有一种能力,就是让你永远不会消停,在公司的每一周感觉都觉得像进入公司的第一周,需要接受大量的新东西,提很多问题,不断地学习,不断的思考。

这也是为什么在2016年开发Autopilot 2.0的时候,谷俊丽设计一个核心模块并与两个人写了该模块所有代码的情况。马斯克非常善于将一个人的潜能逼迫出来,这和乔布斯很像,人们会渴望得到他的认同而玩命工作。谷俊丽说,在特斯拉的每一天,她的大脑都在快速运转,深入思考很多问题。工作强度很大时为了维护脑力,她每天不管多晚都要跑步一个小时。做自动驾驶,精力非常重要。

谷俊丽说,在特斯拉的每一天,她的大脑都在快速运转,深入思考很多问题。工作强度很大时为了维护脑力,她每天不管多晚都要跑步一个小时。做自动驾驶,精力非常重要。

3、创始人深入业务

马斯克是Autopilot的*处理器,他会直接发出或长远的、或近期的工作指令。每周钢铁侠都会和Autopilot团队核心成员开会。马斯克每天都会试用特斯拉的Autopilot,开会时先说产品的问题,毫不留情。

马斯克深入业务,对具体的产品和业务有着深入的思考,能够对业务的发展和趋势有着清楚的判断。令人惊奇的是,与他打交道的人都是MIT、斯坦福、UIUC的博士,在某些领域已经研究得很深,但马斯克总能迅速地做出明确的决策。

谷俊丽总结,马斯克的思维模式是根据物理学第一定律来思考的,把问题简化、然后直击本质。

特斯拉要求每个人要在某个领域里面有深刻洞见,能够快速独立解决问题,马斯克经常会直接和各业务负责人布置任务,甚至有时开会连管理人员都不带上。在特斯拉只做管理是很痛苦的。

显然,对于现阶段的汽车公司而言,深入业务的产品导向型的CEO,有利于产品的创新和迭代的速度,并在市场上占据有利位置。

这是目前中国传统汽车领域最大的痛点之一,在所有的车企管理者中,也许只有王传福和魏建军具备这样的能力和风范。

谷俊丽如此总结特斯拉对员工的要求:

1、极具创新精神,且在某些方面一定有专长,且要有深度的思考。

2、极强的解决问题能力,能够单独做项目。

3、心脏要足够强大,能够承认强大的压力和挑战。

注定做自动驾驶

谷俊丽成长于中国山东的一个公务员家庭,她的家人也许从来就没有设想过有一天,这个爽朗的山东姑娘,会在自动驾驶领域对人类带来巨大的影响,并成为这个复杂的、多学科交叉行业的领军人物。

也许是冥冥中的注定。谷俊丽的成长过程,和自动驾驶的发展几乎是不可思议地暗合到了一起。

2006年,本科还是信息工程专业的谷俊丽,在研究生阶段决定转行做芯片。当时,她的导师就很震惊,问为什么?她说通信已经做到头了,而处理器足够难,中国还没有做出来。于是她真的做了,而且成为清华与华为合作的SIMD-VLIW处理器的核心研发主力,并做了出来。

在清华期间,谷俊丽已经展现出超强的代码能力,当时流行的264编译器被她用C++写了一遍之后,又用最底层的机器语言汇编语言写了一遍,在大牛云集的清华,人们称那个处理器为Lily处理器。

博士阶段,谷俊丽再度跨界,准备做多核处理器。清华的导师说,国内连单核还没搞出来,我怎么指导你做多核,你赶紧出国联系导师去。UIUC是美国超算中心,谷俊丽去了UIUC,师从高性能计算鼻祖Steve Lumetta,做单芯片多核处理器上的高性能计算,提出了MOPED设计,当时解决了单芯片内多核通讯的难题。

谷俊丽说,在清华阶段,培养了非常强的工程能力(代码能力),而在UIUC在解放了她的创新思维、*独立思考并深度解决问题的能力。

从UIUC毕业后,她一度感到迷惘。因为在谷歌干了4个月的通用编程之后,她发现那根本就不应该是她做的事情,因为有些程序员连cache都不知道,更别说什么处理器(CPU是串行计算)、高性能异构计算(并行计算)了。而她设计的多核处理器如此厉害,编程中根本就用不上。

她当时认为,她应该去做针对应用的处理器设计,但21世纪最核心的应用当时并不清楚是什么。

恰巧AMD找到了她,说中国的大数据很火,你到我们中国研究院负责大数据研究吧。谷俊丽问,你们研究大数据想干什么?AMD说,我们也不知道,你来帮我们研究吧。于是,谷俊丽在AMD中国召集了一批有志青年组成了Y-Lab,开始研究大数据。

谷俊丽说,当时她把大数据当做一个应用方向,研究了几个相关的应用之后,发现原先的认识是不精确的,大数据+深度学习+计算芯片,才是21世纪新的应用。加上汽车平台就是自动驾驶了。

至于为什么选择深度学习作为在AMD的大数据研究方向,谷俊丽开了一个玩笑,她说,当她看到一个深度学习的第一篇Paper时发现看了一周都没彻底弄明白,就觉得这个东西有做头。于是带领团队夜以继日的学习、研究。最后决定做一个能够支撑深度学习的软件和硬件结合的一个东西,并且提出这种软件应该能够异构兼容,跑在Intel、AMD、Nvidia以及FPGA上,目标胆大包天,做得非常痛苦。

在2014年的时候居然做出来了,基于OpenCL的机器学习软件研发成功,大规模算法训练收敛,并且在GPU上实现了高性能计算的并行优化机制,将性能提升10倍多,第一次实现DNN跑在AMD的GPU、APU以及NVIDIA的GPU上。

在那个时候,英伟达还没有在深度学习有很大动作。遗憾的是,AMD的管理层对这支远在中国的小团队的创新虽然很有兴趣,但并没有意识到其重大意义,错过了AI芯片崛起的良机,而英伟达黄仁勋根本就不会容许错过这样的机会。事实上,截止2014年AMD依然拥有全球最好的GPU研发团队。

此时,谷俊丽去特斯拉几乎已经是注定了的。马斯克显然已决定要终结与Mobileye的合作,大肆挖人,准备研发特斯拉的Autopilot 2.0。

本科阶段学的是信息工程,研究生时设计了Lily处理器,博士阶段做的是单芯片多核处理上的高性能异构计算,在AMD做的深度学习算法和软件并首次解决了异构兼容。这些能力与汽车结合,就是自动驾驶。

谷俊丽毅然决然加入特斯拉成为机器学习的技术负责人。她的所有的技能点,在特斯拉Autopilot 2.0的研发中,均发挥了巨大的作用。书写了一个人贡献了特斯拉Autopilot2.0 核心计算模块 50%代码量的传奇。

因为谷俊丽在解决自动驾驶问题时,能够充分发挥其跨领域的背景和系统性解决问题的能力。她能够将大数据、人工智能算法、高性能计算、嵌入式等领域的专业知识充分加以应用,能够将具体场景的驾驶问题分层、分解、定位和解决。她在和其他Autopilot团队的合作中,这样的知识也起到粘合胶的作用。

当被问及当前自动驾驶行业的挑战和问题时,谷俊丽说,自动驾驶是一门实践学科,所有的问题只有在垂直整合,在量产时,才能真正被发现、被定义、被解决。

比如现在的做终端AI处理器,并不知道算法和应用场景,所以很难匹配得好,发挥出芯片应有的作用。另外,做软件算法的,不了解芯片的原理,无法将算法映射到芯片中,在耦合和匹配也会出现问题。

因为没有量产问题,很多做算法的,根本就不考虑算法的调整需增加多少计算力。增加计算力,就意味着增加芯片面积、散热要求和成本。她说,她那时候在UIUC做高性能计算的模拟,随便动几下键盘就需要调动几百台服务器进行计算,BlueWater分布式节点的冷却水,是可以拿过来用于学生宿舍洗热水澡的。

现在的一些自动驾驶研发公司,比如cruise、Argo,汽车的后备箱背一个超大机箱,到处跑,这是没法量产的。因为汽车的芯片要嵌入式,面积要非常小,成本要低,散热要求要低。所以她在特斯拉的时候,Elon要求她对HW2进行算法和计算优化,让嵌入式的芯片能够满足计算要求。

特斯拉自动驾驶研发,和其他公司相比,最大的区别是,所有的系统,均要求可量产,是要装车的,无论是软件、计算平台、传感器和是执行器。这一整套系统,已经被部署到几十万辆特斯拉的车型上面,市面上截止目前,包括谷歌在内,没有一家能够做到这一点。

在中国的新故事

毫无疑问,无论基于何种原因,中国人的事业终究是会落到中国的,谷俊丽认为自动驾驶是她毕生的事业,而中国是最好的用武之地。当特斯拉的自动驾驶技术牛人和中国迅猛发展互联网造车碰撞在一起时,无疑是能够产生火花的。

小鹏汽车在这场激烈的人才争夺战中笑到了最后。谷俊丽在小鹏汽车的故事,才刚刚开始,容车评君后续为诸君书写。

2017年11月1—2日,由广东省互联网协会主办、全球未来科技大会组委会承办的“2017全球未来科技大会”在广州开幕。会上,小鹏汽车副总裁谷俊丽博士发表了《互联网汽车:人工智能与自动驾驶的创新与超越》的演讲。此次的演讲是她加入小鹏汽车后的首次对外发声。