吉姆凯勒的Anandtech采访:'Tesla的最懒惰的人'

2021-06-18 03:02:07

Warning: Can only detect less than 5000 characters

IC:少数人考虑你' Zen&#39的父亲,你觉得你会划到那个职位吗?或者应该去别人吗?

jk:也许是其中一个叔叔。禅上有很多真正的伟人。在全球范围内,SoC团队部分在奥斯汀和部分在印度的方法中,浮点缓存是在科罗拉多州完成的,核心执行前端在奥斯汀,武器前端是桑尼维尔,我们有良好的技术领导者。我在日常沟通时有一段时间沟通,苏丹涅·普拉姆和史蒂夫希莱有点建造禅宗核心的前端,以及科罗拉多队。这真的很棒的人。 Mike Clark'是一个伟大的建筑师,所以我们有很多乐趣,成功。成功有很多作者 - 失败有一个。所以这取得了成功。然后一些球队加强了 - 我们将挖掘机移动到波士顿团队,他们接管了整理设计和物质,哈利博览会和他的家伙对此做得很好。因此,我们所做的一些相当压力的组织变革,经历了这一点。团队都聚集在一起,所以我认为它有很多Camaraderie。所以我赢得了'据称是“父亲” - 我被带到了,你知道,作为煽动者和首席推进,但架构师部门的转型领导者。蛮好玩的。

IC:你现在在AMD工作的一切,还是还在那里,有点路线图仍然出现,你觉得你从你帮助宣传的想法中思考吗?

JK:所以当你建造一台新电脑时,Zen是一台新电脑时,还在进行工作。你基本上建立了一个路线图,所以我正在考虑芯片后的五年来做些什么。当我们在苹果建造第一个大核心时,我们也在苹果中做到了这一点 - 我们建造了大骨头[进入设计]。当您更快地进行计算机时,有两种方法可以做到这一点 - 你使基本结构更大,或者你的调整功能,禅有一个大结构。然后几代人遵循了明显的事情要做。他们一直在关注这一点。

所以在某些时候,他们将不得不做另一个大写和改变。我不知道他们是否开始了。我们为建筑绩效改进计划的计划是相当大的,几年来,他们似乎正在做出很大的工作。但是我已经离开了一段时间了一段时间 - 现在四到五年。

IC:是的,我认为他们说Zen 3,最后一个刚出来的是重写。所以我认为有些人在思考仍然在你的方向之下。

JK:是的,它很难说'即使我们做了禅宗,我们也从头开始设计了 - 顶部的清洁设计。但是当他们建造它时,有一堆来自推土机的RTL和捷豹,这是完全良好的使用。他们刚刚被修改并内置于新的禅宗结构中。所以硬件家伙在使用代码时非常擅长'好。

所以当他们说他们做了一个大写的时候,他们可能拿了一些碎片并在顶部重新归档它们,但是当他们建立代码时,它会在代码的20%和80%之间给我一个惊喜。是相同的东西,还是温和地修改,但是那个'非常正常。关键是要获得结构权,然后根据需要重复使用代码,而不是采取' s复杂,试图调整它以某个地方的东西。所以,如果他们做了重写,他们可能会修复结构。

IC:我知道它仍然是新鲜的,所以我不确定你还在的内容是什么样的,但你在英特尔的工作 - 这是一个干净的石板?你能详细介绍你在那里做了什么吗?

JK:我不能说太多,显然。我曾在硅工程集团的高级副总裁,该团队为10,000人。他们做了这么多不同的东西,它'只是惊人。这是60或70个SOC的东西是一次飞行,从字面上从设计到原型,调试和生产中。因此,这是一个相当多样的群体,我的员工是副总裁和高级研究员,所以这是一个大型组织的事情。

我以为我要去那里,因为有一堆新技术来建立。我花了大部分时间与团队合作有关组织和方法的转型,如新的CAD工具,新方法,建立芯片的新方法。在我加入之前,他们开始了' s称为建筑筹码的SoC IP视图,与英特尔' S历史的整体视图。这是诚实的不是,因为他们拿了整体筹码,他们拿走了伟大的客户和服务器零件,只需将其打入碎片。你可以' t只是将它分成碎片 - 你必须实际重建这些碎片,一些方法与它一起使用。

我们发现了一群人[内部]谁真的很兴奋地努力工作,我也花了很多时间对知识产权质量,IP密度,图书馆,表征,过程技术。你叫它,我在上面。我的日子有点狂野 - 有些日子我有一天有14个不同的含义。它只是点击,单击,单击,点击,如此多的事情正在进行中。

JK:我不在技术上完成任何事情!我被告知我是高级副总裁 - 它' S评估,设置方向,做出判断电话,或者让我们说尝试一些组织变革,或者人们改变。这是一段时间后加起来。知道,到达某个地方的关键是要知道你要去哪里,然后把一个组织放在适当的地方,知道如何做到这一点 - 这需要很多工作。所以我在写了很多代码,但我确实发送了很多短信。

IC:现在英特尔在帕特盖林格拥有一个新的工程专注的首席执行官。如果正确的机会提出来,你会考虑回来吗?

JK:我不知道。我现在有一个非常有趣的工作,在一个非常爆炸的增长市场中。所以我祝愿他是最好的。我认为这是一个很好的选择[拍名首席执行官],我希望它''我们' ll看到会发生什么。他肯定关心英特尔的很多关于英特尔的很多,他曾经有过真正的成功。他肯定会给公司带来更多的技术焦点。但我喜欢和鲍勃天鹅一起工作,所以我们'请看看会发生什么。

IC:您现在是来自AMD的几家公司,在一家名为Tonstorrent的公司,在Ljubisa Bajic的一位老朋友。您已从公司跳到公司到公司,基本上是您的整个职业生涯。你总是找到另一个项目,另一个机会,另一个角度。不要太傻了,但是要成为一个永远的家吗?

JK:首先,我是数字(DEC)15年,对吧!现在,这是一个不同的职业生涯,因为我在中档集团中,我们建造了ECL的电脑 - 这些是冰箱大小的盒子。我在DEC Alpha团队中,我们构建了小微处理器,小小的东西,当时我们认为是巨大的。这些是50瓦的300平方米,吹过每个人和#39;

所以我在那里有一段时间,我在互联网上匆匆去了AMD,我们在几年内完成了一大堆的东西。我们开始Opteron,HyperTransport,2P服务器 - 它是一个旋风的地方。但我被吸入或陷入互联网的热情,我去了Sibyte,由Broadcom买了一下,我总共有四年。我们提供了几代产品。

然后我在P.A Semi上,我们提供了一个很棒的产品,但他们真的想出于某种原因销售产品,或者他们认为他们会把它卖给苹果。我实际上去了苹果,然后苹果买了p.a半,然后我为那支球队工作,所以你知道我在p.a半和苹果之间。那是七年的,所以我没有真的觉得这太跳了太多了。

然后我觉得我猜到了AMD,这很有趣。然后我去了Tesla,我们提供硬件3(Tesla Autopilot)。所以那种有点象征。从站立开始在18个月开车 - 我不想以前曾经做过,并且该产品真的成功地发货了。他们去年建立了一百万。特斯拉和英特尔是一种不同种类的旋风,所以你可以说我跳进去了。我肯定有很多乐趣。

所以是的,我一直在左右。我喜欢认为我主要完成我所开放的事情。我的成功就在提供持久价值的产品方面非常高。我不是那家伙在生产中调整的人 - 它是一张干净的纸张或完整的灾难。这似乎是我最好的事情。它'很高兴知道自己 - 我不是运营经理。所以tonstorrent更加清晰的纸张。 AI空间正在爆炸。公司本身已经多年了,但我们'重新建立新一代零件,并开始上市并开始销售东西。我CTO和总统,在公司有很大的股份,在经济上以及对我的朋友的承诺,所以我计划在这里待一段时间。

IC:我觉得你在超越了矩阵之外,你最终得到了大规模的图形结构,特别是对于AI和ML,以及关于Tenstorrent的整点,它是一个图编译器和图形计算引擎,不仅仅是一个简单矩阵乘以。

JK:来自旧数学,我不是一个数学家,所以数学家会畏缩一点,但是有标量数学,像A = B + C X D.当你有少量晶体管时,你可以做的数学数学。现在我们有更多的晶体管,你可以说'我可以做那些'的矢量',就像一步中正确的等式一样。然后我们有更多的晶体管,我们可以乘以矩阵。然后,随着我们获得更多晶体管,您希望拍摄那些大型操作并打破它们,因为如果您使矩阵乘数太大,则刚刚跨越单位的力量是浪费能量。

所以你发现你想建立这个最优大小的块,这不是太小的,就像GPU中的一个线程,但它并不太大,就像用一个矩阵乘数覆盖整个芯片一样。这将是一个非常愚蠢的观点。所以那么你得到这个中等大小的处理器数组,其中介质是四个顶部。这对我来说仍然很兴奋,因为我记得那是一个非常大的数字。一旦你打破了那个,现在你必须采取大型操作并将它们映射到处理器数组,AI看起来像是非常大的操作图。它仍然是一个图表,然后将大型操作陷入较小的图形。现在,您必须在具有许多处理器的芯片上铺设出来,并围绕它流动。

这是一种非常不同的计算,而不是运行向量或矩阵程序。所以我们有时称为标量矢量矩阵。 Raja曾经调用它空间计算,这可能是一个更好的词。

IC:与Tensix Cores一起,Tenstorrent还在向下一代中添加向量发动机进入您的核心?这是如何适合的?

JK:记住它们上有向量引擎的通用CPU - 事实证明,当你运行AI程序时,您只需要有一些通用计算。在图中还有一些时间,您希望在AI操作的结果上运行C程序,因此将计算重紧耦合,因此很好。 [通过保持]它在同一芯片上,延迟超低,并且来回到来的电源是合理的。所以是的,我们'重新研究一个有趣的路线图。这是一个小型计算机架构研究领域,如,与加速计算和总用途计算的合适混合,人们如何使用它。那么如何在程序员实际使用它的方式建立它?那个'诀窍,我们'重申。

IC:如果我经历了你的职业生涯,你已经在高性能计算和低功耗的有效计算之间消失了。现在你是AI加速的世界。它有无聊吗?

JK:没有,它真的很奇怪!它变化了它和#39;它的变化了这么多,但在某种程度上它并没有改变。底部的计算机,他们只是在一起添加一个和零。它&#39很容易。 011011100,它并不复杂。

但我在VAX 8800上工作,在那里我们在每个芯片中的门阵列中建立出来的门阵列。像200,吧?现在,在Tenstorrent,我们的小型计算机,我们称他们的Tensix核心,每秒每秒四万亿,并且在芯片中有四个数量。因此,构建块已从200个门转移到四个Tera OPS。那种狂放的转型。

然后工具比以前更好。您现在可以做些什么 - 您可以'除非抽象级别的变化和工具更改,否则构建更复杂的东西。这类东西有很多变化。当我还是个孩子的时候,我曾经认为我必须自己做一切 - 而且我像疯子一样工作并一直编码。现在我知道如何与人和组织合作并倾听。类似的东西。人际交往能力。我可能会对人们的技能有一个漂亮的不均衡的记分卡!我有几个。

IC:你会说工程师这些天需要更多的人技能吗?因为一切都很复杂,一切都有单独的抽象层,如果你想在他们之间工作,你必须让基本面下降。

JK:现在这是基本的真理,人们逃离了。聪明。所以人们可以在越来越多的事情上继续工作 - 这只是愚蠢的。但是您必须建立支持人员的工具和组织和组织能力做复杂的东西。 vax 8800队是150人。但是在苹果公司建立了第一或第二个处理器的团队,这是第一个大型定制核心,是150人。现在,CAD工具令人难以置信的更好,我们使用1000台电脑来做模拟,而我们有能够放置的工具和200万盖茨与200。所以有些东西发生了根本性的变化,但工程师可能会谈论的人数在给定的一天中,没有改变&#39。如果你有一个工程师每天谈论超过五个人,他们会失去他们的思想。所以,有些事情真的是不变的。

IC:您已经谈过过去的CPU指令集,以及我对此面试的最大请求之一是关于CPU指令集的看法。特别是关于我们如何处理它们的基本限制的问题,我们如何枢转到更好的问题,以及游戏中的皮肤在ARM与X86与RISC V而言。我觉得大多数计算发生在几十个OP-CODES上。我记得泰吗

......