版权声明 来源:AI深度研究院(AIshenduyanjiuyuan),书享界(readsharecn) 对话嘉宾:黄仁勋,NVIDIA公司创始人兼首席执行官 Arthur Mensch,Mistral联合创始人兼CEO
在AI技术飞速发展的今天,企业界弥漫着一种焦虑——害怕错过AI带来的变革浪潮。尤其是在DeepSeek等国产大模型取得突破后,企业纷纷加速AI技术的应用落地。然而,摆在企业面前的问题却越来越复杂:是选择通用大模型还是垂直大模型?应该自主可控还是外包服务?如何在技术与业务之间找到最佳平衡点?在对话中,黄仁勋明确指出:”你的企业的数字智能不太可能是一个你想不加考虑就外包给第三方的东西。”他将AI比作企业的”数字劳动力”,强调企业需要思考这种数字劳动力是想要外包,还是希望参与、控制和培养的东西。
在黄仁勋看来,企业的AI战略应遵循”通用-行业-企业”三层专业化路径。未来的数字劳动力中,会有适用于基本任务的通用数字工人,但企业同样需要行业特定的AI工具和高度定制化的企业专属AI能力。
Arthur Mensch补充道:”AI是文化基础设施,它确保你的文化和人类专业知识融入AI系统中。”他强调企业需要平台来定制AI模型,使其能更好地理解企业特定的语言和规则。
以下是对话文稿处理。
1
AI作为通用技术
主持人:今天我们讨论的是主权AI、国家基础设施以及开源等话题。首先,我想问一个国家领导人经常问我的问题:AI是否真的是一种通用技术?在人类历史上,我们可能只有少数几次这样的技术进步,比如电力和印刷术,它们广泛地加速了社会的经济进步。现在大家都在问,AI是否也应该这样看待,还是说AI只是另一种重要但最终狭窄的技术?
Arthur Mensch(Mistral CEO):AI确实是一种通用技术,因为它彻底改变了我们构建软件和使用机器的方式。就像互联网是一种通用技术一样,AI也是如此。它可以构建代理来代表你做事,因此可以在任何行业垂直领域使用,包括公共服务、农业,当然还有国防。它涵盖了一个国家需要关心的所有方面,因此国家或者公司自然会将其作为优先事项,并制定专门的AI战略。
黄仁勋(英伟达CEO):Arthur说的一切都完全正确,但这也正是大家放弃的原因,而且是完全错误的。原因在于,如果AI是一种通用技术,而一家公司可以构建终极的通用技术,那么其他人为什么要费心去做呢?这是个缺陷,也是一个心理陷阱,让人认为AI是一种少数人应该去构建的技术,而其他人应该坐等。我建议每个人都参与AI的发展,这不是特权阶层的专利。智能应该属于每个人,不仅仅是世界上的少数公司,每个人都应该参与构建。没有人比瑞典更关心瑞典的文化、语言和生态系统,没有人比沙特阿拉伯更关心沙特的生态系统,没有人比以色列更关心以色列。尽管技术是通用的,但它也是高度专业化的。例如,我不认为我在等待一个通用的聊天机器人来成为某个疾病领域的专家,我更希望有一个在该领域高度专业化的人来微调和训练AI模型,使其专门化。
主持人:与历史上的通用技术浪潮如电力或印刷术相比,这一次有什么不同?如果我是一个国家领导人,我应该如何思考AI在我的国家中的正确框架?我应该将其视为数字劳动力吗?
Arthur Mensch:AI类似于电力,它将对每个国家的GDP产生双位数的影响。这意味着从经济角度来看,每个国家都需要关注它,因为如果他们不能在正确的地方建立自己的主权能力,这意味着钱可能会流向其他国家,改变全球经济平衡。100年前,如果你不建电力工厂,你就得从邻国购买,这会造成依赖。我认为AI在这一点上与电力相似。不同之处在于,AI是一种无定形的技术,如果你想用它来创建数字劳动力,你需要塑造它,你需要基础设施、人才和软件。人才需要在本地培养,因为AI是一种内容生产技术,它会与社会互动,成为一种社会建构,承载企业或国家的价值观。如果你不希望这些价值观消失或依赖于中央提供商,你需要更深入地参与AI,而不仅仅是像电力那样。
黄仁勋:有几种思考方式。你的国家的数字智能不太可能是一个你想不加考虑就外包给第三方的东西。数字智能现在是你的新基础设施层,包括电信、医疗、教育、公路、电力等。现在有了一个新层——数字智能。你有责任决定你希望这个数字智能如何发展,是否要外包,让你再也不用担心智能问题,或者你觉得这是你想要参与、甚至控制和塑造的东西。当然,它有Arthur提到的所有东西,如AI工厂、基础设施等。另一种思考方式是你的数字劳动力。你必须决定你的国家或公司的数字劳动力是你决定外包的,希望它按你的意愿发展,还是你想要参与、甚至控制和培养的东西。我们经常雇佣通用员工,有些比其他人更通用,有些更聪明,但一旦他们成为我们的员工,我们决定培训他们、设置护栏、评估他们、持续改进他们。我们投资使通用智能成为我们可以受益的超级智能。我认为这两种思考方式——数字基础设施和数字劳动力——都对国家经济、社会进步和文化有贡献。国家需要在这方面发挥非常积极的作用。
Arthur Mensch:你需要一个平台来定制AI模型,将国家图书馆的知识融入其中,使AI系统能更好地讲你的语言,了解你的法律。这样,在部署AI软件时,设置的护栏就符合你之前所做的一切。这个平台需要定制、评估,并在发现问题时进行修复和调试。这就是我们正在构建的平台。一旦定制系统完成,重要的是能够自己维护它们,这意味着在自己的基础设施上部署它们,并可能要求技术伙伴退出循环。
黄仁勋:你的IT部门将成为数字劳动力的HR部门,他们将使用Arthur描述的工具来培训AI、微调AI、设置护栏、评估它们、持续改进它们。这个飞轮将由现代版的IT部门管理。我们将有生物劳动力,也有数字劳动力,这很棒。没有人会为你做这件事,你必须自己做。这就是为什么尽管世界上有这么多技术公司,每个公司仍然有自己的IT部门。我有自己的IT部门,我不会外包给别人。未来,这将变得更加重要,因为他们将帮助我们管理这些数字劳动力。每个国家、每个公司都将这样做。Arthur描述的空间——将通用技术微调成领域专家、国家专家、行业专家或公司专家——是AI的巨大未来空间。
2
AI作为文化基础设施
主持人:你们都提到了一个我想要确认的观点:AI不仅是计算基础设施,还是文化基础设施。Arthur,你说AI是一种文化基础设施,黄仁勋,你说国家的数字数据属于国家自己。你们是在说AI不仅是技术,还承载了文化和价值观?
Arthur Mensch: 是的,AI是文化基础设施,它确保你的文化和人类专业知识融入AI系统中。文化、反思、价值观——我们刚才讨论了每个AI模型和服务如何根据你提出的问题类型做出不同的反应,因为它们将服务或公司的价值观编入其中。想象一下,这种情况在国际范围内被放大。作为一个国家或企业,你不能外包这一点,你需要拥有它。
黄仁勋:如果AI是文化基础设施,而我不拥有它的主权,那么风险就相当于现代数字殖民化。你必须考虑AI几乎像是你的数字劳动力,如果另一个国家或不是我主权国家的人可以决定我的劳动力能做什么和不能做什么,那就是个问题。有些是通用的,例如,某些公司可以为全球的国家和社会提供服务,因为它们基本上是通用的。但它不能是唯一的社交结构、唯一的数字智能层,它必须由区域性事物增强。你知道,麦当劳、肯德基、星巴克在全球都很好,但你仍然想要当地的风格、口味,增强其上。当地的咖啡馆、夫妻店餐厅定义了文化、社会和我们自己。我认为全球有沃尔玛很好,但你需要当地的口味、风格、偏好、卓越和服务。很可能在未来的数字劳动力中,我们会有一些通用的数字工人,他们擅长做基本研究或一些基本任务,对于每个公司都有用,不需要我创建新的东西。Excel、Microsoft Office是普遍优秀的,我完全满意。然后有行业特定的工具和专业知识,例如我们使用Synopsys和Cadence,黄仁勋不需要因为这是我们行业的特定工具。我们都可能使用Excel、PDF、浏览器等通用东西。同样,会有通用的数字工人,我们可以利用,然后有行业特定的,然后有公司特定的。在我们公司内部,我们有一些对我们非常重要的特殊技能,定义了我们,如果愿意的话,是高度偏向的。它们偏向于做我需要它们做的事情,非常受保护,高度偏向于我们公司的需求和专长。我们在这些领域变得超级人性化。你的数字劳动力也将是如此,AI也将是如此。有些你可以直接使用,比如新的搜索可能是某种AI,新的研究可能是某种AI,但然后会有行业版本的AI,我们可能从Cadence等公司获得,然后我们必须使用Arthur的工具来培养它们,微调它们,培训它们,使它们变得出色。
Arthur Mensch:我非常同意这种愿景:有一个通用模型,然后是行业专业化层,再是公司和国家的专业化层。你将有一个越来越专业化的AI系统树。举个具体的例子,我们在1月份发布了一个名为Mistral Small的通用模型,它可以处理所有语言,了解大多数事物。但然后我们开始了一个新的专业化模型系列,专门针对语言。我们采用了更多阿拉伯语和印度语的语言,重新训练模型,提炼了初始模型未见过的额外知识。这样做后,模型在阿拉伯语和印度半岛语言的惯用表达上表现得更好。对于给定大小的模型,如果你选择专业化它在某种语言上的表现,它会变得更好。今天,我们的24b模型M Saaba在阿拉伯语上优于其他五倍大的语言模型,原因是我们进行了专业化。这是第一层,然后你可以考虑第二层,比如垂直领域。如果你想构建一个不仅擅长阿拉伯语,还擅长处理沙特阿拉伯法律案件的模型,你需要再次专业化。这需要与公司合作,确保你的系统不仅擅长某种语言,还擅长理解该语言中的法律工作。这适用于你能想到的任何垂直领域和语言的组合。例如,你想要一个法语的医疗诊断助手,你需要擅长法语,还需要理解医生的法语语言。作为通用模型提供商,很难做到这一点。
3
数字劳动力与国家主权
主持人:如果这是真的,我需要定制AI层以适应我的本地规范和数据的能力,这在技术上相当复杂,我该如何建议一个大国思考这个问题?我们谈论的堆栈包括芯片、计算、数据中心、模型、应用程序,最终是AI护士或AI医生。对于一个小国,我该如何建议他们?
Arthur Mensch:我认为你需要拥有水平层面的堆栈,你需要购买和建立基础设施、推理原语、定制原语、观察能力、将GS连接到模型、将模型连接到实时信息源的能力。这些是跨不同国家和企业相当好地分解的原语。一旦你有了这些,你就可以开始工作,根据你的价值观、专业知识和本地人才来构建。你需要确定什么是水平层面的,你应该购买,什么是垂直层面的,你需要自己构建。
黄仁勋:你必须认识到,这并不像你想象的那么难。首先,技术正在变得更好。想象一下5年前做这件事是不可能的,5年后会变得微不足道。我们正处于中间阶段。唯一的问题是你是否需要做这件事。事实是,我讨厌培训员工,因为这需要很多工作,但一旦你建立了HR组织和领导力指导组织以及流程,培训员工就会变得更容易,对每个人都更愉快。但在最开始总是很难的。这没有什么不同。唯一的问题是你是否需要做这件事。如果你想成为未来的一部分,而这是有史以来最重要的技术,数字智能,还有什么比这更重要?如果你得出结论这对你很重要,那么你必须尽早参与,边学边做,并且知道它会变得越来越容易。事实上,如果我们试图在三年前做代理系统,那是非常困难的,但今天代理系统容易多了, curation 数据集、培训数字员工、评估员工、设置护栏的所有工具都在不断改进。技术的另一个特点是,当它变得更快时,它就更容易。回想计算机的早期,性能非常慢,一切都很困难,但现在我们做的事情是神奇的,因为它也很快。无论是出于机构需求参与有史以来最重要的技术,还是因为它一直在变得更好,所以并不那么难,我认为借口越来越少了。
主持人:变化是困难的。如果我是一个国家领导人,我面临着越来越多的地缘政治风险,我不知道谁是我的盟友,选举即将到来,我有很多事情要处理,但现在我明白了AI的重要性。你们花了很多时间与国家领导人交谈,他们在思考AI的风险时,最常问的问题是什么?
Arthur Mensch:我听到过几个问题,但其中一个风险是民众对AI的恐惧,认为AI会取代他们的工作。解决这个问题的方法是确保每个人都能接触到AI技术,并接受相关培训。培训民众非常重要,让他们看到AI是他们工作更好的机会,通过应用程序、他们可以在智能手机上安装的东西、公共服务来展示AI的目的。例如,我们与法国的失业系统合作,通过AI代理(由人类操作员操作)将工作机会与失业者联系起来。这是人们更好找到工作的机会,可以帮助民众理解AI的机会,AI只是他们需要采用的新变化,就像90年代采用个人计算机和2000年代采用互联网一样。国家可能面临的最大问题是AI加剧数字鸿沟,但如果我们合作,以正确的方式做,我们可以确保AI实际上减少数字鸿沟。
黄仁勋:AI是编程计算机的新方式,因为通过输入一些单词,你可以让计算机做某事,就像过去一样。现在你可以用自然语言与它交谈,你可以以多种方式与它互动,让计算机为你做事情比以前容易得多。能够使用ChatGPT做有生产力事情的人数远远大于能够编程C++的人数,因此我们缩小了技术鸿沟,这是迄今为止最伟大的平等器。但你仍然需要让民众了解它。我只是在描述一个事实:今天使用ChatGPT编程计算机的人数比使用C++编程的人数多,这是一个事实。在短短三年内,这是一个直接的事实。AI是世界上已知的最伟大的缩小技术鸿沟的力量。人们意识到AI的惊人能力以及它如何帮助他们的工作。我每天都使用它,今天早上我还使用了它。Arthur和世界各地的计算机科学家所做的工作是令人难以置信的,人们知道这一点,人们正在采用它。
4
开源模型的重要性
主持人:让我们谈谈开源模型,因为你们都公开讨论过开源模型在主权AI中的重要性。Arthur,你在DeepMind参与了公开的Chinchilla缩放定律,你们的联合创始人创造了LLaMA,去年Nvidia和Mistral合作训练了一个模型Mistral Nemo。为什么开源模型对你们如此重要?
Arthur Mensch:因为AI是一种水平技术,企业和国家最终会希望在自己的基础设施上部署它,从主权角度来看,开源很重要。这是第一点。第二点是,发布开源模型是加速技术进步的一种方式。我们创建Mistral的初衷是,在2010年至2020年期间,我们在AI领域看到了进步的加速,因为每个实验室都在彼此的基础上构建。但随着OpenAI等公司发布大型语言模型,这种开放的飞轮消失了。重新启动这个开放的飞轮——我贡献一些东西,然后另一个实验室贡献其他东西——是我们创建Mistral的原因。我们做得很好,因为我们开始发布模型,然后Meta也开始发布模型,中国公司如DeepSeek也发布了更强大的模型,每个人都从中受益。关于Mistral Nemo,创建开源AI模型的困难在于,这更像是一个大教堂而非集市的环境,因为构建模型需要大量资源。我们与Nvidia团队合作,混合两个团队,让他们在相同的基础设施和代码上工作,解决相同的问题,结合他们的专业知识来构建相同的模型。这非常成功,因为Nvidia带来了我们不知道的东西,我们也带来了Nvidia不知道的东西,最终我们生产出了当时同等大小的最佳模型。我们非常相信这种合作,认为我们应该在更大规模上进行,不仅仅是两家公司,而是三四家公司合作。这是开源将占上风的方式。
黄仁勋:我完全同意,开源的好处除了加速和提升基础科学和通用模型的基本努力外,还激活了许多利基市场和创新。医疗、生命科学、物理科学、机器人、交通等领域因开源能力而被激活。不要忽视开源在边缘和任务关键型领域的惊人能力。例如,在采矿、能源等领域,开源激活了每一个领域,金融服务、医疗、国防等。任何任务关键型且需要自己部署的领域,都需要强大的审计和彻底评估能力。如果你能访问权重,你可以更好地评估模型,而不是只访问API。如果你想确保你的系统100%准确,我认为你不应该使用闭源模型。你必须将其连接到你的飞轮中,将本地数据和经验融入其中,使用得越多,它就变得越好。没有开源,你无法做到这一点。
5
安全与开源
主持人:如果我是一个国家领导人,我听说开源是对国家安全的威胁,我们不应该出口我们的模型,因为这些开放模型实际上泄露了国家机密,或者更重要的是,坏人可以使用这些开放模型,这对安全构成威胁。相反,我们应该将开发限制在两三个有基础设施的实验室中,他们可以从政府获得许可,进行训练,进行正确的安全和认证。我该如何思考这个问题?
Arthur Mensch:如果一个国家决定封锁,其他国家将接管领导地位,因为切断自己与开放飞轮的联系,代价太高,无法保持竞争力。这种辩论在美国发生过,实际上,如果对权重实施出口管制,这不会阻止欧洲或亚洲的任何国家继续进步。他们将合作加速进步。我们需要接受AI是一种水平技术,类似于编程语言,编程语言都是开源的。AI也需要开源。上周的AI峰会上,这是一个议程,人们意识到通过更开放地构建技术,我们可以一起加速。开源有很多好日子在前头。
黄仁勋:控制软件是不可能的,如果你想控制它,其他人会崛起并成为标准。问题是开源是否更安全?开源使更多研究人员能够审查和改进技术。这就是为什么每个云服务提供商都建立在开源基础设施上,因为它是最安全的技术。开源的好处是许多人的贡献和审查。你不能在开源中放任何随机的东西,你必须放好的东西,因为审查很严格。开源提供了加速创新、提升卓越、确保透明、吸引审查的所有好处,所有这些都提高了安全性。你说得对,部分原因是,正如我们在开源数据库、存储、网络、计算中看到的那样,你可以进行大规模的红队测试,全世界都可以帮助红队你的技术,而不是仅仅依赖公司内部的一小群研究人员。通过将许多组织聚集在一起,共同开发他们都可以使用的技术,并在自己的领域进行专业化,你迫使技术对每个人都有用,从而消除偏见,确保你构建的通用模型尽可能好。开源在这一点上也是减少失败点的一种方式。如果我今天决定完全依赖一个组织及其安全原则和红队组织,我有点过于信任它。而如果我基于开源模型构建我的技术,我信任世界来确保我构建的基础是安全的。作为企业或国家,你需要这样做。
6
公司建设与组织结构
主持人:我们现在要转向公司建设,这是很多人期待听到的。首先,黄仁勋,你曾说Nvidia是世界上最小的巨头公司,是什么让你能够以这种方式运营?
黄仁勋:我们的架构设计有几个目的。它被设计成在变化的世界中适应良好,无论是我们引起的还是影响我们的。技术变化很快,如果你过度控制,你会削弱系统的敏捷性和适应能力。我们的公司使用“对齐”而不是“控制”这样的词。我不记得我曾经用过“控制”这个词来谈论公司的运作方式。我们关心最小化官僚主义,尽可能轻量化流程。所有这些都是为了提高效率和敏捷性。我们避免使用“部门”这样的词,当Nvidia刚成立时,谈论部门是很时髦的,但我讨厌“部门”这个词,因为它从根本上意味着分裂。我也讨厌“业务单元”这个词,因为为什么每个人都应该作为一个单元存在?为什么不尽可能利用公司的资源?我想建立一个像计算机一样的组织,尽可能高效地交付输出。公司的组织有点像计算堆栈。我们在尝试创建什么机制,我们在什么样的环境中生存?是和平的乡村还是混凝土丛林?你想创建的系统类型应该与环境一致。让我感到奇怪的是,每个公司的组织结构看起来都非常相似,但它们都是不同的事物。一个是蛇,另一个是大象,另一个是猎豹,每个在森林中应该是有些不同的,但不知何故,它们都有完全相同的结构和组织,这对我来说没有意义。
Arthur Mensch:我同意公司有个性,尽管有时它们的组织方式相似。我应该说,我们还有很多东西要学,Mistral还不到两岁。我们和我们的竞争对手面临的挑战是,这是软件公司第一次成为由科学驱动的深度技术公司。科学与软件有不同的时间尺度。你需要在每月的基础上运作,有时你不知道东西什么时候准备好,但另一方面,你有客户在问下一个模型什么时候出来,这个功能什么时候可用等。你需要管理期望,我认为我们开始在这方面做得很好,管理产品需求和科学能力之间的衔接。你不希望研究团队完全致力于让产品工作,你需要让他们研究为什么产品在某些领域销售不佳,以及如何通过研究、新的数据、新的架构、新的范式来修复它。我认为这是相当新的,这不是你在典型的SaaS公司中会发现的,因为这本质上是一个科学问题。
黄仁勋:Nvidia是成功地在30多年的时间里保持科学和研究领先于世界其他地方的公司之一,无论是2012年的CUDA,那是基础系统研究,还是今天的Cosmos,它是关于模拟如何工作的最先进技术。我们在公司内部协调了Arthur刚才所说的:我们有基础研究、应用研究、架构和开发,多个层面,每个层面都有自己的时间节奏。在基础研究的情况下,频率可能相当低,而在产品方面,我们有整个行业的客户依赖我们,所以我们必须非常精确。在基础研究和发现惊喜之间,以及能够可预测地交付每个人期望的东西,这两个极端在我们公司内部和谐地管理。
主持人:在这个市场中有很多令人着迷的事情,但有一个特别的我想指出来:你们都有既是客户又是竞争对手的公司。Nvidia向AWS销售GPU,而AWS正在开发自己的芯片Trainium;Arthur,你在通过AWS和Azure销售训练模型,而他们资助了像Anthropic和OpenAI这样的实验室。你们如何在这样的环境中获胜?你们如何管理这些关系?
黄仁勋:你必须有自己的位置。显然,这些云服务提供商与Arthur合作,不是因为他们已经有相同的东西,他们只是想要两个相同的东西,而是因为Arthur和Mistral在世界上有独特的地位,他们在特定领域增加了价值。我们今天讨论的很多内容都是Mistral的工作和他们在世界上的地位使他们独一无二的地方。我们是不同的,我们不仅仅是另一个ASIC,我们可以为CSP做他们自己无法做的事情。例如,Nvidia的架构在每个云中都有应用,在很多方面,我们为未来的初创公司提供了第一个培训平台。原因是,通过培训到Nvidia,他们不必对主要云做出战略或业务承诺,他们可以进入每个云,甚至可以决定构建自己的系统,如果经济上对他们更好,或者他们想访问我们在云内更受保护的能力。无论原因是什么,要成为一个好的合作伙伴,你仍然需要有独特的地位,你需要有独特的提供。我认为Mistral有非常独特的提供,我们有非常独特的提供,我们在世界上的地位对我们竞争对手也很重要。当我们对此感到舒适,感到自在时,我们可以成为所有CSP的优秀合作伙伴,我们希望看到他们成功。我知道这听起来很奇怪,当你把他们视为竞争对手时,这就是为什么我们不把他们视为竞争对手,我们把他们视为合作者,他们也与我们竞争。也许我们为所有CSP做的最重要的事情是为他们带来业务。这就是一个伟大的计算平台所做的,我们为人们带来业务。
Arthur Mensch:黄仁勋说得好,你放弃控制,但你致力于对齐,尽管有时你有竞争对手,你可能有共同的利益,你可以致力于共享的特定议程。
主持人:我记得Arthur和我第一次见面时,我们在伦敦的一家深夜餐厅坐下来,草拟了他的A轮融资计划,我们在想他为什么需要那么多资金,事后看来,这是非常高效的。Mistral的A轮融资是我们筹集的5亿美元,相对于其他需要花费数十亿美元才能达到相同水平的人来说,我问他,你想在哪些芯片上运行?我甚至不认为你荒谬地看着我,好像我问了一个除了Nvidia H100s之外还能有什么答案的问题。我认为Nvidia投资的初创公司生态系统为云创造了如此多的业务。是什么哲学让你如此深入地投资于初创公司和创始人,甚至在他们被任何人知道之前?
黄仁勋:有两个原因。首先,我很少称我们为GPU公司,我们制造的是GPU,但我认为Nvidia是一家计算公司。如果你是一家计算公司,你最重要的事情是开发人员。如果你是一家芯片公司,你最重要的事情是芯片。我们的所有战略、行动、优先事项、重点、投资100%都与开发人员优先的态度一致。另一个说法是生态系统优先。GTC是一个开发者大会,我们公司内部的所有倡议都是开发者优先的。第二个原因是,我们正在开创一种新的计算方法,这种加速计算方法对通用计算世界来说是非常陌生的,因此我们不断寻找下一个不可思议的突破,下一个没有加速计算就无法做到的事情。很自然地,我会找到并寻找像Arthur这样的伟大思想家,因为我在寻找下一个杀手级应用。这是创造新事物的人的自然直觉和本能。如果有一个了不起的计算机科学思想家我们没有接触到,那是我不好,我们必须赶紧。
7
计算的未来趋势
主持人:从计算的角度来看,你看到了地平线上最重要的趋势是什么?特别是对于可能领导世界上增长最快市场的总理、总统或IT部长的人,你会如何指导他们了解计算的走向?
Arthur Mensch:我们正在转向越来越异步的工作负载,你给AI系统一个任务,然后等待它进行20分钟的研究后再返回。这肯定会改变你看待基础设施的方式,因为这会创造更多的负载。我想这对数据中心和Nvidia来说是个好消息。正如我在本集开始时所说,如果没有正确的代理培训基础设施,如果AI系统没有适当的方式来了解他们与之互动的人并从中学习,所有这些都不会发生好。从人类互动中学习将变得非常重要。另一个方面是个性化,让模型和系统巩固他们对用户的表征,尽可能有用。我认为我们处于早期阶段,但这将再次深刻地改变我们与机器的互动,它们将更多地了解我们,了解我们的品味,以及如何对我们最有用。作为一个国家的领导人,我会思考教育,确保我有一个了解AI的本地人才库,足以创建专业的AI系统。我会思考基础设施,不仅是物理方面,还有软件方面。什么是正确的原语,什么是正确的合作伙伴,将为你提供培训平台。如果你有这些,你有人才,如果你进行深度合作,你国家的经济将深刻地改变。
黄仁勋:过去10年,我们看到了计算的非凡变化,从手工编码到机器学习,从CPU到GPU,从软件到AI。整个堆栈、整个行业都被彻底改造,我们仍在经历这个过程。未来10年将令人难以置信。当然,行业一直在讨论缩放定律和预训练的重要性,现在我们有了后训练,后训练是思想实验、实践、辅导和指导,以及我们人类用来学习的所有技能。代理、代理系统和机器人系统即将到来,这非常令人兴奋。这对计算的意义非常深刻,这就是我们过去几年所做的。人们惊讶于Blackwell对Hopper的巨大飞跃,原因是我们为推理构建了Blackwell,正好赶上,因为突然间,思考是一个如此大的计算负载。这是计算层。下一层是我们将看到的AI类型,有代理AI、信息数字工人AI,但我们现在有了物理AI,取得了巨大进步,然后是物理AI,取得了巨大进步。物理AI当然是遵守物理定律、原子定律、化学定律的AI,各种物理科学将看到一些重大突破,我对此非常兴奋。这影响工业、科学、高等教育和研究。然后是物理AI,理解物理世界的本质,从摩擦到惯性、因果关系、物体永久性等人类有常识但大多数AI没有的基本事物。我认为这将使许多机器人系统成为可能,对制造业和其他领域有重大影响。美国经济非常依赖知识工作者,而许多其他国家非常依赖制造业。对于许多国家的领导人来说,意识到他们需要AI来改造和革新对他们至关重要的产业,无论是能源还是制造业,这就在眼前,他们应该保持警觉。我鼓励人们不要过度崇拜技术,有时当你过度崇拜技术时,你最终不会参与它,你会害怕它。不要这样,今天我们所说的AI缩小技术鸿沟的事情真的应该被认识到。这是国家利益的巨大利益,你有责任参与。
主持人: 非常激动人心的时刻。非常感谢你们抽出时间。如果他们想了解更多,想知道如何与你们的公司合作?


书享界保留所有权 |书享界 » 对话黄仁勋:企业如何部署AI技术?