NVIDIA黄仁勋与他的智能工业革命-白红宇

NVIDIA联合创始人兼CEO黄仁勋先生在本文中讨论了人工智能不久的将来、人工智能对产业的影响，以及企业如何抓住人工智能的商业机会。下面就让我们来了解下大咖的看法。

过去6周内，我们一直在世界各地接连召开NVIDIA开发者大会。GPU技术大会(GTC)始办于2009年，旨在培育使用大规模并行处理GPU实现高性能计算的新方法。GTC逐渐成为GPU深度学习的中心——引发现代人工智能大爆炸的新计算模式。

显而易见，人工智能正在呈现出星火燎原之势。仅过去2年间，GPU深度学习开发者数量即激增25倍之多。约1,500家人工智能初创公司顺势而起。这种爆炸性增长带动了全球对于GTC的需求。

迄今，我们已经在北京、台北、阿姆斯特丹、东京、首尔以及墨尔本举办相关活动。下周的活动将于华盛顿举办，下个月将移师孟买。我参加了其中4场GTC大会。随着人工智能变革一个又一个行业，我希望将我所谈、所了解以及所见的事情与大家分享。

新的计算时代

由人工智能计算机支持且能够学习、推理并与人互动的智能机器不再是科学幻想。今天，基于人工智能的自动驾驶汽车能够自主导航，在夜间自由穿行于乡村道路之上。人工智能机器人能够通过试错习得动作技能。这真是一个杰出的时代。在我长达30年的计算机行业生涯中，没有哪种技术比这更有潜力，或者更有趣。人工智能时代已经开启。

我们的行业推动着大规模工业与社会变革。随着计算的发展，新企业不断出现，新产品接连面世，我们的生活也因之发生变化。回顾过去几波计算，每一次均由革命性的计算模式、拓展计算能力与范围的新架构所支撑。

1995年，低成本微处理器(CPU)、标准操作系统(Windows 95)、以及信息世界新门户(Yahoo!)的结合催生出了PC-互联网时代。PC-互联网时代让大约10亿人获得了计算能力，并实现了微软“让每台办公桌和每个家庭都有一台电脑”的愿景。10年后，iPhone让“互联网通信”设备放入我们的口袋。伴随着Amazon AWS的推出，诞生了移动-云时代。大量应用进入我们的日常生活，约30亿人享受着移动计算带来的自由。

今天，我们正站在由GPU深度学习的新计算模式引发的人工智能计算时代的开端。事实证明，该新模式——其中，深度神经网络经过训练后，能够从海量数据中识别各种模式——能够“超乎寻常”有效解决计算机科学领域内的一些最复杂的问题。在该时代，软件能够自主编程，机器也具备学习能力。不久，数以千亿计的设备将被嵌入智能。人工智能将变革每一个行业。

GPU深度学习“大爆炸”

为什么是现在，就像我在此前一篇文章《利用GPU加速人工智能是一种新型计算模式》中所写的那样，2012年是人工智能标志性的一年。多伦多大学Alex Krizhevsky创建了能够从100万样本中自动学习识别图像的深度神经网络。仅在两块NVIDIA GTX 580 GPU上训练几天，“AlexNet”就赢得了当年的ImageNet竞赛，击败了磨练几十年的所有人类专家算法。同年，认识到网络规模越大、或者大脑越大，其学习能力就越强的规律之后，斯坦福的Andrew Ng与NVIDIA 研究室合作开发了一种使用大规模GPU计算系统训练网络的方法。

这引起了全球关注。世界各地的人工智能研究人员转向GPU深度学习。百度、谷歌、Facebook与微软是首批将其用于模式识别的公司。2015年，人工智能在图像识别方面实现了“超越人类”的水准。在语音识别领域，微软研究院使用GPU深度学习实现了历史里程碑，在对话语音领域获得“媲美人类””水平。

图像识别与语音识别——GPU深度学习已经为机器学习、认知、推理与解决问题奠定了基础。GPU开始成为模拟人类想象力的引擎，打造出了视频游戏与好莱坞影片的惊人虚拟世界。现在，NVIDIA的GPU运行深度学习算法，模拟人类智能，并用作能够认知与理解世界的计算机、机器人与自动驾驶汽车的大脑。就像人类想象力与智能密不可分一样，计算机图形与人工智能也在我们的架构内结合在一起。人类大脑拥有两种模式，GPU也拥有两种模式。这可能是NVIDIA GPU之所以被广泛用于深度学习的原因所在，因此NVIDIA日益被称作“人工智能计算公司”。

面向全新计算模式的端到端平台

作为一种全新的计算模式，GPU深度学习正改变着软件的开发与运行方式。过去，软件工程师构思程序与细致编码的算法。现在，算法从无数真实世界示例中自我学习–软件自我编写。编程指的是编写指令代码。深度学习指的是构建与训练神经网络。然后，该网络可部署于数据中心，对新数据进行推断、预测与分类。该网络也可部署于摄像机、汽车与机器人等智能设备中，以了解世界。根据新经验收集新数据，进一步训练与改进神经网络。通过从数十亿设备中学习，网络中的所有设备变得更加智能。神经网络将获得GPU处理能力指数级进步与大规模网络效应的双重优势–也就是说，它们将以快于摩尔定律的速度变得更加智能。

不同于“指令处理”密集型的老式计算模型，这种全新计算模型需要海量“数据处理”。为了在各方面推进人工智能，我们正在建立一个端到端人工智能计算平台——即一个跨越训练、推理和数十亿正在使用的智能设备的架构。

GPU在四年时间里提速65倍

我们先从训练开始。全新Pascal GPU的项目投资约20亿美元，是数千名工程师花费三年多时间的工作成果。作为首款经深度学习优化的图形处理器，Pascal的网络处理速度比Alex Krizhevsky在其论文中使用的Kepler图形处理器要快65倍。如果一台计算机配备八台通过NVIDIA NVLink连接的Pascal图形处理器，即可创建有史以来最高吞吐量的互连结构，其网络处理速度比250台传统服务器还要快。

每天数百亿次互联网查询很快将需要人工智能，这意味着每次查询将需要进行数十亿次的数学运算。云服务的总负载将很庞大，以确保实时响应。为了得到更快速的数据中心推理性能，我们公布了Tesla P40和P4 GPU。P40使数据中心推理吞吐量加速40倍。P4仅需要50瓦功率，旨在加快1U OCP服务的速度，这是超大规模数据中心的典型。软件是NVIDIA深度学习平台的重要组成部分。在训练方面，我们有CUDA和cuDNN。在推理方面，我们公布了一款优化推理引擎TensorRT。TensorRT通过融合一个层级和多个层级内的操作，简化低贡献权重，将精确度降至FP16或INT8，以及采用许多其他技术，从而改善性能，同时不损害准确度。

将来，数十亿个智能设备将利用深度学习来执行智能的任务。无人机将自主导航通过一个仓库，找到相关物品并捡取。便携式医疗仪器将利用人工智能，现场诊断血液样本。智能摄像机将学会只向我们警告我们关心的情况。我们已经针对此类智能物联网设备创建了一台高效能人工智能超级计算机。Jetson TX1是一个信用卡大小的模块，只用10瓦功率就可以达到1 TeraFLOP FP16性能。其架构与我们最强大的GPU相同，可以运行所有相同软件。

简而言之，我们提供一个端到端人工智能计算平台——从GPU到深度学习软件和算法，从训练系统到车载人工智能计算机，从云到数据中心到个人电脑到机器人。NVIDIA的人工智能计算平台无处不在。

针对每个行业的人工智能计算

我们的端到端平台是确保每个行业接入人工智能的第一步。NVIDIA GPU深度学习全球生态系统一直扩展迅速。突破性的成果引发了为消费者互联网服务采用人工智能的竞赛——搜索、识别、推荐、翻译等等。从阿里巴巴和亚马逊到IBM和微软的云服务提供商向大小型公司提供NVIDIA GPU深度学习平台。全球最大的企业技术公司已经基于NVIDIA GPU对服务器进行配置。我们很高兴在GTC之旅中发布改造各大行业的战略部署：

人工智能交通：交通是人工智能可以改造的10万亿美元大型行业。自主汽车可以减少事故，提高货车和出租车服务的生产力，以及实现新的移动服务。我们宣布，百度和TomTom均选择在自动驾驶汽车内采用NVIDIA DRIVE PX 2。我们正分别与两家公司一起建立一个包含高清地图、人工智能算法和人工智能超级计算机的开放式云端到汽车的自动驾驶平台。

驾驶是一种我们作为第二天性进行的习得行动。但这不可能通过电脑编程来完成。自主驾驶需要利用人工智能的方方面面——感知环境，推断确定环境条件，规划最佳行动方案，以及不断学习以提高对广阔多元化世界的理解。广泛的自主驾驶范围需要一个开放式可扩展架构——从高速公路的自主巡航到驶向目的地的自主驾驶，到没有驾驶员的完全自主驾驶。

NVIDIA DRIVE PX 2是一个可跨越整个自主驾驶人工智能范围的可扩展架构。我们在GTC大会上推出针对高速公路自主驾驶而设计且具备连续定位和绘图功能的DRIVE PX 2 AutoCruise。我们还发布了覆盖自主驾驶各个方面——检测、定位、规划和行动——的自动驾驶汽车操作系统DriveWorks Alpha。

我们将所有功能集中到自动驾驶汽车NVIDIA BB8内。

NVIDIA致力于在视觉处理、人工智能和高性能计算的交叉点——处于智能和自主机器核心的独特组合——方面进行创新。我们首次创造出可以使自动驾驶汽车和自主机器人成为可能的人工智能算法。然而，它们需要一个具成本效益的实时计算平台。

我们在GTC大会上推出迄今最具野心的单芯片计算机Xavier——全球首个人工智能超级计算机芯片。Xavier拥有70亿个晶体管——比最先进的服务器级CPU更复杂。Xavier与今年初在CES上推出的DRIVE PX 2具有同等功率，在20瓦功率的条件下，具备每秒进行20万亿次运算的性能。正如《福布斯》所言，通过Xavier，NVIDIA在自动驾驶汽车上加倍投入。

人工智能企业：在认知计算领域发现2万亿美元商机的IBM宣布推出旨在为企业带来人工智能的配置有NVIDIA Tesla P100的全新POWER8服务器。在软件方面，SAP宣布其已经收到首批NVIDIA DGX-1超级计算机中两台，正积极为其遍布190个国家的32万个客户制定机器学习企业解决方案。

人工智能城市：2020年，全球将有10亿台摄像机。全球监视系统领导者海康威视正利用人工智能帮助实现更安全的城市。它利用DGX-1进行网络训练，并基于16个Jetson TX1处理器，建立了一个名为“刀锋”的突破性服务器。相比于配置了21块CPU的同等性能服务器来说，刀锋需要占用的空间仅为其1/20，所消耗的功率也仅有其1/10。

人工智能工厂：全球有20亿台工业机器人。日本是机器人创新的中心。我们在GTC大会上宣布，总部位于日本的工业机器人巨头FANUC将在NVIDIA人工智能平台上构建完整的未来工厂。其深层神经网络将采用NVIDIA GPU进行训练，装有GPU的FANUC Fog单元将驱动一组机器人，让它们一起学习，而且每台机器人将配备一个嵌入式GPU来执行实时人工智能。《麻省理工学院科技评论杂志》在其文章《日本机器人大亨将智能嵌入机械手臂》中有相关描述。

各行业的下一阶段：GPU深度学习正激发全球新一波初创公司成立——1500多间医疗保健、汽车、消费网络应用程序等行业的初创公司。最近被授权在加利福尼亚州公路上测试的Drive.ai正通过深度学习全驾驶堆栈来应对各种自动驾驶挑战。总部位于日本的Chainer框架开发商Preferred Networks正开发针对物联网的深度学习解决方案。总部位于伦敦且为首批DGX-1接收者之一的Benevolent.ai正利用深度学习，研发药物来治疗帕金森病、阿尔茨海默病和罕见癌症等疾病。根据CB Insights，在第二季度，人工智能初创公司的资金超过10亿美元，创下历史新高。

初创公司的爆炸性增长是人工智能跨行业发展的另一个指标。正如《财富》所言，深度学习将引领美国企业转型。

针对每一个人的人工智能

人工智能可以解决我们在几年前似乎难以解决的问题。从现实世界的数据来看，计算机可以学习识别对手工制作的软件、甚至人类而言过于复杂、庞大或精细的模式。有了GPU深度学习，该计算模型如今是可行的，可以用于应对世界上最大规模行业的各种挑战。自动驾驶汽车将改造价值10万亿美元的运输业。在医疗保健方面，医生将利用人工智能尽早检测疾病，了解人类基因组，治疗癌症，或者从大量医疗数据和研究中学习，提供最佳治疗建议。而且人工智能将迎来第四次工业革命——在蒸汽、大规模生产和自动化革命之后——智能机器人将推动新一波生产力提高浪潮，实现大规模消费者定制。人工智能将触及每一个人。人工智能时代已经到来。

本文作者：云中子

来源：51CTO