亞馬遜云科技在2023 re:Invent全球大會上宣布,亞馬遜云科技與英偉達宣布擴大戰略合作,將聯合推出先進的基礎設施、軟件及服務,推動客戶在生成式AI(Generative AI)的創新。
雙方將英偉達與亞馬遜云科技技術優勢相結合,為訓練基礎模型和構建生成式AI應用提供理想環境,具體包含英偉達新一代GPU、CPU與AI軟件的最新多節點系統,以及亞馬遜云科技的Nitro System先進虛擬化與安全平臺、Elastic Fabric Adapter(EFA)互連技術和UltraCluster擴展能力。
亞馬遜云科技與英偉達一直保持長期合作關系,攜手為生成式AI賦能。此次擴大合作將為機器學習(ML)開拓者提供推動這些技術進一步發展所需的計算性能。雙方合作的內容包括:
1、亞馬遜云科技推出首款結合NVIDIA Grace Hopper Superchip與Amazon UltraCluster擴展功能的云AI超級計算機。
2、NVIDIA DGX Cloud率先配備NVIDIA GH200 NVL32,并首次在亞馬遜云科技上提供此AI訓練即服務。
3、英偉達和亞馬遜云科技在Project Ceiba上合作,打造全球最快的GPU驅動AI超級計算機以及最新的NVIDIA DGX Cloud超級計算機,用于英偉達的AI研發以及自研模型開發服務。
4、配置NVIDIA GH200、H200、L40S以及L4 GPU等芯片的全新Amazon EC2實例,大幅提升生成式AI、HPC高性能計算、設計以及模擬類工作負載的性能。
5、在亞馬遜科技上運行的英偉達軟件,包括NeMo LLM框架、NeMo Retriever以及BioNeMo,加速自研模型、語義檢索、新藥研發等應用的生成式AI發展。
此次雙方合作將大幅加速所有產業應用生成式AI的發展,具體內容包括:
1、亞馬遜云科技是第一家在云端配備具有多節點NVLink技術的NVIDIA GH200 Grace Hopper Superchips的云廠商。NVIDIA GH200 NVL32多節點平臺運用NVIDIA NVLink與NVSwitch技術連接32個Grace Hopper Superchips,組成一個實例。此平臺將在Amazon Elastic Compute Cloud(Amazon EC2)實例上可用,與亞馬遜強大的網絡(EFA)相連,由先進的虛擬化(Amazon Nitro System)及超大規模集群(Amazon EC2 UltraClusters)提供支持,讓共同客戶能擴展至數千個GH200 Superchips。
2、英偉達與亞馬遜云科技將連手在亞馬遜云科技上推出NVIDIA DGX Cloud NVIDIA AI訓練即服務(AI-training-as-a-service)。此服務將是首個配置GH200 NVL32的DGX Cloud,為開發者提供單一實例中最多的共享內存。在亞馬遜云科技上運行的DGX Cloud將加速訓練含有超過1兆參數的尖端生成式AI與大型語言模型。
3、英偉達與亞馬遜云科技合作推動Project Ceiba,構建全球最快的GPU驅動的AI超級計算機,這是一個配備GH200 NVL32與Amazon EFA互連技術的大規模系統,該系統部署在亞馬遜云科技上,為英偉達研發團隊提供服務。該開創先河的超級計算機配置16,384顆NVIDIA GH200 Superchips,能處理65 exaflops速度等級的AI運算,英偉達使用該超級計算機推動其全新生成式AI的創新。
4、亞馬遜云科技將推出三款Amazon EC2實例:P5e實例配置NVIDIA H200 Tensor Core GPUs,針對大規模與尖端生成式AI及HPC高性能運算工作負載;分別配置NVIDIA L4 GPUs與NVIDIA L40S GPUs的G6 與G6e實例,可運行包括AI微調、推理、繪圖以及影片工作負載等廣泛應用。G6e實例特別適用于開發3D工作流程、數字孿生、以及其他使用NVIDIA Omniverse的應用,用來連結與構建各種生成式AI的3D應用。
亞馬遜云科技首席執行官Adam Selipsky表示:“亞馬遜云科技與英偉達合作已經超過13年,我們的合作起源于推出全球首個配置GPU的云端實例?,F在我們推出最廣泛的英偉達 GPU解決方案,可用于各種工作負載,包括繪圖、游戲、HPC高性能計算、機器學習,直到現在的生成式AI。我們持續運用英偉達技術推動創新,并通過將新一代NVIDIA Grace HopperSuperchips與亞馬遜云科技強大看的網絡EFA、超大規模集群EC2 UltraClusters以及先進虛擬化能力Nitro相結合,讓亞馬遜云科技成為運行GPU的最佳云端環境。”
英偉達創始人兼首席執行官黃仁勛表示:“生成式AI正改變各種云端負載,為多元內容創作在底層注入加速計算動能。我們共同目標是為每個客戶提供具有成本效益、先進生成式AI,為此英偉達與亞馬遜云科技在整個計算堆棧展開合作,橫跨AI基礎設施、加速庫(acceleration libraries)、基礎模型以及生成式AI服務。”
在亞馬遜云科技云端上運行英偉達軟件,加速生成式AI的研發
此外,英偉達宣布推出在亞馬遜云科技上運行的軟件,用于加速其生成式AI的研發。NVIDIA NeMo Retriever microservice微服務提供多項新工具,用來創造高精準度的聊天機器人,以及運用加速的語意檢索技術的歸納工具。在Amazon SageMaker上可用的NVIDIA BioNeMo,并計劃在亞馬遜云科技托管的NVIDIA DGX Cloud,讓制藥企業加快新藥開發,企業可運用自己的數據簡化與加速模型訓練。
在亞馬遜云科技云端運行的英偉達軟件將幫助亞馬遜為其服務與運營注入創新動能。亞馬遜云科技正運用NVIDIA NeMo框架訓練新一代大語言模型Amazon Titan。Amazon Robotics也已開始借助NVIDIA Omniverse Isaac打造數字孿生,在虛擬化環境中推動自主倉庫的自動化、優化以及規劃,完成之后再部署到真實環境。
好文章,需要你的鼓勵
在今年I/O的第二天,谷歌在美國總部(Googleplex 2000)組織了一場小范圍專訪,包括谷歌母公司Alphabet兼谷歌CEO桑達爾·劈柴(Sundar Pichai)在內的四位核心管理層,接受了包括科技行者Techwalker、CNBC、《朝鮮日報》、意大利紙媒《La Repubblica》、巴西紙媒《Folha de S. Paulo》、英國電視臺等全球媒體的提問。