• <rp id="63vlb"><object id="63vlb"><input id="63vlb"></input></object></rp>

    <em id="63vlb"></em>

    1. <em id="63vlb"></em>

      <button id="63vlb"><acronym id="63vlb"></acronym></button>

      微信掃一掃,關注公眾號

      • 科技行者

      • 算力行者

      見證連接與計算的「力量」

      首頁 “逆向工作法”十年引領云計算創芯之旅

      “逆向工作法”十年引領云計算創芯之旅

      2023-12-01 16:51
      分享至:
      ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
      2023-12-01 16:51 ? 周雅

      作者:周雅

      太平洋時間11月27日,在拉斯維加斯的亞馬遜云科技2023 re:Invent開幕前兩個小時,有一場小型的歡迎晚宴,《星期日泰晤士報》南非站記者Arthur Goldstuck在與至頂科技記者的交流中興奮地談到:“這些年參與過很多亞馬遜活動,我有個預感,我們可能會目睹最重要的一場re:Invent,這次亞馬遜云科技的技術發布,在未來五年都會是極具意義的。

      參與者們有理由興奮,大家都在好奇,在生成式AI幾乎席卷一切的背景下,一個處于領導者地位的云廠商,將會向外界講出怎樣的人工智能故事?

      Arthur Goldstuck和包括我在內的更多與會者沒有失望。如果站在未來看當下,生成式AI可能是一場大型馬拉松,但亞馬遜云科技現在就已經在勾勒出它的地圖。在亞馬遜云科技CEO Adam Selipsky長達兩個半小時的演講中,一張“生成式AI堆棧圖”貫穿了整場。

      “逆向工作法”十年引領云計算創芯之旅

      亞馬遜云科技“生成式AI技術堆棧圖”(Generative AI Stack)

      上圖可見,亞馬遜云科技搭建了三層AI堆棧:最底層是用于訓練和推理的「基礎設施層」,這里包括一些亞馬遜云科技的自研芯片;中間層是微調大模型或基礎模型需求的「工具層」;最上層是「生成式AI應用層」,這里包括此次新推出的生成式AI助理Amazon Q。

      概括而言,亞馬遜云科技正在構建一種范式,去盡可能匹配這個時代下的更多客戶的更多需求,正如Adam Selipsky所說——“我們在用一種跟傳統完全不同的方式探討生成式AI概念”。

      不過,正所謂見微知著,我們決定將「芯片」,作為觀察今年亞馬遜云科技re:Invent新發布的切入點。

      “逆向工作法”十年引領云計算創芯之旅

      圖片攝于2023 re:Invent一角

      十年自研,逆向造芯

      很多人了解亞馬遜云科技,知道它是全球領先云廠商,構建底層軟件的能力非同一般。但大家可能不那么了解的是,亞馬遜云科技還是一個在芯片及硬件層有深厚技術底蘊的公司。

      早在十年前的2013年起,亞馬遜云科技就開始自研芯片,至今已形成了一個芯片全家桶,包括四個系列:

      · 云服務技術底層核心的虛擬化芯片Amazon Nitro

      · 通用處理器芯片Amazon Graviton

      · 用于機器學習的“訓練”芯片Amazon Trainium和用于機器學習的“推理”芯片Amazon Inferentia

      而且實際上,近年來亞馬遜云科技一直在年中舉辦“亞馬遜云科技硅芯片創新日”,與產業交流相關創新。就在今年6月的2023年芯片創新日,Amazon EC2副總裁Dave Brown回憶起2012年,當時亞馬遜云科技是如何進入芯片設計的故事。一晃,已是十年。

      他描述了一群領導者,包括 Peter DeSantis 和 James Hamilton,如何設想“增加一個硬件設備來增強亞馬遜云科技的安全性和性能”——這個簡單的想法,開啟了一個全新的時代,帶來了多種定制的芯片產品。

      而在此次re:Invent,就有兩款亞馬遜云科技自研芯片有了重大升級,分別是:

      · Amazon Graviton4
      · Amazon Trainium2

      “逆向工作法”十年引領云計算創芯之旅

      Amazon Graviton4 和Amazon Trainium (原型) (Business Wire提供)

      Amazon Graviton系列芯片,無疑是芯片發展史上濃墨重彩的發明。提起ARM架構的云端芯片,大家似乎不陌生。但如果把時鐘撥回到6年前,雖然當時業界已經通過iPhone,認可了ARM架構是移動端CPU的好選擇。但是,開發并規?;逃肁RM架構的服務器CPU,還是前無古人的創舉。

      而亞馬遜云科技就是那個開創者,Amazon Graviton第一代誕生于2018年,“現在接近10%的服務器總銷售額是ARM,其中很大一部分來自亞馬遜云科技。在CPU方面,這家公司做得很好。”Bernstein Research高級分析師Stacy Rasgon在一次接受采訪中如是說。

      本次大會,Amazon Graviton已經更新到第四代,但依然沒有放慢高速增長的步伐。據悉,與前一代相比,Amazon Graviton4性能提升30%,獨立核心增加50%,對于高并發等應用所需要的內存帶寬,更提升75%,并且,還進一步通過高速物理硬件接口的完全加密提升了安全性。

      “逆向工作法”十年引領云計算創芯之旅

      熟悉造芯的朋友們都知道,設計和成功流片一顆新架構的芯片只是造芯的基本功,而能讓芯片規?;挠闷饋?,才是決定造芯是否成功的天花板。

      在管理理念上,亞馬遜內部有一招很特別的法門,叫做“working backwards逆向工作法”。亞馬遜云科技的成功造芯,或許正與此有關。

      關于“逆向工作法”,曾經貝索斯在2008年致亞馬遜公司股東的信中所做解釋大意如下:如果我們能很好了解顧客需求,并深信這種需求是有長期價值。那么,我們的一貫做法是——耐心探索,直至找到解決方案……從顧客需求出發的“逆向工作法”(working backwards)與“技能導向法”(skills-forward)形成鮮明對比。

      簡單來說,逆向工作法,就是先研究需求,再根據需求創造相應工具;而技能導向法,則是手里拿著錘子,看什么都像釘子。

      “逆向工作法”十年引領云計算創芯之旅

      亞馬遜云科技的造芯過程,某種程度就遵循了逆向工作法。以亞馬遜云科技最早的硬件系統Amazon Nitro為例。它的出現,就是為了解決Xen架構的虛擬化系統的資源消耗問題——服務器中大概只有七成的資源能夠提供給用戶。而Amazon Nitro針對虛擬化損耗,提出定制化硬件的思路,最終提供了裸機的性能。

      而在與用戶應用關系度更緊密的CPU層面,亞馬遜云科技提供了針對不同負載優化的計算實例類型,來推動芯片的落地應用,從計算密集型、內存密集型,再到存儲、IO敏感、吞吐敏感、網絡延遲敏感等,一應俱全。

      針對最新的Amazon Graviton4,亞馬遜云科技就提供了Amazon EC2 R8g內存優化性實例,可以提升客戶運行高性能數據庫、內存緩存、大數據分析等工作負載的效率。R8g實例相比當前一代R7g實例提供更大的實例大小,虛擬處理器(vCPU)以及內存均提升了3倍。這讓用戶可以處理更大量的數據、更大規模的工作負載、更快的獲得運行結果,并降低總擁有成本。基于Amazon Graviton4的R8g實例現已提供預覽版,并將在未來幾個月推出正式可用版。

      對于Amazon Graviton的設計方式,同樣是從逆向工作法開始的,Amazon Graviton自發布以來,它的設計出發點就是用戶的實際工作負載,而不是測試軟件的benchmark。通過一個“六邊形性能分析”可以看到,Amazon Graviton4相比上一代是如何在數據應用中提升性能。這些性能的提升不僅僅存在于re:Invent上,更在客戶每次用實際工作負載來測試Amazon Graviton芯片中。

      “逆向工作法”十年引領云計算創芯之旅

      Amazon Graviton4的六邊形性能分析,以及在Amazon Graviton3和Amazon Graviton4上運行的MySQL示例

      據統計,目前由Amazon Graviton支持的Amazon EC2實例種類達150多個,已經構建的Amazon Graviton處理器數量超過200萬個,并擁有超過5萬客戶,包括Datadog、DirecTV、Discovery、Formula 1 (F1)、NextRoll、Nielsen、Pinterest、SAP、Snowflake、Sprinklr、Stripe以及Zendesk等。例如SAP,在使用Amazon Graviton服務之后,成本降低了35%,且分析速度更快,同時減少了45%的碳排放量。

      不過我猜,Arthur Goldstuck和很多人在內,在re:Invent期間更關注的一顆芯,會是Amazon Trainium系列,因為這是面向模型“訓練”的芯片,而這部分,算力的瓶頸問題眾人皆知。

      此次大會發布的Amazon Trainium2,是一款專為基礎模型和大模型而生的產品,為擁有數千億甚至數萬億個參數的基礎模型訓練做了優化,相比第一代Amazon Trainium(發布于2020年12月),性能提升4倍,內存提升3倍,能效(每瓦性能)提升2倍,幾乎全線超過摩爾定律所定義的范疇。

      “逆向工作法”十年引領云計算創芯之旅

      同樣,亞馬遜云科技也有相同的實例推動新系列的落地。Amazon EC2 Trn2實例就采用了Amazon Trainium2,一個單獨實例中包含16個Amazon Trainium芯片,Trn2實例可幫助在下一代EC2 UltraCluster中擴展到10萬個Amazon Trainium2,通過搭配Amazon Elastic Fabric Adapter (EFA) 網絡互連,提供65 ExaFlops超算級性能。基于此,客戶只用幾周就能訓練出有3000億個參數的大模型,這約是OpenAI的大模型GPT-3大小的1.75倍。

      在這場發布的間隙,在采訪中被問道“造芯對于客戶帶去什么價值”時,亞馬遜云科技全球汽車及制造行業專業服務團隊負責人Jon Allen告訴我:

      “客戶想要更快的、更便宜的東西,這是基本原則。”無疑,這也是非常“逆向工作法”的一個回答。他以汽車業務舉例,“真正訓練一輛自動駕駛汽車,起碼得開車跑900萬英里,如果用傳統方式做數據訓練,很多OEMs客戶可能根本負擔不起”。

      生成式AI大時代,有自研,但不影響聯盟

      雖然亞馬遜云科技一直持續自研芯片,但是封閉并非這家公司的基因。而在生成式AI時代起決定性作用的另外一家巨頭,英偉達創始人兼CEO黃仁勛穿著標志性皮衣,甚至作為此次re:Invent的首位上場的合作伙伴,與Adam Selipsky進行了一場對話,在對話中黃仁勛提到:

      “生成式AI正改變各種云端負載,為多元內容創作在底層注入加速計算動能。我們的共同目標是,為每個客戶提供具有成本效益的先進生成式AI,為此英偉達與亞馬遜云科技在整個計算堆棧展開合作,橫跨AI基礎設施、加速庫(acceleration libraries)、基礎模型、以及生成式AI服務。”

      “逆向工作法”十年引領云計算創芯之旅

      在真正的創新者面前,重要的不是是否有競爭,而是雙方是否有能滿足客戶需求的能力,顯然,亞馬遜云科技和英偉達都在對方身上看到了這一點。

      “GPU和GPU之間用NV link連接方式讓我們的GPU可以直接存取CPU的記憶體,CPU可以直接使用GPU的記憶體,這是非??斓剡M行的。在更大的網絡中,通過Grace Harper鏈接在一起。Amazon Nitro可以將GH變成一顆巨大的虛擬化的GPU。這么多的實例,我們可以跟亞馬遜云科技EFA兼容起來用,這也是非??焖俚乃俣葋磉\用的,所有單元都可以變成超級的集群。”黃仁勛說道。

      約13年前,亞馬遜云科技是第一家把英偉達GPU芯片帶到云上的云廠商,而接下來,雙方還將擴大合作,主要包括四個方面

      · 亞馬遜云科技成為第一家在云端配備英偉達GH200 Grace Hopper超級芯片的云廠商。英偉達GH200 NVL32多節點平臺為運用英偉達NVLink與NVSwitch技術連接32個Grace Hopper Superchips組成的實例。此平臺將在Amazon Elastic Compute Cloud(Amazon EC2)實例上可用,與亞馬遜云科技的網絡相連,由虛擬化(Amazon Nitro System)及超大規模集群(Amazon EC2 UltraClusters)提供支持,讓共同客戶能擴展至數千個GH200超級芯片。

      · 在亞馬遜云科技平臺上將推出英偉達DGX Cloud NVIDIA AI“訓練即服務(AI-training-as-a-service)”。此服務將是首個配置GH200 NVL32的DGX Cloud,為開發者提供單一實例中最多的共享內存。在亞馬遜云科技上運行的DGX Cloud將加速訓練含有超過1兆參數的尖端生成式AI與大型語言模型。

      · 英偉達與亞馬遜云科技合作推動Project Ceiba,構建全球最快的GPU驅動的AI超級計算機,這是一個配備GH200 NVL32與Amazon EFA互連技術的大規模系統,該系統部署在亞馬遜云科技上,為英偉達研發團隊提供服務。該超級計算機將前所未有地配置16384顆英偉達H200超級芯片,能處理65 exaflops(衡量超級計算機性能的單位,每秒浮點運算可達一百億億次)速度等級的AI運算,英偉達使用該超級計算機推動其全新生成式AI的創新。

      · 亞馬遜云科技將推出三款Amazon EC2實例:P5e實例配置英偉達H200 Tensor Core GPUs,針對大規模與尖端生成式AI及HPC高性能運算工作負載;分別配置英偉達L4 GPUs與英偉達L40S GPUs的G6與G6e實例,可運行包括AI微調、推理、繪圖以及影片工作負載等廣泛應用。G6e實例特別適用于開發3D工作流程、數字孿生、以及其他使用英偉達Omniverse的應用,用來連接與構建各種生成式AI的3D應用。

      提到大模型,總有人認為這是巨頭的游戲。但是Jon Allen不這么看,他告訴我,在亞馬遜云科技的幫助下,“對中小企業和創業公司來說,我們的AI芯片帶給他們與寶馬等汽車巨頭相同的計算能力。十年前的硅谷,只有十幾人的小公司根本無法負擔高昂的算力(與大玩家競爭)。但現在不一樣了,AI芯片確實創造了新機會。”

      “逆向工作法”十年引領云計算創芯之旅

      分享至
      34贊

      好文章,需要你的鼓勵

      周雅

      Miranda
      關注科技創新、技術投資。以文會友,左手硬核科技,右手浪漫主義。
      推薦文章
      ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
      一级毛片视频免费播放在线,哪个网址可以看毛片,色费女人18女人毛片免费视频,一级A黄毛片