„Amazon AWS“ išplečia kompiuterių pasiūlą, demonstruoja galingą naują „Graviton3E“ lustą


Nuo tada, kai 2006 m. „Amazon“ pristatė debesų kompiuterijos paslaugų padalinį, plačiai žinomą kaip AWS (Amazon Web Services), bendrovė vykdė misiją paversti pasaulį savo vizija, kaip galima įsigyti ir įdiegti kompiuterinius išteklius, bet taip pat. kad jų būtų kuo daugiau visur. Ši strategija buvo parodyta šiais metais re: Invent.

AWS debiutavo keliomis naujomis skaičiavimo parinktimis, kai kurios pagrįstos naujais pasirinktiniais silicio dizainais, taip pat stulbinančiu duomenų organizavimo, analizės ir ryšio įrankių bei paslaugų asortimentu. Dėl daugybės ir sudėtingų naujų funkcijų ir paslaugų, kurios buvo pristatytos, sunku sekti visus dabar klientams prieinamus pasirinkimus. Tačiau galimybių gausa yra ne nekontroliuojamos plėtros rezultatas, o sukurta.

Naujasis AWS generalinis direktorius Adamas Selipskis per savo pagrindinį pranešimą (žiūrėkite aukščiau) ir kitus pasirodymus norėjo pabrėžti, kad organizacija yra „apsėsta klientų“. Todėl dauguma jos produktų sprendimų ir strategijų yra pagrįsti klientų pageidavimais. Pasirodo, kai turite daug skirtingų tipų klientų, kurių darbo krūviai ir reikalavimai skiriasi, jūs turite sudėtingą pasirinkimų spektrą.

Realiai, toks požiūris tam tikru momentu pasieks loginę ribą, tačiau kol kas tai reiškia, kad platus AWS produktų ir paslaugų asortimentas greičiausiai atspindi šiandienos įmonių skaičiavimo kraštovaizdžio visumą (ir sudėtingumą). Tiesą sakant, yra daugybė įžvalgų apie įmonės skaičiavimo tendencijas, kurios laukia, kol bus išaiškintos iš analizės, kokios paslaugos yra naudojamos ir kaip jis pasikeitė laikui bėgant, bet tai jau kitam kartui.

Skaičiavimo galimybių pasaulyje kompanija pripažino, kad dabar turi daugiau nei 600 skirtingų EC2 (Elastic Compute Cloud) skaičiavimo egzempliorių, kurių kiekvienas susideda iš skirtingų procesoriaus ir kito pagreičio silicio derinių, atminties, tinklo jungčių ir kt. Nors šį skaičių sunku iki galo įvertinti, jis dar kartą parodo, kokie įvairūs šiandieniniai skaičiavimo poreikiai. Nuo debesies vietinių, dirbtinio intelekto arba ML pagrįstų konteinerinių programų, kurioms reikia naujausių specialių AI greitintuvų arba GPU, iki senųjų „pakeltų ir perkeltų“ įmonių programų, naudojančių tik senesnius x86 procesorius, debesų kompiuterijos paslaugos, pvz., AWS, dabar turi sugebėti valdyti visas iš aukščiau pateiktų.

Šiais metais paskelbti nauji įrašai apima kelis, pagrįstus Intel 3-osios kartos Xeon Scalable CPU. Tačiau daugiausia dėmesio sulaukė atvejai, pagrįsti trimis naujais Amazon silicio dizainais. The Hpc7g egzempliorius yra pagrįstas atnaujinta Arm pagrindu veikiančio Graviton3 procesoriaus, pavadinto Graviton3E, versija, kuri, bendrovės teigimu, siūlo 2 kartus didesnį slankiojo kablelio našumą nei ankstesnis Hpc6g egzempliorius ir 20 % bendrą našumą, palyginti su dabartiniu Hpc6a.

Kaip ir daugeliu atvejų, Hpc7g yra skirtas tam tikram darbo krūvių rinkiniui – šiuo atveju didelio našumo skaičiavimui (HPC), pvz., orų prognozavimui, genomikos apdorojimui, skysčių dinamikai ir kt. Tiksliau, jis skirtas didesniems ML modeliams, kurie dažnai veikia tūkstančiuose branduolių. Įdomiausia tai, kad tai parodo, kiek pažengė „Arm“ pagrindu veikiantys procesoriai, atsižvelgiant į jų naudojamų darbo krūvių tipus, ir AWS patobulinimo laipsnį įvairiems EC2 egzemplioriams.

Taip pat skaitykite: Kodėl „Amazon“ kuria procesorius?

Atskirai keliose kitose sesijose AWS pabrėžė pagreitį Gravitacija Taip pat galima naudoti daugeliui kitų tipų darbo krūvių, ypač debesyje esančioms konteinerinėms programoms iš AWS klientų, tokių kaip „DirecTV“ ir „Stripe“.

Viena intriguojanti įžvalga, kurią atskleidė šios sesijos, yra ta, kad dėl įrankių, naudojamų kuriant tokio tipo taikomąsias programas pobūdžio, kyla iššūkių, susijusių su kodo perkėlimu iš x86 į Arm native instrukcijas (kurios kažkada buvo manoma, kad tai buvo didžiulis sustojimo taškas Ginklinio serverio pritaikymas) iš esmės išnyko.

Vietoj to, viskas, ko reikia, yra paprastas kelių parinkčių perjungimas prieš kodą užbaigiant ir įdiegiant egzemplioriuje. Dėl to žymiai labiau tikėtinas tolesnis ginklų pagrindu veikiančios debesų kompiuterijos augimo potencialas, ypač naudojant naujesnes programas.

Žinoma, kai kurios iš šių organizacijų siekia ateityje sukurti visiškai instrukcijų rinkinio agnostines programas, dėl kurių instrukcijų rinkinio pasirinkimas būtų nereikšmingas. Tačiau net ir tokioje situacijoje patrauklesnis pasirinkimas yra skaičiavimo egzemplioriai, siūlantys geresnį kainos / našumo arba našumo / vatų santykį, kurį dažnai turi Arm-CPU.

Dėl ML darbo krūvių „Amazon“ pristatė savo antrąją kartą Išvada procesorius kaip naujo Inf2 egzemplioriaus dalis. Inferentia2 skirta palaikyti ML išvadas modeliuose su milijardais parametrų, pavyzdžiui, daugelyje naujų didelių kalbų modelių, skirtų programoms, pvz., kalbos atpažinimui realiuoju laiku, kurie šiuo metu yra kuriami.

Naujoji architektūra skirta tūkstančiams branduolių, ko reikia šiems didžiuliams naujiems modeliams, tokiems kaip GPT-3. Be to, Inferentia2 apima matematinės technikos, žinomos kaip stochastinis apvalinimas, palaikymą, kurią AWS apibūdina kaip „tikimybinio apvalinimo būdą, kuris užtikrina aukštą našumą ir didesnį tikslumą, palyginti su senais apvalinimo režimais“. Siekiant kuo geriau išnaudoti paskirstytojo skaičiavimo privalumus, Inf2 egzempliorius taip pat palaiko naujos kartos bendrovės NeuronLink žiedinio tinklo architektūros versiją, kuri tariamai siūlo 4 kartus didesnį našumą ir 1/10 delsos esamų Inf1 egzempliorių. Esmė ta, kad jis gali pasiūlyti 45 % didesnį našumą vienam vatui, kad būtų galima daryti išvadas nei bet kuri kita parinktis, įskaitant GPU maitinamas. Atsižvelgiant į tai, kad išvados energijos suvartojimo poreikis dažnai yra 9 kartus didesnis nei reikia modelio mokymui pagal AWS, tai yra didelis dalykas.

Trečiasis naujas tinkintu siliciu varomas egzempliorius vadinamas C7gn ir jame yra nauja AWS Nitro tinklo plokštė su penktos kartos Nitro lustais. Sukurtas specialiai darbo krūviams, kuriems reikalingas itin didelis pralaidumas, pvz., ugniasienės, virtualus tinklas ir duomenų šifravimas / iššifravimas realiuoju laiku, C7gn turi 2 kartus didesnį tinklo pralaidumą ir 50 % didesnį paketų apdorojimą per sekundę nei ankstesni atvejai. Svarbu tai, kad naujosios „Nitro“ kortelės gali pasiekti šiuos lygius, 40 % pagerindamos našumą vienam vatui, palyginti su ankstesnėmis kortelėmis.

Apskritai, „Amazon“ dėmesys pritaikytam siliciui ir vis įvairesnis skaičiavimo parinkčių asortimentas yra išsamus įrankių rinkinys įmonėms, norinčioms perkelti daugiau darbo krūvių į debesį. Kaip ir daugelis kitų savo AWS pasiūlymų aspektų, bendrovė toliau tobulina ir tobulina tai, kas akivaizdžiai tapo labai sudėtingu, brandžiu įrankių rinkiniu. Bendrai jie siūlo didelį ir daug žadantį vaizdą į kompiuterijos ateitį ir naujų tipų programas, kurias jie gali įjungti.

Bobas O’Donnellas yra bendrovės įkūrėjas ir vyriausiasis analitikas TECHnalysis Research, LLC technologijų konsultavimo įmonė, teikianti strateginių konsultacijų ir rinkos tyrimų paslaugas technologijų pramonei ir profesionaliai finansų bendruomenei. Galite sekti jį Twitter @bobodtech.