„Adept“ siekia sukurti AI, galintį automatizuoti bet kokį programinės įrangos procesą – „TechCrunch“.


2016 m. „TechCrunch Disrupt New York“ renginyje keli originalūs kūrėjai, tapę „Siri“, pristatė „Viv“ – dirbtinio intelekto platformą, kuri pažadėjo prijungti įvairias trečiųjų šalių programas, kad būtų galima atlikti beveik bet kokią užduotį. Aikštė buvo viliojanti, bet niekada iki galo neįgyvendinta. Vėliau „Samsung“ įsigijo „Viv“, supaprastintą technologijos versiją įtraukdama į savo „Bixby“ balso asistentą.

Po šešerių metų nauja komanda teigia, kad nulaužė kodą universaliam AI asistentui arba bent jau šiek tiek priartėjo. Produktų laboratorijoje „Adept“, kuri šiandien atsirado slaptai, gavusi 65 mln. USD finansavimą, jie, pasak įkūrėjų, „kuria[ing] bendras intelektas, leidžiantis žmonėms ir kompiuteriams kūrybiškai dirbti kartu sprendžiant problemas.

Tai puikūs dalykai. Tačiau „Adept“ įkūrėjai, generalinis direktorius Davidas Luanas, CTO Niki Parmar ir vyriausiasis mokslininkas Ashishas Vaswani, siekia tobulinti kompiuterių „perdangą“, kuri veiktų naudojant tuos pačius įrankius, kuriuos naudoja žmonės. Ši perdanga galės reaguoti į komandas, pvz., „sukurti mėnesinę atitikties ataskaitą“ arba „nubrėžti laiptus tarp šių dviejų šio plano taškų“, – tvirtina Adept, ir visa tai naudos esamą programinę įrangą, pvz., „Airtable“, „Photoshop“, „Tableau“ ir „Twilio“, kad atliktų darbą. .

“[W]Mes mokome neuroninį tinklą naudoti kiekvieną programinės įrangos įrankį pasaulyje, remdamiesi daugybe esamų galimybių, kurias jau sukūrė žmonės. Luanas pasakojo „TechCrunch“ interviu el. paštu. “[W]ith Adept, galėsite sutelkti dėmesį į darbą, kuris jums labiausiai patinka, ir paklausti mūsų [system] imtis kitų užduočių… Tikimės, kad bendradarbis bus geras studentas ir gerai mokys, taps naudingesnis ir prisitaikys prie kiekvieno žmogaus bendravimo.

Remiantis Luano aprašymu, tai, ką Adept kuria, šiek tiek primena robotų procesų automatizavimą (RPA) arba programinės įrangos robotus, kurie naudoja automatizavimo, kompiuterinio matymo ir mašininio mokymosi derinį, kad automatizuotų pasikartojančias užduotis, pvz., formų pildymą ir atsakymą į el. laiškus. Tačiau komanda tvirtina, kad jų technologija yra daug sudėtingesnė nei tai, ką šiandien siūlo RPA pardavėjai, tokie kaip Automation Anywhere ir UiPath.

„Kuriame bendrą sistemą, kuri padeda žmonėms atlikti darbus priešais savo kompiuterį: universalus dirbtinio intelekto bendradarbis kiekvienam žinių darbuotojui… Mes mokome neuroninį tinklą naudoti kiekvieną programinės įrangos įrankį pasaulyje, remdamiesi didžiuliu kiekiu. esamų galimybių, kurias žmonės jau sukūrė“, – sakė Luanas. „Manome, kad dirbtinio intelekto gebėjimas skaityti ir rašyti tekstą ir toliau bus vertingas, tačiau galimybė atlikti veiksmus kompiuteriu bus žymiai vertingesnė įmonei… [M]odels, išmokęs dirbti su tekstu, gali rašyti puikią prozą, bet negali imtis veiksmų skaitmeniniame pasaulyje. Jūs negalite klausti [them] Norėdami užsisakyti skrydį, sumokėti pardavėjui čekį ar atlikti mokslinį eksperimentą. Tikram bendram intelektui reikalingi modeliai, galintys ne tik skaityti ir rašyti, bet ir veikti, kai žmonės prašo ką nors padaryti.

Adeptas nėra vienintelis, tyrinėjantis šią idėją. Vasario mėn. paskelbtame dokumente „Alphabet“ remiamos „DeepMind“ mokslininkai apibūdina tai, ką jie vadina „duomenimis pagrįstą“ metodą, skirtą mokyti dirbtinio intelekto valdyti kompiuterius. Autorius turintys AI stebi klaviatūros ir pelės komandas, kurias duoda žmonės, atliekantys „instrukcijas sekančias“ kompiuterio užduotis, pavyzdžiui, užsisakydami skrydį, mokslininkai sugebėjo parodyti sistemai, kaip atlikti daugiau nei šimtą užduočių „žmogaus lygio“ tikslumu.

Ne taip ir sutapimas, „DeepMind“ įkūrėjas Mustafa Suleyman neseniai susijungė kartu su „LinkedIn“ įkūrėju Reidu Hoffmanu paleido „Inflection AI“, kuri, kaip ir „Adept“, siekia naudoti AI, kad padėtų žmonėms efektyviau dirbti su kompiuteriais.

Tariamas „Adepto“ diferencialas yra AI tyrėjų, priklausančių „DeepMind“, „Google“ ir „OpenAI“, smegenis. Vaswani ir Parmar padėjo sukurti Transformerį – dirbtinio intelekto architektūrą, kuri per pastaruosius kelerius metus sulaukė didelio dėmesio. 2017 m. sukurta „Transformer“ tapo pasirinkta architektūra atliekant natūralios kalbos užduotis, demonstruojančia gebėjimą apibendrinti dokumentus, versti iš vienos kalbos į kitą ir netgi klasifikuoti vaizdus ir analizuoti biologines sekas.

Be kitų produktų, OpenAI kalbą generuojantis GPT-3 buvo kuriamas naudojant Transformer technologiją.

„Per kelerius ateinančius metus visi tiesiog prisidėjo prie „Transformerio“ ir naudojo jį daugybei dešimtmečių senų problemų iš eilės išspręsti. Kai vadovavau inžinerijai OpenAI, mes padidinome Transformerį į GPT-2 (GPT-3 pirmtaką) ir GPT-3“, – sakė Luanas. „Google“ pastangos keisti transformatorių modelius davė rezultatų [the AI architecture] BERT, veikianti „Google“ paieška. Ir kelios komandos, įskaitant mūsų įkūrėjų komandos narius, apmokė transformatorius, galinčius rašyti kodą. „DeepMind“ netgi parodė, kad „Transformer“ veikia baltymų lankstymui („AlphaFold“) ir „Starcraft“ („AlphaStar“). Transformatoriai padarė bendrą žvalgybą apčiuopiamą mūsų sričiai.

„Google“ įmonėje Luanas buvo bendras technologijų lyderis „Google Brain“, viename iš svarbiausių technologijų milžinės tyrimų padalinių, „didelių modelių pastangų“. Ten jis mokė vis didesnius transformatorius, siekdamas galiausiai sukurti vieną bendrą modelį, kuris veiktų visais mašininio mokymosi atvejais, tačiau jo komanda susidūrė su aišku apribojimu. Geriausi rezultatai buvo gauti tik su modeliais, kurie buvo sukurti taip, kad galėtų tobulėti konkrečiose srityse, pavyzdžiui, analizuoti medicininius įrašus arba atsakyti į klausimus tam tikromis temomis.

„Nuo pat šios srities pradžios norėjome sukurti modelius, kurių lankstumas būtų panašus į žmogaus intelekto modelius, kurie galėtų atlikti įvairias užduotis… [M]Per pastaruosius penkerius metus achine mokymosi pažanga buvo didesnė nei per 60 ankstesnių metų“, – sakė Luanas. „Istoriškai ilgalaikis AI darbas buvo didelių technologijų įmonių kompetencija, o jų talentų ir skaičiavimo koncentracija buvo nepriekaištinga. Žvelgdami į ateitį, manome, kad kitai AI proveržių erai reikės išspręsti problemas, kurios yra žmogaus ir kompiuterio bendradarbiavimo pagrindas.

Kad ir kokia būtų jo produkto forma ir verslo modelis, ar „Adept“ gali pasisekti ten, kur kitiems nepavyko? Jei įmanoma, netikėta suma gali būti didelė. Pagal į Markets ir Markets, verslo procesų automatizavimo technologijų – technologijų, kurios supaprastina įmonės klientų ir biuro darbo krūvį – rinka išaugs nuo 9,8 mlrd. USD 2020 m. iki 19,6 mlrd. USD iki 2026 m. Vienas 2020 m. apklausa procesų automatizavimo pardavėjas Camunda (šališkas šaltinis, suteikta) nustatė, kad 84 % organizacijų tikisi daugiau investicijų į procesų automatizavimą dėl pramonės spaudimo, įskaitant nuotolinio darbo padidėjimą.

„Adept technologija teoriškai skamba patikimai, [but] kalbėjimas apie tai, kad transformeriai turi „gebėti veikti“, man atrodo kaip klaidinga kryptis“, – „TechCrunch“ el. paštu sakė Mike’as Cookas, dirbtinio intelekto tyrinėtojas iš Knives & Paintbrushes tyrimų kolektyvo, nesusijusio su Adept. „Transformatoriai yra sukurti taip, kad nuspėtų kitus daiktų seką, tai viskas. Transformatoriui nėra jokio skirtumo, ar tas numatymas yra raidė kokiame nors tekste, pikselis vaizde, ar API iškvietimas kode. Taigi ši naujovė nėra labiau linkusi sukurti dirbtinį bendrą intelektą nei bet kas kita, tačiau ji gali sukurti dirbtinį intelektą, kuris geriau tiktų atlikti paprastas užduotis.

Tiesa, kad pažangiausių AI sistemų mokymo kaina yra mažesnė nei anksčiau. Turėdami tik dalį OpenAI finansavimo, pastarieji startuoliai, įskaitant AI21 Labs ir Cohere, sugebėjo sukurti modelius, savo galimybėmis panašius į GPT-3.

Tuo tarpu nuolatinės multimodalinio AI naujovės – AI, galinti suprasti ryšį tarp vaizdų, teksto ir kt. – sukuria sistemą, kuri užklausas gali paversti įvairiomis kompiuterio komandomis pagal galimybes. Taip pat veikia kaip OpenAI NurodykiteGPTtechnika, kuri pagerina kalbos modelių, pvz., GPT-3, gebėjimą laikytis instrukcijų.

Pagrindinis Cook rūpestis yra tai, kaip Adept apmokė savo AI sistemas. Jis pažymi, kad viena iš priežasčių, kodėl kiti „Transformer“ modeliai taip sėkmingai naudoja tekstą, yra ta, kad yra daugybė teksto pavyzdžių, iš kurių galima pasimokyti. Tikėtina, kad tokiam produktui kaip „Adept’s“ reikėtų daugybės sėkmingai atliktų užduočių programose (pvz., „Photoshop“) pavyzdžių, kartu su tekstiniais aprašymais, tačiau šių duomenų nėra taip natūraliai pasaulyje.

Vasario mėnesio DeepMind tyrime mokslininkai rašė, kad norėdami surinkti mokymo duomenis savo sistemai, jie turėjo sumokėti 77 žmonėms, kad jie atliktų daugiau nei 2,4 milijono kompiuterinių užduočių demonstracijų.

“[T]treniruočių duomenys tikriausiai yra sukurti dirbtinai, o tai kelia daug klausimų tiek apie tai, kam buvo sumokėta už jų sukūrimą, kiek tai ateityje bus pritaikyta kitoms sritims, ir ar treniruojama sistema turės tokį gylį, kokį turi kiti Transformer modeliai. “, – sakė Cookas. “Tai yra [also] jokiu būdu nėra „kelias į bendrąjį intelektą“… Gali būti, kad kai kuriose srityse jis bus pajėgesnis, bet tikriausiai jis bus mažiau pajėgus nei sistema, specialiai išmokyta atlikti konkrečią užduotį ir pritaikymą.

Net ir geriausiai parengti planai gali susidurti su nenumatytų techninių iššūkių, ypač kai tai susiję su AI. Tačiau Luanas tiki įkūrusiu „Adept“ vyresniuoju talentu, tarp kurių yra buvęs „Google“ modelių gamybos infrastruktūros vadovas (Kelsey Schroeder) ir vienas iš originalių „Google“ gamybos kalbos atpažinimo modelio inžinierių (Anmol Gulati).

“[W]Hile bendras intelektas dažnai apibūdinamas žmogaus pakeitimo kontekste, tai nėra mūsų šiaurinė žvaigždė. Vietoj to manome, kad dirbtinio intelekto sistemos turėtų būti kuriamos su žmonėmis“, – sakė Luanas. „Norime visiems suteikti prieigą prie vis sudėtingesnių AI įrankių, kurie padeda pasiekti savo tikslus bendradarbiaujant su šiuo įrankiu; mūsų modeliai sukurti dirbti kartu su žmonėmis. Mūsų vizija yra ta, kad žmonės lieka vairuotojo vietoje: atrasti naujus sprendimus, priimti labiau pagrįstus sprendimus ir suteikti mums daugiau laiko darbui, kurį iš tikrųjų norime atlikti.

Greylock ir Addition kartu vadovavo „Adept“ finansavimo raundei. Jame taip pat dalyvavo „Root Ventures“ ir angelai, įskaitant „Behance“ įkūrėją Scottą Belsky („Behance“ įkūrėją), „Airtable“ įkūrėją Howie Liu, Chrisą Re, „Tesla Autopilot“ lyderį Andrejus Karpathy ir Sarah Meyohas.