Den lilla Nvidia Jetson Xavier NX ser lite ut som en Raspberry Pi, men den är mycket kraftfullare.
Den senaste medlemmen i Nvidias växande familj av artificiell intelligens, Jetson Xavier NX, är ungefär storleken på ett kreditkort och är utformad för att monteras på en robot för att fungera som dess hjärna.
Låt inte dess lilla storlek lura dig.
Enheten på $ 399, nu tillgänglig som ett kit för AI-utvecklare, har en kraftfull grafikprocessor byggd på Nvidias senaste Volta GPU-mikroarkitektur, med hundratals processorkärnor som låter den acceptera flera dataströmmar och bearbeta dem med separata neurala nätverk samtidigt.
Det är den perfekta plattformen för att testa en komplex robot, säger Nvidia.
Med det Linux-drivna Jetson Xavier NX-utvecklingssatsen som hjärna kan botten ha flera kameror för att upptäcka uttryck från närliggande människor, såväl som mikrofoner för att lyssna på deras kommandon och svara på lämpligt sätt.
Totalt kan grafikprocessorn i Jetson Xavier NX samtidigt avkoda fyra strömmar av 4K-video vid 30 bilder per sekund (fps), eller en hel del 32 samtidiga strömmar av full HD-video (1080p) vid 30 fps.
Systemet har 384 CUDA-kärnor och 48 Tensor-kärnor tillgängliga för att köra neurala nätverk som behandlar dessa strömmar.
Resultatet är att en leveransrobot som drivs av en Xavier NX kan undvika kollisioner, planera sin väg nedför trottoaren, identifiera objekt och svara på frågor från människor - allt på samma gång.
Molnbaserade neuronnät för jordbaserade robotar
Ingen av dessa möjligheter är naturligtvis väldigt revolutionerande.
Leveransrobotar har strövat på gatorna i stora städer i några år nu, medan andra gör pizzor och patrullerar livsmedelsgångar.
Men dessa typer av bots tillhör vanligtvis välfinansierade företag med många MIT-utbildade experter till hands för att göra sina AI-nätverk perfekta och felsöka dem när de oundvikligen snubblas av programvarufel.
Med Jetson Xavier NX och lite hjälp från molnbaserad databehandling kan många fler pröva sina händer med att bygga robotar och andra AI-applikationer.
Den nya modulen, som andra i Nvidia Jetson-familjen, avstår från den traditionella monolitiska modellen för AI-teknik, där expertteam spenderar månader eller år på att bygga och finjustera flera neurala nätverk och sedan distribuera dem alla på en gång.
Det motsvarar att du behöver uppdatera din iPhones operativsystem varje gång det finns en ny version av Spotify-appen.
Istället låter Jetson Xavier NX utvecklare skapa och förfina flera olika neurala nätverk för att utföra olika uppgifter och distribuera dem när de är redo.
Det är ett paradigmskifte i AI-utvecklingsvärlden, säger Nvidia.
Utvecklare kan skapa sina applikationer antingen i molnet, på en stationär PC eller på vilket Jetson-utvecklingssats som helst och sedan "innehålla" dem för installation på en robot eller var som helst de behöver.
Mer än 3000 kunder använder Nvidias befintliga Jetson AI-produktionsmoduler, mestadels den större Jetson TX2, baserat på företagets tidigare Pascal GPU-arkitektur.
Företaget förväntar sig att många av dem kommer att migrera till Jetson NX för framtida AI-projekt.
Testa en virtuell Jetson Xavier NX-robot
Nvidia skickade oss utvecklarpaketversionen av Jetson Xavier NX för att testa, tillsammans med en förskriven samling neurala nätverk som simulerar vad utvecklare kan skapa för att driva en robot.
Utvecklingssatsen innehåller själva Xavier NX samt minne, USB-portar, en microSD-kortplats och andra bekanta tillbehör som gör AI-beräkningsmodulen till en fullfjädrad dator som kör Linux.
Eftersom jag saknade tid eller expertis för att faktiskt bygga en fysisk robot med sensorer och drivlina använde jag istället exempel på videofilmer som Nvidia gav som ungefär vad en kundtjänstrobot kan stöta på när den gör sina rundor.
Dessa robotar behöver identifiera människor, förstå vad en kund frågar och tillhandahålla användbara svar, som alla kräver många kameror och sensorer samt AI-färdigheter för att analysera deras ingångar.
Färdigheterna inkluderar blickdetektering (för att se när någon tittar på det), taligenkänning och naturlig språkbehandling för att förstå och svara på frågor.
Exempelmaterialet efterliknar en robot som utför fyra sådana färdigheter samtidigt.
När Jetson Xavier NX är ansluten till en extern bildskärm och kör demo, här är vad den virtuella roboten ser:
Kvadranten uppe till vänster upptäcker personer från fyra samtidiga kameraflöden och identifierar antalet personer i varje ström.
Kvadranten längst ner till vänster är ett neuralt nätverk som kan gissa någons ställning, så att den vet om en person pekar på en specifik produkt i en butikshylla eller föreslår att roboten ska följa den, till exempel.
Kvadranten längst ned till höger räknar ut var folk tittar - när någon tittar på roboten blir lådorna runt personens ögon gröna, vilket får botten att fråga om han eller hon behöver hjälp.
Slutligen simulerar den övre högra kvadranten taldetektering och naturlig språkbehandling med det Google-utvecklade BERT-protokollet.
Demonstrationen har några förinstallerade ämnen som Nvidia tillhandahöll, inklusive NFL-trivia och vägbeskrivning till huvudtalen vid företagets årliga utvecklarkonferens.
Ställ en fråga med en USB-mikrofon som är ansluten till Jetson Xavier NX dev-kit, och modellen kommer att försöka hitta svaret från det förbefolkade ämnet.
Tweaking Neural Networks i realtid
För att göra saker mer intressanta och simulera realtidsuppdateringar till ett neuralt nätverk medan de andra fortfarande är igång, dödade jag Nvidias BERT-prov och skapade ett nytt ämne genom att kopiera panntexten längst ner på varje sida på Daxdi.com, inklusive den du läser nu.
Jag kunde skapa och distribuera det nya ämnet medan Jetson Xavier NX var upptagen med att krossa de tre andra kvadranten och upptäcka människor, blickar och gester.
Prata om multitasking!
Uppdateringen visade sig vara en framgång.
När jag frågade "Vad levererar Daxdi?" svarade den virtuella roboten med ”Labsbaserade, oberoende recensioner av de senaste produkterna och tjänsterna.” Det var bara 46 procent säkert i sitt svar - kanske för att jag utelämnade ".com" -delen - men det behövde inte oroa sig.
Denna enkla demo är barnspel jämfört med sofistikerade kommersiella robotar som Temi eller finoptimerade kommersiella röstassistenter som Siri eller Alexa.
Men liknande demos kan laddas ner från internet, installeras på Jetson Xavier NX och anpassas, så att alla med grundläggande programmeringskunskaper och några hundra reservdollar kan ta sig in i intelligenta roboters värld.