Daxdi now accepts payments with Bitcoin

Kaj je računalniški vid? | Daxdi

Ko si ogledate naslednjo sliko, vidite ljudi, predmete in zgradbe.

Obudi spomine na pretekle izkušnje, podobne situacije, s katerimi ste se že sre?evali.

Množica je obrnjena v isto smer in drži telefone, kar vam pove, da je to nekakšen dogodek.

Oseba, ki stoji blizu kamere, ima majico, ki namiguje, kakšen bi lahko bil dogodek.

Ko si ogledujete druge majhne podrobnosti, lahko na sliki ugotovite veliko ve? informacij.

Foto Joshua J.

Cotten na Unsplash

Toda za ra?unalnik je ta slika - tako kot vse slike - niz slikovnih pik, števil?ne vrednosti, ki predstavljajo odtenke rde?e, zelene in modre.

Eden od izzivov, s katerimi so se ra?unalniški znanstveniki spopadali že od petdesetih let prejšnjega stoletja, je bil ustvariti stroje, ki lahko osmišljajo fotografije in videoposnetke kot ljudje.

Podro?je ra?unalniški vid je postalo eno najbolj vro?ih podro?ij raziskav na podro?ju ra?unalništva in umetne inteligence.

Desetletja kasneje smo mo?no napredovali pri ustvarjanju programske opreme, ki lahko razume in opisuje vsebino vizualnih podatkov.

Odkrili pa smo tudi, kako dale? moramo iti, preden lahko razumemo in ponovimo eno temeljnih funkcij ?loveških možganov.

Kratka zgodovina ra?unalniškega vida

Leta 1966 sta Seymour Papert in Marvin Minsky, dva pionirja umetne inteligence, za?ela projekt Summer Vision, dvomese?ni 10-?lanski trud za ustvarjanje ra?unalniškega sistema, ki bi lahko prepoznaval predmete na slikah.

Za izvedbo naloge je moral ra?unalniški program dolo?iti, katere piksle pripadajo kateremu predmetu.

To je težava, ki jo sistem ?loveškega vida, ki ga poganja naše ogromno znanje o svetu in milijarde let evolucije, zlahka reši.

Toda za ra?unalnike, katerih svet je sestavljen samo iz števil, je to zahtevna naloga.

V ?asu tega projekta je bila prevladujo?a veja umetne inteligence simboli?na umetna inteligenca, znana tudi kot umetna inteligenca, ki temelji na pravilih: programerji so ro?no dolo?ili pravila za zaznavanje predmetov na slikah.

Toda težava je bila v tem, da so se predmeti na slikah lahko pojavili z razli?nih zornih kotov in v razli?ni osvetlitvi.

Predmet se lahko prikaže v razli?nih okoljih ali pa ga drugi objekti delno zaprejo.

Vsak od teh scenarijev ustvarja razli?ne vrednosti slikovnih pik in prakti?no je nemogo?e ustvariti ro?na pravila za vsakega od njih.

Projekt Summer Vision seveda ni prišel dale? in je dal omejene rezultate.

Nekaj ??let kasneje, leta 1979, je japonski znanstvenik Kunihiko Fukushima predlagal neokognitron, sistem ra?unalniškega vida, ki temelji na raziskavah nevroznanosti na ?loveški vidni skorji.

?eprav Fukušimin neokognitron ni opravil nobenih zapletenih vizualnih nalog, je postavil temelje za enega najpomembnejših dogodkov v zgodovini ra?unalniškega vida.

Revolucija globokega u?enja

V osemdesetih letih je francoski ra?unalnikar Yan LeCun predstavil konvolucijsko nevronsko mrežo (CNN), sistem umetne inteligence, ki ga je navdihnil Fukušimin neokognitron.

CNN obsega ve? plasti umetnih nevronov, matemati?nih komponent, ki približno posnemajo delovanje njihovih bioloških kolegov.

Ko konvolucijska nevronska mreža obdela sliko, vsaka njena plast iz pikslov izvle?e posebne zna?ilnosti.

Prva plast zazna zelo osnovne stvari, kot so navpi?ni in vodoravni robovi.

Ko se pomaknete globlje v nevronsko mrežo, plasti zaznajo bolj zapletene lastnosti, vklju?no z vogali in oblikami.

Kon?ne plasti CNN zaznajo dolo?ene stvari, kot so obrazi, vrata in avtomobili.

Izhodna plast CNN ponuja tabelo numeri?nih vrednosti, ki predstavljajo verjetnost, da je bil na sliki odkrit dolo?en predmet.

Vrhnje plasti nevronskih mrež zaznavajo splošne zna?ilnosti; globlje plasti zaznajo dejanske predmete (Vir: arxiv.org)

Levonove konvolucijske nevronske mreže so bile briljantne in so obetale veliko, vendar jih je zadrževal resen problem: uglaševanje in njihova uporaba je zahtevala ogromne koli?ine podatkov in ra?unalniških virov, ki takrat niso bili na voljo.

CNN-ji so s?asoma našli komercialno uporabo na nekaj omejenih podro?jih, kot so ban?ništvo in poštne storitve, kjer so jih uporabljali za obdelavo ro?no napisanih številk in ?rk na kuvertah in ?ekih.

Toda na podro?ju zaznavanja predmetov so se umaknili in se umaknili drugim tehnikam strojnega u?enja, kot so podporni vektorski stroji in naklju?ni gozdovi.

Leta 2012 so raziskovalci umetne inteligence iz Toronta razvili AlexNet, konvolucijsko nevronsko mrežo, ki je prevladovala v priljubljenem tekmovanju za prepoznavanje slik ImageNet.

Zmaga AlexNeta je pokazala, da je glede na vse ve?jo razpoložljivost podatkov in ra?unalniških virov morda ?as, da ponovno preu?imo CNN.

Dogodek je obudil zanimanje za CNN in sprožil revolucijo v globokem u?enju>, veji strojnega u?enja, ki vklju?uje uporabo ve?plastnih umetnih nevronskih mrež.

Zahvaljujo? napredku konvolucijskih nevronskih mrež in poglobljenemu u?enju od takrat je ra?unalniški vid skokovito narasel.

Aplikacije ra?unalniškega vida

Številne aplikacije, ki jih uporabljate vsak dan, uporabljajo tehnologijo ra?unalniškega vida.

Google ga uporablja za iskanje predmetov in prizorov - recimo, "pes" ali "son?ni zahod" - v vaši knjižnici slik.

Druga podjetja uporabljajo ra?unalniški vid za izboljšanje slik.

En primer je Adobe Lightroom CC, ki uporablja algoritme strojnega u?enja za izboljšanje podrobnosti pove?anih slik.

Tradicionalno pove?avo uporablja tehnike interpolacije za barvanje pove?anih površin, Lightroom pa z ra?unalniškim vidom zaznava predmete na slikah in izostri njihove lastnosti med približevanjem.

Eno podro?je, ki je zaradi napredka ra?unalniškega vida zaznamovalo izjemen napredek, je prepoznavanje obraza.

Apple za odklepanje iPhonov uporablja algoritme za prepoznavanje obraza.

Facebook s prepoznavanjem obrazov zazna uporabnike na slikah, ki jih objavite v spletu (?eprav niso vsi oboževalci).

Na Kitajskem številni trgovci zdaj ponujajo tehnologijo pla?evanja s prepoznavanjem obrazov, s ?imer svoje stranke razbremenijo potrebe po posegu po svojih žepih.

Napredek pri prepoznavanju obraza pa je zaskrbljen tudi pri zagovornikih zasebnosti in pravic, zlasti ker ga vladne agencije v razli?nih državah uporabljajo za nadzor.

Moderiranje vsebine je še ena pomembna aplikacija za ra?unalniški vid.

Podjetja, kot je Facebook, morajo vsak dan pregledati milijarde objav in odstraniti slike in videoposnetke, ki vsebujejo nasilje, ekstremizem ali pornografijo.

Ve?ina družabnih omrežij uporablja algoritme za globoko u?enje za analizo objav in ozna?evanje tistih, ki vsebujejo prepovedane vsebine.

Priporo?ajo ga naši uredniki

S prehodom na bolj specializirana podro?ja ra?unalniški vid hitro postaja nepogrešljivo orodje v medicini.

Algoritmi globokega u?enja kažejo izjemno natan?nost pri analizi medicinskih slik.

Bolnišnice in univerze uporabljajo ra?unalniški vid za napovedovanje razli?nih vrst raka s preiskavami rentgenskih slik in slik z magnetno resonanco.

Tudi samovoze?i avtomobili se pri razumevanju okolice mo?no zanašajo na ra?unalniški vid.

Algoritmi za poglobljeno u?enje analizirajo video vire s kamer, nameš?enih v vozilu, in zaznajo ljudi, avtomobile, ceste in druge predmete, da avtomobilu pomagajo pri navigaciji po okolju.

Meje ra?unalniškega vida

Trenutni sistemi ra?unalniškega vida so primerni za razvrš?anje slik in lokalizacijo predmetov na fotografijah, ?e so usposobljeni na dovolj primerih.

Toda v svojem bistvu se algoritmi globokega u?enja, ki poganjajo aplikacije za ra?unalniški vid, ujemajo z vzorci slikovnih pik.

Nimajo razumevanja, kaj se dogaja na slikah.

Razumevanje odnosov med ljudmi in predmeti v vizualnih podatkih zahteva zdravo pamet in osnovno znanje.

Zato algoritmi ra?unalniškega vida, ki jih uporabljajo omrežja socialnih medijev, lahko zaznajo golo vsebino, vendar se pogosto trudijo, da bi ugotovili razliko med varno goloto (dojenje ali renesan?na umetnost) in prepovedano vsebino, kot je pornografija.

Prav tako je težko, da bi ti algoritmi ugotovili razliko med ekstremisti?no propagando in dokumentarcem o ekstremisti?nih skupinah.

Ljudje lahko izkoristijo svoje ogromno znanje o svetu, da zapolnijo luknje, ko se soo?ijo s situacijo, ki je še niso videli.

Za razliko od ljudi je treba algoritme ra?unalniškega vida natan?no pou?iti o vrstah predmetov, ki jih morajo zaznati.

Takoj, ko njihovo okolje vsebuje stvari, ki odstopajo od primerov usposabljanja, za?nejo delovati neracionalno, na primer ne zaznajo nujnih vozil, parkiranih na ?udnih lokacijah.

Trenutno je edina rešitev za reševanje teh problemov usposabljanje algoritmov umetne inteligence na vedno ve? primerih, v upanju, da bodo dodatni podatki pokrivali vsako situacijo, s katero se bo sre?al umetni inteligenc.

A kot kažejo izkušnje, bodo brez situacijske zavednosti vedno obstajali primeri iz kota - redke situacije, ki zmedejo algoritem umetne inteligence.

Številni strokovnjaki verjamejo, da bomo resni?ni ra?unalniški vid dosegli šele, ko bomo ustvarili umetno splošno inteligenco, umetno inteligenco, ki lahko probleme reši na enak na?in kot ljudje.

Kot v svoji knjigi pravi ra?unalnica in raziskovalka umetne inteligence Melanie Mitchell Umetna inteligenca: vodnik za misle?e ljudi: "Zdi se, da vizualne inteligence ni mogo?e zlahka lo?iti od ostale inteligence, zlasti splošnega znanja, abstrakcije in jezika ...

Poleg tega se lahko zgodi, da znanja, potrebnega za ?loveško vizualno inteligenco ...

ni mogo?e nau?iti iz milijonov slik prenesena s spleta, vendar jo je treba na nek na?in doživeti v resni?nem svetu.

"

Ko si ogledate naslednjo sliko, vidite ljudi, predmete in zgradbe.

Obudi spomine na pretekle izkušnje, podobne situacije, s katerimi ste se že sre?evali.

Množica je obrnjena v isto smer in drži telefone, kar vam pove, da je to nekakšen dogodek.

Oseba, ki stoji blizu kamere, ima majico, ki namiguje, kakšen bi lahko bil dogodek.

Ko si ogledujete druge majhne podrobnosti, lahko na sliki ugotovite veliko ve? informacij.

Foto Joshua J.

Cotten na Unsplash

Toda za ra?unalnik je ta slika - tako kot vse slike - niz slikovnih pik, števil?ne vrednosti, ki predstavljajo odtenke rde?e, zelene in modre.

Eden od izzivov, s katerimi so se ra?unalniški znanstveniki spopadali že od petdesetih let prejšnjega stoletja, je bil ustvariti stroje, ki lahko osmišljajo fotografije in videoposnetke kot ljudje.

Podro?je ra?unalniški vid je postalo eno najbolj vro?ih podro?ij raziskav na podro?ju ra?unalništva in umetne inteligence.

Desetletja kasneje smo mo?no napredovali pri ustvarjanju programske opreme, ki lahko razume in opisuje vsebino vizualnih podatkov.

Odkrili pa smo tudi, kako dale? moramo iti, preden lahko razumemo in ponovimo eno temeljnih funkcij ?loveških možganov.

Kratka zgodovina ra?unalniškega vida

Leta 1966 sta Seymour Papert in Marvin Minsky, dva pionirja umetne inteligence, za?ela projekt Summer Vision, dvomese?ni 10-?lanski trud za ustvarjanje ra?unalniškega sistema, ki bi lahko prepoznaval predmete na slikah.

Za izvedbo naloge je moral ra?unalniški program dolo?iti, katere piksle pripadajo kateremu predmetu.

To je težava, ki jo sistem ?loveškega vida, ki ga poganja naše ogromno znanje o svetu in milijarde let evolucije, zlahka reši.

Toda za ra?unalnike, katerih svet je sestavljen samo iz števil, je to zahtevna naloga.

V ?asu tega projekta je bila prevladujo?a veja umetne inteligence simboli?na umetna inteligenca, znana tudi kot umetna inteligenca, ki temelji na pravilih: programerji so ro?no dolo?ili pravila za zaznavanje predmetov na slikah.

Toda težava je bila v tem, da so se predmeti na slikah lahko pojavili z razli?nih zornih kotov in v razli?ni osvetlitvi.

Predmet se lahko prikaže v razli?nih okoljih ali pa ga drugi objekti delno zaprejo.

Vsak od teh scenarijev ustvarja razli?ne vrednosti slikovnih pik in prakti?no je nemogo?e ustvariti ro?na pravila za vsakega od njih.

Projekt Summer Vision seveda ni prišel dale? in je dal omejene rezultate.

Nekaj ??let kasneje, leta 1979, je japonski znanstvenik Kunihiko Fukushima predlagal neokognitron, sistem ra?unalniškega vida, ki temelji na raziskavah nevroznanosti na ?loveški vidni skorji.

?eprav Fukušimin neokognitron ni opravil nobenih zapletenih vizualnih nalog, je postavil temelje za enega najpomembnejših dogodkov v zgodovini ra?unalniškega vida.

Revolucija globokega u?enja

V osemdesetih letih je francoski ra?unalnikar Yan LeCun predstavil konvolucijsko nevronsko mrežo (CNN), sistem umetne inteligence, ki ga je navdihnil Fukušimin neokognitron.

CNN obsega ve? plasti umetnih nevronov, matemati?nih komponent, ki približno posnemajo delovanje njihovih bioloških kolegov.

Ko konvolucijska nevronska mreža obdela sliko, vsaka njena plast iz pikslov izvle?e posebne zna?ilnosti.

Prva plast zazna zelo osnovne stvari, kot so navpi?ni in vodoravni robovi.

Ko se pomaknete globlje v nevronsko mrežo, plasti zaznajo bolj zapletene lastnosti, vklju?no z vogali in oblikami.

Kon?ne plasti CNN zaznajo dolo?ene stvari, kot so obrazi, vrata in avtomobili.

Izhodna plast CNN ponuja tabelo numeri?nih vrednosti, ki predstavljajo verjetnost, da je bil na sliki odkrit dolo?en predmet.

Vrhnje plasti nevronskih mrež zaznavajo splošne zna?ilnosti; globlje plasti zaznajo dejanske predmete (Vir: arxiv.org)

Levonove konvolucijske nevronske mreže so bile briljantne in so obetale veliko, vendar jih je zadrževal resen problem: uglaševanje in njihova uporaba je zahtevala ogromne koli?ine podatkov in ra?unalniških virov, ki takrat niso bili na voljo.

CNN-ji so s?asoma našli komercialno uporabo na nekaj omejenih podro?jih, kot so ban?ništvo in poštne storitve, kjer so jih uporabljali za obdelavo ro?no napisanih številk in ?rk na kuvertah in ?ekih.

Toda na podro?ju zaznavanja predmetov so se umaknili in se umaknili drugim tehnikam strojnega u?enja, kot so podporni vektorski stroji in naklju?ni gozdovi.

Leta 2012 so raziskovalci umetne inteligence iz Toronta razvili AlexNet, konvolucijsko nevronsko mrežo, ki je prevladovala v priljubljenem tekmovanju za prepoznavanje slik ImageNet.

Zmaga AlexNeta je pokazala, da je glede na vse ve?jo razpoložljivost podatkov in ra?unalniških virov morda ?as, da ponovno preu?imo CNN.

Dogodek je obudil zanimanje za CNN in sprožil revolucijo v globokem u?enju>, veji strojnega u?enja, ki vklju?uje uporabo ve?plastnih umetnih nevronskih mrež.

Zahvaljujo? napredku konvolucijskih nevronskih mrež in poglobljenemu u?enju od takrat je ra?unalniški vid skokovito narasel.

Aplikacije ra?unalniškega vida

Številne aplikacije, ki jih uporabljate vsak dan, uporabljajo tehnologijo ra?unalniškega vida.

Google ga uporablja za iskanje predmetov in prizorov - recimo, "pes" ali "son?ni zahod" - v vaši knjižnici slik.

Druga podjetja uporabljajo ra?unalniški vid za izboljšanje slik.

En primer je Adobe Lightroom CC, ki uporablja algoritme strojnega u?enja za izboljšanje podrobnosti pove?anih slik.

Tradicionalno pove?avo uporablja tehnike interpolacije za barvanje pove?anih površin, Lightroom pa z ra?unalniškim vidom zaznava predmete na slikah in izostri njihove lastnosti med približevanjem.

Eno podro?je, ki je zaradi napredka ra?unalniškega vida zaznamovalo izjemen napredek, je prepoznavanje obraza.

Apple za odklepanje iPhonov uporablja algoritme za prepoznavanje obraza.

Facebook s prepoznavanjem obrazov zazna uporabnike na slikah, ki jih objavite v spletu (?eprav niso vsi oboževalci).

Na Kitajskem številni trgovci zdaj ponujajo tehnologijo pla?evanja s prepoznavanjem obrazov, s ?imer svoje stranke razbremenijo potrebe po posegu po svojih žepih.

Napredek pri prepoznavanju obraza pa je zaskrbljen tudi pri zagovornikih zasebnosti in pravic, zlasti ker ga vladne agencije v razli?nih državah uporabljajo za nadzor.

Moderiranje vsebine je še ena pomembna aplikacija za ra?unalniški vid.

Podjetja, kot je Facebook, morajo vsak dan pregledati milijarde objav in odstraniti slike in videoposnetke, ki vsebujejo nasilje, ekstremizem ali pornografijo.

Ve?ina družabnih omrežij uporablja algoritme za globoko u?enje za analizo objav in ozna?evanje tistih, ki vsebujejo prepovedane vsebine.

Priporo?ajo ga naši uredniki

S prehodom na bolj specializirana podro?ja ra?unalniški vid hitro postaja nepogrešljivo orodje v medicini.

Algoritmi globokega u?enja kažejo izjemno natan?nost pri analizi medicinskih slik.

Bolnišnice in univerze uporabljajo ra?unalniški vid za napovedovanje razli?nih vrst raka s preiskavami rentgenskih slik in slik z magnetno resonanco.

Tudi samovoze?i avtomobili se pri razumevanju okolice mo?no zanašajo na ra?unalniški vid.

Algoritmi za poglobljeno u?enje analizirajo video vire s kamer, nameš?enih v vozilu, in zaznajo ljudi, avtomobile, ceste in druge predmete, da avtomobilu pomagajo pri navigaciji po okolju.

Meje ra?unalniškega vida

Trenutni sistemi ra?unalniškega vida so primerni za razvrš?anje slik in lokalizacijo predmetov na fotografijah, ?e so usposobljeni na dovolj primerih.

Toda v svojem bistvu se algoritmi globokega u?enja, ki poganjajo aplikacije za ra?unalniški vid, ujemajo z vzorci slikovnih pik.

Nimajo razumevanja, kaj se dogaja na slikah.

Razumevanje odnosov med ljudmi in predmeti v vizualnih podatkih zahteva zdravo pamet in osnovno znanje.

Zato algoritmi ra?unalniškega vida, ki jih uporabljajo omrežja socialnih medijev, lahko zaznajo golo vsebino, vendar se pogosto trudijo, da bi ugotovili razliko med varno goloto (dojenje ali renesan?na umetnost) in prepovedano vsebino, kot je pornografija.

Prav tako je težko, da bi ti algoritmi ugotovili razliko med ekstremisti?no propagando in dokumentarcem o ekstremisti?nih skupinah.

Ljudje lahko izkoristijo svoje ogromno znanje o svetu, da zapolnijo luknje, ko se soo?ijo s situacijo, ki je še niso videli.

Za razliko od ljudi je treba algoritme ra?unalniškega vida natan?no pou?iti o vrstah predmetov, ki jih morajo zaznati.

Takoj, ko njihovo okolje vsebuje stvari, ki odstopajo od primerov usposabljanja, za?nejo delovati neracionalno, na primer ne zaznajo nujnih vozil, parkiranih na ?udnih lokacijah.

Trenutno je edina rešitev za reševanje teh problemov usposabljanje algoritmov umetne inteligence na vedno ve? primerih, v upanju, da bodo dodatni podatki pokrivali vsako situacijo, s katero se bo sre?al umetni inteligenc.

A kot kažejo izkušnje, bodo brez situacijske zavednosti vedno obstajali primeri iz kota - redke situacije, ki zmedejo algoritem umetne inteligence.

Številni strokovnjaki verjamejo, da bomo resni?ni ra?unalniški vid dosegli šele, ko bomo ustvarili umetno splošno inteligenco, umetno inteligenco, ki lahko probleme reši na enak na?in kot ljudje.

Kot v svoji knjigi pravi ra?unalnica in raziskovalka umetne inteligence Melanie Mitchell Umetna inteligenca: vodnik za misle?e ljudi: "Zdi se, da vizualne inteligence ni mogo?e zlahka lo?iti od ostale inteligence, zlasti splošnega znanja, abstrakcije in jezika ...

Poleg tega se lahko zgodi, da znanja, potrebnega za ?loveško vizualno inteligenco ...

ni mogo?e nau?iti iz milijonov slik prenesena s spleta, vendar jo je treba na nek na?in doživeti v resni?nem svetu.

"

Daxdi

pakapuka.com Cookies

V pakapuka.com uporabljamo piškotke (tehnične in profilne piškotke, tako naše kot tretje osebe), da vam zagotovimo boljšo spletno izkušnjo in vam pošljemo prilagojena spletna komercialna sporočila v skladu z vašimi željami. Če izberete nadaljevanje ali dostop do kakršne koli vsebine na naši spletni strani, ne da bi prilagodili svoje izbire, se strinjate z uporabo piškotkov.

Za več informacij o naši politiki piškotkov in o tem, kako zavrniti piškotke

dostop do tega.

Nastavitve

Nadaljuj