Anonim

Čo sú API na rozpoznávanie obrázkov a čo pre vás môžu urobiť? V tomto článku sa objasní, čo je rozpoznávanie obrázkov, čo robí API a ako to môže pomôcť vám alebo vašej firme získať viac z internetu. Rozpoznávanie obrázkov má obrovský potenciál pre podniky a pre individuálnych používateľov internetu so zrakovým postihnutím.

Čo je API na rozpoznávanie obrázkov?

Rozpoznávanie obrázkov je miesto, kde softvér zistí charakteristiky obrázka a presne ho roztriedi. Napríklad, ak odovzdáte obrázok Ferrari 458 do rozhrania API na rozpoznávanie obrázkov, malo by sa zistiť, že ide o auto a že je (alebo by malo byť) červené. V závislosti od rozhrania API môže byť možná ďalšia klasifikácia v závislosti od typu obrázka, ktorý používate.

Môže sa to zdať skutočne jednoduché - ľudia sa môžu pozrieť na obrázok a povedať vám, na čo je to obrázok bez toho, aby sa o to väčšinu času snažili - bol to však ťažký problém naučiť počítače riešiť. Veľa práce sa venovalo tomu, ako počítač dokáže porozumieť tomu, čo vyzerá, a urobili sme veľké pokroky, od schopnosti vykonávať spätné vyhľadávanie obrázkov až po slávnu sieť Deep Dream spoločnosti Google.

Rozhranie API je aplikačné programové rozhranie. Je to v podstate prostredník medzi programovými rutinami, ktorý hovorí jednému prvku, ako pracovať s iným, alebo poskytuje nástroje, ktoré potrebujú na vykonanie funkcie. Existuje niekoľko typov rozhraní API, ktoré môžu pomocou rôznych programovacích jazykov dosiahnuť rôzne ciele. V tejto súvislosti je API na rozpoznávanie obrázkov nástroj, ktorý môžete použiť na prístup k hlbokej schopnosti niektorých komerčných systémov na rozpoznávanie obrázkov.

Na rozpoznávanie obrázkov potrebujete veľa výpočtového výkonu. Potrebujete množstvo údajov a silu na ich interpretáciu. Väčšina používateľov jednoducho nemá obrovské prostriedky na zostavenie vlastného stroja na hlboké vzdelávanie. Veľké mená ako Google Vision API, Microsoft Face Face, ImageNet a ďalšie majú také počítače a umožňujú k nim prístup cez API, a to zadarmo alebo za poplatok. Umožní to firmám všetkých veľkostí prístup k tomuto výkonu a výsledkom bude získanie nových skúseností.

Ako zmení rozpoznávanie obrázkov naše skúsenosti s internetom?

Rôzni používatelia internetu získajú z rozpoznávania obrázkov rôzne výhody. Pozrime sa na hypotetického vlastníka webových stránok a hypotetického používateľa, aby sme videli, ako môžu mať výhody obe strany.

Obchodné výhody rozpoznávania obrazu

Povedzme napríklad, že prevádzkujete samopredajný portál podobný Etsy alebo zoznamovacej webovej stránke. Chcete spravovať kvalitu a vhodnosť všetkých obrázkov odovzdaných používateľmi. Chcete zablokovať všetky obrázky pre dospelých alebo nevhodné a usporiadať ich do príslušných kategórií, ale nemôžete to urobiť všetko ručne.

Zadajte rozhranie API na rozpoznávanie obrázkov. Pomocou rozhrania API spolu s vhodným strojom na rozpoznávanie obrázkov môžete naskenovať každý jednotlivý obrázok a definovať ho podľa stanovených kritérií. Môžete teda vyhľadať v knižnici obrázkov neslušné obrázky a odstrániť ich. Môžete skenovať obrázky a triediť tie, ktoré obsahujú jedlo do kategórie „jedlo“ a pletené výrobky do kategórie „vlnené“. Keď rozhraniu API poviete, čo má robiť, proces je automatizovaný.

Sú tu tiež príležitosti na rozšírenú realitu a interaktívny obraz a video. Rozpoznávanie obrázkov môžete použiť na to, aby program rozpoznal objekty v reálnom svete. Môžete napríklad odfotiť pár tenisiek, ktoré má niekto na ulici. Ak program rozpozná tenisky, obrázok by sa mohol zväčšiť pomocou odkazu na ich zakúpenie pre seba. To prinesie úžitok podniku (ponúka okamžitú predajnú príležitosť) a prináša úžitok užívateľovi (teraz dostane to, čo chce).

Výhody rozpoznávania obrázkov pre používateľa

Príklad tenisky vyššie je iba jedným z očividných spôsobov, ako môžu používatelia ťažiť z rozpoznávania obrázkov. Rozšírená realita znamená, že by sme mohli okamžite získať prístup k recenziám, informáciám o cenách a množstvu údajov jednoducho tým, že urobíme fotografiu produktu. To poskytuje používateľom obrovské množstvo údajov, ktoré im pomáhajú pri rozhodovaní o kúpe.

Mark Zuckerberg vo svojom príhovore začiatkom tohto roka zhrnul často prehliadanú výhodu rozpoznávania obrazu. Predstavil si API na rozpoznávanie obrázkov, ktoré spolupracovalo s nevidiacimi alebo slabozrakými ľuďmi, ktorí mohli „prečítať“ obrázok a popísať, čo vidí nahlas. To by mohlo mať masívne následky pre užívateľov internetu so zníženou schopnosťou - alebo, s rozšírenou realitou, v reálnom svete nejaký čas nadol.

Rozpoznávanie obrazu tiež hrá úlohu v bezpečnosti vozidla. Nové technológie autonómneho brzdenia a zabránenia zrážkam fungujú podobne ako API, o ktorých sme hovorili. Skenujú a posudzujú obrázky mnohokrát za sekundu, aby vás a vaše auto boli na cestách v bezpečí. Táto technológia hovorí autonómnym automobilom, čo sa okolo nich tiež nachádza.

Rozhrania API na rozpoznávanie obrázkov samy o sebe nebudú znamenať revolúciu v našom internetovom prostredí. Pracujú spolu s existujúcou technológiou a pridávajú vrstvu interakcie a ponorenia do sveta, ktorý vidíme. Aj keď príklady tohto článku sú obmedzené, existuje tu obrovský potenciál pre hry, filmy, automobilový priemysel, maloobchod, zábavu a akékoľvek priemyselné odvetvie. Toto je len začiatok toho, čo môžu inteligentné systémy dosiahnuť!

Čo sú apis na rozpoznávanie obrázkov a čo pre vás môžu urobiť?