Kompjûters, Ynformaasjetechnology
Moderne kompjûter fyzje. Taken en kompjûter fyzje technology. Programming Computer Vision yn Python
Hoe te learen in kompjûter te begripen wat is ôfbylde yn de foto of foto? Dat liket simpel, mar foar in kompjûter is dit in matriks besteande út nullen en lju út dêr't jo wolle úttreksel wichtige ynformaasje.
Wat is kompjûter fisy? It is de mooglikheid om te "sjen" jo kompjûter
Vision - is in wichtige boarne fan ynformaasje foar de persoan mei help fan it, wy krije, neffens ferskate rûzings, fan 70 oant 90% fan alle ynformaasje. En, fansels, as wy wolle meitsje in slimme auto, wy moatte útfiere deselde feardichheden en kompjûter.
It probleem fan 'e kompjûter fisy kin steld wurde frij dúdlik. Wat is "sjen"? It wurdt begrepen dat wêr't der krekt troch sykjen. Dat konkludearre de ferskillen fan de kompjûter fisy en minsklik fyzje. Vision foar ús - it is in boarne fan kennis oer de wrâld, en ek as boarne fan metrike ynformaasje - dat is de mooglikheid om te ferstean de ôfstannen en maten.
Rdfa kernel image
Looking op de foto, kinne wy omskriuwe dat troch in oantal attributen, sa to sprekken, te extract semantyske ynformaasje.
Bygelyks, op syk nei dizze foto, kinne wy sizze, dat it is bûtenlucht. Wat is de stêd ferkear. Dat der binne auto 's. kinne wy riede, dat dit is Súd-East-Aazje op de konfiguraasje fan it gebou te Londen. It portret fan Mao Zedong begripe dat dit is Beijing, en as immen seach live video of sels hie der west, soe riede dat dit de ferneamde Tiananmen Square.
Wat kinne wy sizze mear oer de foto, yette sjen meije? Wy kinne identifisearje objekten yn de ôfbylding, om te sizzen, dat der minsken hjir tichter - stek. Hjir Umbrellas, dat gebou syn affysjes. Dat binne foarbylden fan klassen is tige wichtich foarwerpen, dy't binne dwaande mei sykjen nei it momint.
Noch altyd kinne wy leare pear fan de funksjes of attributen fan objekten. Bygelyks, hjir kinne wy fêststelle dat dit is net in portret fan in gewoane Sineesk, nammentlik, Mao Zedong.
Neffens it reau kin bepaald wurde dat it om in ridende foarwerp, en it is dreech, dat is net misfoarme ûnder de beweging. Oer flaggen kin sein dat it foarwerpen, se binne ek yn beweging, mar se binne net hurd, voortdurend misfoarme. En yn 'e sêne is der de wyn, dat kin bepaald wurde troch it ûntwikkeljen fan flaggen, en kin sels bepale de rjochting fan' e wyn, bygelyks, is it waait fan links nei rjochts.
De ôfstannen en de lingten in kompjûter fisy
Hiel wichtich is it metryk ynformaasje oer kompjûter fyzje wittenskip. Dat is alle soarten fan ôfstannen. Bygelyks, foar de rover is foaral fan belang omdat de teams binne fan de Ierde likernôch 20 minuten en antwurd safolle. Accordingly, de link dêr en werom - 40 minuten. En as wy meitsje in plan foar beweging kommando fan 'e ierde, jimme moatte rekken mei hâlde.
Mei sukses yntegrearre de technyk fan de kompjûter fisy yn fideospultsjes. Neffens de fideo, kinne jo bouwe trijediminsjonale modellen fan foarwerpen, minsken, en foto 's op de brûker kin weromsette op de trijediminsjonale modellen fan' e stêden. En dan rinne op harren.
kompjûter fyzje - in frijwat breed berik. It is nau ferweve mei ferskate oare wittenskippen. Diel fan kompjûter fyzje It vangt de ôfbylding ferwurkjen gebiet en soms allocates kompjûter fizioen, histoarysk.
Analysis, patroan erkenning - it paad nei it skeppen fan superieure yntelliginsje
Lit ús ûndersykje dy begripen apart.
Image Processing - dat is in gebiet fan algoritmen, wêryn de ynfier en útfier - byld, en wy hawwe him dwaan wat.
image analyse - is it gebiet fan de kompjûter fizioen, dy't him rjochtet op it wurkjen mei de twadiminsjonale byld en meitsje konklúzjes út dit.
Pattern Erkenning - in abstrakt matematysk dissipline dy't erkent gegevens yn de foarm fan Vectors. Dat is, by de yngong - vector en wy hawwe wat te dwaan mei. Dêr't de vector is, wy binne net sa wichtich om te witten.
Kompjûter fisy - dat oarspronklik wie te herstellen de struktuer fan 'e twadiminsjonale ôfbyldings. Hjoed dit gebiet útgroeid ta breder en it kin sa útlein wurde akseptaasje fan al fan it fysike foarwerpen wêrtroch't, basearre op de ôfbylding. Dat wol sizze, it is de taak fan keunstmjittige yntelliginsje.
Yn parallel mei kompjûter fisy yn in folslein oare fjild, yn geodesy, photogrammetry hat evoluearre - in mjitting fan de ôfstân tusken objekten op twadiminsjonale ôfbyldings.
Robots kinne "sjen"
En as lêste - dit is machine fisy. Under de machine fisy betsjut in fizioen fan robots. Dat is it beslút fan guon produksje problemen. Wy kinne sizze dat kompjûter fisy - is ien grut wittenskip. It kombinearret guon fan de oare wittenskip diel. En doe't de computer fisy krijt eltse bepaalde applikaasje, oergiet yn in masine fisy.
Kompjûter fyzje regio hat in massa fan praktyske tapassings. It is ferbûn mei de automatisearring fan de produksje. By de bedriuwen wurden effisjinter te ferfangen hânwurk troch masine. De masine niet moe, net sliepe, se hie ûnregelmjittige wurk roaster, sy is ree om mei te wurkjen 365 dagen yn it jier. Sa, mei help fan de masine wurk, wy kinne krije in garandearre resultaat op in bepaalde tiid, en it is hiel nijsgjirrich. Alle taken hawwe in dúdlike gebrûk foar computer fyzje systemen. En der is neat better as te sjen de resultaten fuortendaliks op de foto allinnich yn de berekkening poadium.
Op de drompel fan 'e wrâld fan' e keunstmjittige yntelliginsje
Plus it gebiet - it is hurd! In wichtich part fan 'e harsens ferantwurdlik foar fisy, en it wurdt dat as jo leare jo kompjûter mei "sjen", dat is, de folsleine gebrûk computer fisy, it is ien fan de doelstellings fan folsleine keunstmjittige yntelliginsje. As wy kinne oplosse it probleem op 'e minsklike nivo, net wierskynlik oan it selde tiid, sille wy oplosse it probleem fan AI. Dat is hiel goed! Of net hiel goed, as jo sjogge, "Terminator 2".
Wêrom is fisy - it is dreech? Omdat it byld fan deselde foarwerp kin ferskille fierders sterk ôfhinklik fan eksterne faktoaren. Ofhinklik fan it foarwerp fan observaasje punten sjogge oars.
Bygelyks, ien en deselde figuer, nommen út ferskillende hoeken wei. En wat is meast nijsgjirrich yn de figuer kin ien each, twa eagen en in heal. En ôfhinklik fan 'e kontekst (as dit byld fan' e minske yn in shirt mei skildere eagen), it each kin mear as twa.
De kompjûter noch net begripe, mar it "sjocht"
In oare faktor dy't makket dat it dreech - it is de ferljochting. Deselde sêne mei ferskillende ferljochting sil sjen oars. foarwerp grutte kin fariearje. Boppedat, de objekten fan eltse klasse. Hoe kinne je sizze oer in man dy't syn hichte fan 2 meter? Neat. Minsklik groei en kin wêze 2.3 m, en 80 sm. Krekt as by oare typen fan objekten, lykwols, binne foarwerpen fan deselde klasse.
Benammen libbene foarwerpen ûndergean in ferskaat oan stammen. Hair minsken, sporters, bisten. Look at foto fan hynders rinne, bepale wat der bart mei har mane en sturt is gewoanwei ûnmooglik. In oerlaapjende objekten yn in byld? As jo triuwe lit, in kompjûter byld, sels de machtichste masine fine muoite te jaan rjochts beslút.
Next view - it is een disguise. Guon foarwerpen, bisten masquerading as it miljeu, en heel kinstige. En deselde plakken en kleurplaten. Lykwols, wy sjogge se, hoewol net altiten fan fierrens.
In oar probleem - de beweging. Objekten yn beweging ûnfoarstelbere ûndergeane deformation.
In protte fan 'e objekten binne hiel fariabel. Hjir, bygelyks, yn de twa foto ûnder 'e objekten fan' e "stoel".
En op dizze kinne jo sitte. Mar om te learen fan in masine, sa dat de ferskillende dingen yn foarm, kleur, materiaal, alles is in foarwerp "stoel" - is hiel dreech. Dit is de útdaging. Om yntegrearje metoaden fan kompjûter fisy - is te learen in masine om te begripen, analysearjen, spekulearje.
Yntegraasje fan kompjûter fisy yn ferskate platfoarms
De massa fan de kompjûter fisy begûn te kringen mear yn 2001, doe't hy makke de earste gesicht detector. We makken der twa skriuwers: Viola, Jones. It wie de earste fluch en betrouber genôch algoritme, dy't oantoand de macht fan 'e masine learen metoaden.
No kompjûter fisy hawwe genôch nije praktyske tapassings - erkenning fan it minsklik gesicht.
Mar te werkennen de man as yn 'e films - willekeurig hoeken, ferskillende ferljochting betingsten - it is ûnmooglik. Mar te lossen it probleem, of men dat ferskate minsken mei ferskillende ferljochting of yn in oare pose, ek as yn 'e foto yn' e paspoart, it is mooglik mei in hege mjitte fan fertrouwen.
in paspoart photo easken foar in grut part te tankjen oan it skaaimerk fan it gesicht erkenning algoritmen.
Bygelyks, as jo bygelyks in fries paspoart, yn guon moderne fleanfjilden, kinne jo gebrûk meitsje fan de automatyske paspoart kontrôle systeem.
Unsolved probleem fan de kompjûter fisy - de mooglikheid om werkenne elke tekst
Miskien immen brûkt OCR systeem. Ien fan dy - een Fine lêzer, is tige populêr yn RuNet systeem. Der binne in soad foarmen dêr't jo folje de gegevens, ze perfect skend, de ynformaasje wurdt erkend troch it systeem hiel goed. Mar by elke tekst yn 'e foto de sitewaasje is folle slimmer. Dit probleem noch altyd bliuwt Unsolved.
Games involving kompjûter fizioen, motion capture
Aparte grut gebiet - is de skepping fan trijediminsjonale modellen en motion capture (dat is frij mei súkses útfierd yn kompjûter games). It earste programma, dat brûkt kompjûter fisy - in systeem fan de ynteraksje mei de kompjûter mei help fan gebearten. Doe't it waard makke it wie in soad dingen iepen.
De algoritme is ûntwurpen frij gewoan, mar te ynstelle it duorre te meitsjen in generator fan syntetyske bylden fan minsken te krijen in miljoen foto. Supercomputer mei harren te kiezen de parameters fan de algoritme, dêr't er no wurket goed.
Dat is in miljoen ôfbyldings en wike Nammeromten Wurd supercomputer tiid mooglik te meitsjen in algoritme dat verbruikt 12% fan it fermogen fan ien prosessor en makket it mooglik in persoan te ûnderkennen de posysje yn echte tiid. Dizze Microsoft Kinect systeem (2010).
Sykje nei printsjes troch de ynhâld kinne jo te laden foto oan it systeem, en de resultaten dêrfan sil jaan alle foto mei deselde ynhâld en makke út deselde hoeke.
Foarbylden fan kompjûter fyzje: trijediminsjonale en twadiminsjonale kaarten wurde no makke mei. Kaarten foar de navigaasjetechnyk auto wurde regelmjittich bywurke neffens de DVR.
Der is in databank mei miljarden Geotagged foto. By it ynladen fan de foto yn de database kinne jo bepale wêr it makke, en sels mei wat perspektyf. Fansels, op betingst dat it plak is populêr genôch dat om ien kear de toeristen en makke in tal foto fan it gebiet west hawwe dêr.
robots binne oeral
Robotics oan de hjoeddeiske tiid, oeral, sûnder it yn hokker wize. No binne der reauwen dy't hawwe spesjale kamera dy't werkenne fuotgongers en boerden te zenden kommando om de bestjoerder (dit op in wize in kompjûter programma te besjen, helpt de automobilist). En der is in folslein automatisearre robotic vehicles, mar se kinne net betrouwe allinne op 'e fideo kamera systeem sûnder it brûken fan in grut bedrach fan de oanfoljende ynformaasje.
Moderne kamera - dit is in analoge camera obscura
Lit ús prate oer de digitale ôfbylding. Moderne digitale kamera binne oardere op it prinsipe fan de kamera obskura. Allinne yn stee fan it gat troch hokker ljocht komt yn de bondel en foarsei linksôf de achterkant muorre fan 'e keamer fan it ûnderwerp circuit, wy hawwe in spesjale optysk systeem neamd de lens. Syn objekt is te sammeljen in grut ljocht beam en konvertearre wurde sadat alle rays trochjûn troch in firtuele punt yn oarder te krijen de projeksje en foarmje in byld op film of matrix.
Moderne digitale kamera (matriks) is gearstald út yndividuele eleminten - pixels. Elts pixel kin mjitte de enerzjy fan ljocht dat ynsidint op 'e pixel totaal, en dêrby ien output nûmer. Dêrom, yn in digitale kamera, wy krije ynstee fan it byld brightness set ljocht mjittingen, fongen yn in inkele piksel - de kompjûter fjild fan de werjefte. Dêrom, doe't it byld we sjogge net streamend linen en heldere kontoeren, en in roaster fan kleurde fjilden yn ferskillende kleuren - pixels.
Hjirûnder sjogge jo de earste digitale byld yn 'e wrâld.
Mar yn dizze foto is it net? Kleur. Wat is kleur?
Psychologyske belibjen fan kleur
Kleur - dat is wat wy sjogge. De kleur fan 'e ien en itselde ding foar mins en katten sille wêze oars. Om't wy (minsken) en dierlik optyske systeem - it gesicht is oars. Dêrom, de kleur - it is psychologyske kwaliteit fan ús fisy dy't optreedt as observearjen fan objekten en ljocht. En net in fysike eigendom fan it objekt en it ljocht. Kleur - is it gefolch fan 'e ynteraksje fan ljocht ûnderdielen, en it toaniel fan ús byldzjende systeem.
Programming Computer Fisy yn Python mei help fan biblioteken
As jo hawwe besletten om ûntliene serieus yn 'e stúdzje fan' e kompjûter fisy, moatte fuortendaliks rieden op in oantal swierrichheden, dy wittenskip is net de maklikste en ferberget in oantal falkûlen. Mar "Programming Computer Vision op de Python" it auteurskip fan Jan Erik solema - in boek dat haadlinen alle meast simpele taal. Hjir silst e kunde komme mei de metoaden fan erkenning fan ferskate objekten yn 3D, leare om te wurkjen mei de stereo ôfbylding, firtuele werklikheid en in protte oare tapassings fan kompjûter fyzje. Yn it boek binne genôch foarbylden yn Python. Mar de taljochtings wurde presintearre, sa te sizzen, generalisearre, dus as net te overload te folle ûndersyk en hurde gegevens. Wurkje geskikt foar studinten, amateurs, en leafhawwers. Download dit boek en oaren oer kompjûter fyzje (PDF-formaat) kin wêze yn it netwurk.
Op it stuit, binne der iepen boarne bibleteek fan kompjûter fisy Algorithmen en ôfbylding ferwurkjen en numerike algoritmen OpenCV. It wurdt útfierd op de measte moderne programmearring talen, is iepen boarne. As wy prate oer kompjûter fizioen Python brûkt as programmeartaal, soks hat ek de stipe fan 'e biblioteek, neist, it is oanienwei yn ûntwikkeling en hat in grutte mienskip.
It bedriuw "Microsoft" biedt syn tsjinsten Api-by steat om te trenen de neural netwurk om te wurkjen mei bylden fan minsken. Dêr is ek de mooglikheid om te passen kompjûter fizioen Python brûkt as programmeartaal.
Similar articles
Trending Now