Miks tehisintellekti pildigeneraatorid kätega võitlevad?

Miks tehisintellekti pildigeneraatorid kätega võitlevad?
Teiesugused lugejad aitavad MUO-d toetada. Kui teete ostu meie saidil olevate linkide abil, võime teenida sidusettevõtte komisjonitasu. Loe rohkem.

AI-generaatorid arenevad meie silme all hirmuäratava kiirusega, kuid neil on endiselt vigu. AI-piltidelt kummaliste detailide märkamine on tegelikult üsna naljakas. Seetõttu muutusid Midjourney käed kuumaks teemaks, mis on paljudes mootorites tavaline probleem.





Teeme lahti, miks käed tehisintellekti pildigeneraatoritele nii palju väljakutseid esitavad. Nende programmeerijad juba parandavad seda meemi väärilist probleemi, kuid huvitav on mõelda, kuidas tehisintellekt õpib, rääkimata sellest, mis selle teele jääb.





PÄEVA VIDEO MAKKEUSE SISUGA JÄTKAMISEKS KERIMISE

Miks tehisintellekti loodud käed segasid?

Igaüks, kes kasutab piltide loomiseks tehisintellekti mootoreid, võis märgata, et käed tulevad harva õigesti välja, kuid probleem pööras tähelepanu, kui Twitteris ilmus hunnik 'fotosid'.





Lähemal uurimisel andsid inimeste veidrad käed need AI-ga loodud piltidena välja. Asjaolu, et see oli Midjourney kätekatse, muutis olukorra huvitavamaks.

Üks parimaid tehisintellekti mootoreid ei suutnud inimkäte keerukustega toime tulla, nii et Midjourney ja tema konkurentide võimalused pandi proovile. Tõsi küll, isegi DALL-E on altid ebareaalsetele sõrmedele ja küüntele.



kuidas järjehoidjaid Chrome'is varundada
  inimestest, kes DALL-E-s kätt suruvad

Hüpe oli ebaproportsionaalne, kuna tehisintellekti loodud käed on alati olnud probleemiks, kuid lisatähelepanu ajendas siiski Midjourney v5, et täiustada versiooni 4 .

Uue versiooni eesmärk oli täiustada käsitsi disaini, mis näitab selgelt, et AI-insenerid pöörasid tähelepanu lõbusale segamisele ja otsustasid tarkvara võimalusi uuendada.





Teised mootorid järgivad Midjourney eeskuju aeglaselt AI kunsti parandamine Photoshopiga jääb hindamatuks oskuseks. Programmeerijate peamiseks takistuseks on see, kui keeruline on treenida tehisintellekti veenvate käte joonistamiseks.

Miks AI pildigeneraatorid kätega võitlevad?

AI-mootorid kasutavad kujutiste loomiseks generatiivseid võistlevaid võrgustikke (GAN) või stabiilset hajutamist. Mõlemad tehnoloogiad nõuavad ulatuslikke lähtematerjale, koolitust ja töötlemisvõimsust isegi kõige elementaarsemate kunstiteoste loomiseks.





Kuna olemasolevad pildid on tehisintellekti väljaõppes kesksel kohal, peavad programmeerijad oma tarkvarale viipade kõrval sisestama tuhandeid, kui mitte miljoneid pilte – korrates seda protsessi ikka ja jälle, kuni mootor mõistab, millele konkreetne sõna viitab ja kuidas seda esitada. see objekt.

Kuid lähtepildid, millest tehisintellekt õpib, on peamiselt 2D, kus käed on kujutatud erinevates asendites. Kas sirge või kõverdatud, näitab viit või kolme sõrme.

Lõppkokkuvõttes ei mõista masin käte mõistet ja piltidel, millelt see õpib, ei ole alati käed piisavalt selgelt või järjekindlalt kujutatud. Sellepärast võivad Midjourney käed olla nii inetud: AI segadus.

Sama kehtiv kui Elon Muski mure AI arengu pärast võib-olla on mõnel tehnoloogia osal veel palju õppida. Ja nende takistused ulatuvad kaugemale kui ebapiisavad kätenäidised.

Muud põhjused, miks AI pildigeneraatorid arenevad aeglaselt

  Naine kodeerib arvutis

Vaatan Midjourney mudelid , v5 pakub täiustatud sidusust tekstiviipade ja toodetud piltide vahel, samuti suuremat eraldusvõimet ja lisatööriistu. Kuid sellised saavutused ei ole odavad.

Tehisintellekti treenimine kätega paremini hakkama saamiseks nõuab talle paremate kujutiste andmist, eriti 3D-vormingus. See tähendab, et protsessidele kulutatakse palju aega ja tööjõudu, alates lähtematerjalide hankimisest kuni kodeerimise täiustamiseni ja koolituse kordamiseni, kuni tehisintellekt on asjaga toime tulnud.

Isegi siis võib tarkvara muidu vapustavates kunstiteostes vigu teha. Peale selle, et see on tohutu ja keeruline töö, on see kallis. Seega, ära oota tasuta AI teksti-pildi generaatorid et veel jõuda Midjourney kaliibrini.

Lihtsamalt öeldes ei seisne AI-mootorite probleem ainult selles, et need arvutiprogrammid ei suuda täielikult mõista, kuidas inimlikud funktsioonid, nagu käed ja jalad, välja näevad või töötavad. See taandub ka selle maksumusele ning tehnoloogia juurdepääsule 3D-kujutistele ja masinõppetehnikatele, mis aitavad generaatoritel ümbritsevast maailmast realistlikumat ülevaadet saada.

failide jagamine maci ja arvuti vahel

AI pildigeneraatorid ei võitle igavesti

Käed on tehisintellekti jaoks keeruline kontseptsioon oma kahendpea ümber mähkimiseks, kuid probleemi lahendused on juba töös. Midjourney, DALL-E 2 ja muud platvormid suudavad lõpuks hoida omapärased sõrmed minimaalsena, kui mitte neid täielikult välja juurida.

Muudes tehisintellekti valdkondades tehtud edusammud tagavad, et tehnoloogia areneb pidevalt ning selle arendajad õpivad alati uusi viise selle rakendamiseks ja täiustamiseks.