Kas Google'i MusicLM vastab hype'ile?

Kas Google'i MusicLM vastab hype'ile?
Teiesugused lugejad aitavad MUO-d toetada. Kui teete ostu meie saidil olevate linkide abil, võime teenida sidusettevõtte komisjonitasu. Loe rohkem.

2023. aasta jaanuaris kuulutas Google välja MusicLM-i, eksperimentaalse AI tööriista, mis suudab tekstikirjelduste põhjal muusikat genereerida. Lisaks uudistele avaldas Google MusicLM-i jaoks vapustava uurimistöö, mis jättis paljud inimesed pimestavaks võimalusest võluda muusikat õhust.





PÄEVA VIDEO MAKKEUSE SISUGA JÄTKAMISEKS KERIMISE

Tekstiviip andes lubas mudel toota ülitäpset muusikat, mis esitas kõikvõimalikke kirjeldusi žanrist instrumendini kuni kuulsaid kunstiteoseid kirjeldavate abstraktsete pealdisteni. Nüüd, kui MusicLM on avalikkusele avatud, otsustasime selle proovile panna.





Google'i katse luua AI muusikageneraator

  Google'i veebirakendus's MusicLM AI music generator

Tekstiviipa, nagu 'lõõgastav džäss', muutmine valmis looks on vaieldamatult AI-muusika eksperimentide püha graal. Sarnaselt kuulsate tehisintellekti kujutise generaatoritega, nagu Dall-E või Midjourney, ei pea teil olema tükikestki muusikaalaste oskusteavet, et luua lugu, millel on meloodia ja rütmi.





2023. aasta mais said need, kes registreerusid Google'i AI Test Kitcheniga, demo esimest korda proovida. Tänu kasutajasõbralikule veebilehele ja paarile juhisele – elektroonilised ja klassikalised instrumendid töötavad kõige paremini ning ärge unustage määrata 'vibe' - on muusikajupi loomine kujuteldamatult lihtne.

Kiirus on üks väheseid asju, mida MusicLM tõeliselt pakub, kõrvuti suhteliselt kõrge täpsusega näidistega. Tõelist testi ei tulnud aga mõõta ainult stopperiga. Kas MusicLM suudab mõne sõna põhjal toota tõelist kuulatavat muusikat? Mitte täpselt (selle juurde jõuame varsti).



Kuidas kasutada MusicLM-i Google'i AI Test Kitchenis

MusicLM-i kasutamine on lihtne, saate registreeruda ootenimekirja Google'i AI testköök kui tahad proovida.

Veebirakenduses näete tekstikasti, kus saate koostada mõnest sõnast kuni mõne lauseni viipa, mis kirjeldab, millist muusikat soovite kuulda. Parimate tulemuste saavutamiseks soovitab Google olla 'väga kirjeldav', lisades, et peaksite proovima kaasata muusika meeleolu ja emotsiooni.





Kui olete valmis, vajutage töötlemise alustamiseks sisestusklahvi. Umbes 30 sekundi jooksul on kaks helilõiku, mida saate kuulata. Nende kahe hulgast on teil võimalus anda parimale proovile, mis vastab teie viipale, karika, mis omakorda aitab Google'il mudelit koolitada ja selle väljundit parandada.

Kuidas MusicLM kõlab

Inimesed on muusikat teinud juba vähemalt 40 000 aastat tagasi, ilma et oleks olnud kindlat aimu, kas muusika tekkis enne, pärast või samal ajal keele arenguga. Nii et mõnes mõttes pole üllatav, et MusicLM pole selle iidse universaalse kunsti koodi päris lahti murdnud.





Google'i MusicLM uurimistöö tegi ettepaneku, et MusicLM võiks luua muusikat kuulsate kunstiteoste pealdistest ja järgida sujuvalt juhiseid, nagu žanri või meeleolu muutmine, järgides erinevaid juhiseid.

tasuta filmid allalaadimine registreerimata

Enne selliste suurte tellimuste juurde jõudmist avastasime aga, et MusicLM-il oli esmalt mitu põhiprobleemi, mis tuleb ületada.

Tempost kinnipidamise raskused

Iga muusiku kõige põhilisem töö on lihtsalt õigel ajal mängida. Teisisõnu, pidage tempost kinni. Üllataval kombel ei saa MusicLM seda 100% ajast teha.

Tegelikult, kasutades sama viipa 10 korda, mis toodab 20 muusikapala, jõudis õigeks ajaks vaid kolm. Ülejäänud 17 näidist olid kiiremad või aeglasemad kui määratud tempo, mis oli kirjutatud 'löökide minutis', mis on laialt levinud termin muusika kirjeldamiseks.

Selles näites kasutasime viipa 'sooloklassikaline klaver, mida mängitakse kiirusega 80 lööki minutis, rahulik ja meditatiivne'. Lähemal kuulamisel muusika sageli kiirenes või aeglustus väikese proovipikkuse piires.

Muusikal puudus ka tugev biit ja see kõlas nii, nagu oleks keegi teose keskel mängima löönud. Olenemata sellest, kas see oli tahtlik või mitte, on raske hinnata, kas MusicLM suudab muusikale õige alguse või lõpu lisaks rütmile kinni pidada.

Juhuslik instrumendi valik

Võib-olla polnud MusicLM veel õppinud, kuidas mängida rangelt ajaliselt, nii et liikusime edasi teise ühise muusikaparameetri juurde. Tahtsime näha, kas see rahuldab meie taotluse teatud instrumentide osas.

Kirjutasime mitu erinevat viipa, mis sisaldasid kirjeldusi nagu 'Solosüntesaator' ja 'Solobasskitarr'. Teised olid suuremad koosseisud nagu 'Keelpillikvartett' või 'Jazzbänd'. Üldiselt tundus 50:50 tõenäosus, et saate selle, mida küsisite.

Üks teooria on see, et mudel seostab mõningaid instrumente populaarsete muusikažanridega. Võtame näiteks käskluse 'Solosüntesaator, akordi käik. Elav ja meeleolukas'. Selle asemel, et saada omaette süntesaatoriheli, valmistas MusicLM elektroonilise pala koos trummide ja bassiga.

Võimalik, et mudelil pole lihtsalt piisavalt andmeid ja piisavalt koolitust, et mõista instrumendi konkreetset taotlust.

Vokaal on võrrandist väljas

Tollaste piirangute kohaselt ei tootnud mudel vokaali sisaldavat muusikat. MusicLM-i keerulised autoriõiguse probleemid ja lollakas vokaal on tõenäoline tegur, miks Google otsustas selle piirangu seadmisega turvaliselt mängida.

Kuid pärast mõnda aega MusicLM-iga katsetamist mõistsime, et Google'i kontroll mudeli väljundi üle ei olnud just raudne. Kummalisel kombel tekitaks käsk nagu 'akustiline kitarr' loo, mis sisaldas taustal kummituslikku vokaali, mis kõlas summutatult ja kaugena.

Kuigi see pole tavaline nähtus, paneb see teid kahtlema MusicLM-i võime üle luua veenvaid vokaali.

Tarkvaraga, nagu VOCALOID ja Synthesizer V, mis juhivad teed AI-abiga vokaali sünteesi tehnoloogia , jätame praegusest mudelist vokaali välja jättes mõtlema, kas see pole veel piisavalt hea, et olemasoleva tehnoloogiaga konkureerida. MuusikaLM-il võib olla veel pikk tee käia, enne kui muusikud seda ülistavad.

AI muusikageneraatorite tulevik

  Erinevad viipesoovitused saidil MusicLM's web application

Kuigi MusicLM on generatiivset tehisintellekti muusikatehnoloogiat edasi viinud, peab see suunduma tagasi kooli ja õppima veel mõned asjad, enne kui saab hakata muusikatööstuses praktilist tööd tegema.

Varem oli generatiivse AI-muusika parim katse OpenAI mudel nimega JukeboxAI. See ei olnud täpselt kasutusvalmis ja vaid ühe minuti muusika esitamiseks kulus ilmatu üheksa tundi.

Tõenäoliselt saate oma jõupingutuste eest tagasi tõeliselt võõrapärase kõlaga loo, mis oli täis helimoonutusi ja esemeid. Positiivne on see, et teil ei hakanud igav kuulates veidrat loomingut, mida Jukebox võlub .

Seda silmas pidades on MusicLM teinud olulisi edusamme kasutajasõbraliku AI-muusikageneraatori suunas. Võiksime mudelile peaaegu andeks anda selle juhuslikud väljundid, kui mõtlete, kui tohutult keeruline on muusika loomine toorheli kujul.

Pärast mudeli tööle panemist tundub MusicLM siiski poolik, võrreldes sellega, mida Google oma esialgses uurimistöös avaldas. Harva saab tehisintellekti kujutise generaator Apple'i kujutist valesti, samuti peaks AI muusikageneraator saama mõned põhitõed, nagu tempo ja instrumendid, õigesti.

Google'i MusicLM ei vastanud ootustele

Kuna tehnoloogiaettevõtted võistlevad üksteisega tehisintellekti rindel võisteldes, on MusicLM-il tunne, nagu oleks ta jõudnud avalikele katsetele enne, kui see valmis sai. Põhialuste õigeks saamise asemel näib mudel võtvat muusika tootmisel palju ebamäärasema ja subjektiivsema lähenemise.

Google võib julgustada teid oma viipaga olema konkreetne, kuid see ei saa tempoga hästi hakkama ja te pole garanteeritud, et saate iga kord soovitud instrumente. MusicLM võib olla huvitav ja võimsate tehisintellekti edusammude hea demonstratsioon, kuid kui muusika on lõppeesmärk, on sellel veel pikk tee minna.