Microsofts nya VASA-1 AI genererar superrealistiska avatarer som till och med kan sjunga sÄnger

microsoft-vasa-1-avatar
  • đŸ€– Microsofts nya VASA-1 AI genererar superrealistiska avatarer Microsofts nya AI-modell VASA-1 kan skapa superrealistiska avatarer av mĂ€nniskor. Modellen Ă€r trĂ€nad pĂ„ en enorm databas med bilder och kan generera avatarer som ser ut som riktiga personer. kĂ€lla
  • 🎹 VASA-1:s funktioner VASA-1 kan skapa avatarer med olika utseenden, inklusive hudfĂ€rg, hĂ„rfĂ€rg, ögonfĂ€rg och klĂ€der. Modellen kan ocksĂ„ generera avatarer med olika uttryck, inklusive glĂ€dje, sorg, ilska och rĂ€dsla. kĂ€lla
  • đŸ’» VASA-1:s anvĂ€ndningsomrĂ„den VASA-1 kan anvĂ€ndas för en mĂ€ngd olika Ă€ndamĂ„l, inklusive videospel, virtuella assistenter och kundtjĂ€nst. Modellen kan ocksĂ„ anvĂ€ndas för att skapa personliga avatarer som kan anvĂ€ndas i sociala medier och andra onlineplattformar.

Microsoft har presenterat sitt nya AI-ramverk VASA-1 som kan generera superrealistiska avatars som kan prata och till och med sjunga sÄnger. Detta ramverk tar en enda bild i portrÀttformat och en ljudfil och sammanför dem för att skapa en kort video av ett pratande huvud med realistiska ansiktsuttryck, huvudrörelser och till och med förmÄgan att sjunga sÄnger i den uppladdade rösten 23. VASA-1 Àr för nÀrvarande endast ett forskningsprojekt och Àr inte tillgÀngligt för allmÀnheten att anvÀnda, men Microsoft har publicerat ett antal demonstrationsvideor som visar dess imponerande realism.

VASA-1 kan hantera bilder som inte nödvĂ€ndigtvis Ă€r traditionella, ansiktsvĂ€nda, passfoton eller portrĂ€ttbilder. Det erbjuder ocksĂ„ en hög nivĂ„ av kontroll, med saker som blickriktning, huvudavstĂ„nd och till och med kĂ€nslouttryck som indata, vilket bidrar till realismen. Detta ramverk Ă€r sĂ€rskilt utformat för att animera virtuella karaktĂ€rer, och alla individer i dess exempel Ă€r syntetiska, genererade med hjĂ€lp av OpenAI’s DALL-E bildgenereringsmodell. Men det har uppenbarligen potential att gĂ„ vidare, eftersom om det Ă€r möjligt att animera en AI-bild, borde det vara lika enkelt att animera ett foto av en verklig person.

VASA-1 har stora potentiella tillÀmpningar, inklusive videospel dÀr det kan möjliggöra skapandet av mer realistiska AI-genererade karaktÀrer med extremt naturliga lÀppsynkroniseringsrörelser och ansiktsuttryck, vilket ökar immersionen. Tekniken kan ocksÄ anvÀndas för att skapa avatars i sociala medievideor och kanske till och med gÄ vidare och möjliggöra mer realistiska AI-genererade filmer eller musikvideor dÀr det verkligen verkar som om skÄdespelaren, skÄdespelerskan eller sÄngaren verkligen pratar eller sjunger

Det finns dock ocksĂ„ potentiella risker med denna teknik, inklusive möjligheten att den kan missbrukas för att skapa deepfake-videor. Microsoft Ă€r mycket försiktig med projektet och betonar att deras forskningsfokus ligger pĂ„ att generera visuella kĂ€nslomĂ€ssiga fĂ€rdigheter för virtuella AI-avatars, med mĂ„let att hitta positiva tillĂ€mpningar. Det Ă€r inte avsett att skapa innehĂ„ll som anvĂ€nds för att bedra eller lura. Även om det finns potentiellt för missbruk av tekniken, Ă€r Microsofts forskare tydliga om att de inte har för avsikt att förfalska verkliga mĂ€nniskor och att detta endast Ă€r en forskningsdemonstration utan nĂ„gon produkt- eller API-utgivningsplan.

VASA-1 har trĂ€nats pĂ„ VoxCeleb2-datasetet, som innehĂ„ller över 1 miljon yttranden för 6 112 kĂ€ndisar, extraherade frĂ„n videor som laddats upp till YouTube. Det kan generera videor med upplösning pĂ„ 512×512 pixlar vid upp till 40 bildrutor per sekund med minimal latens, vilket innebĂ€r att det potentiellt kan anvĂ€ndas för realtidstillĂ€mpningar som videokonferenser.

Leave a Reply

Din e-postadress kommer inte publiceras. Obligatoriska fÀlt Àr mÀrkta *