Google kompaniýasy tekstleriň, suratlaryň, audiolaryň we beýleki wideo ýazgylaryň esasynda wideo döretmäge hem-de olary redaktirlemäge niýetlenen Gemini Omni atly generatiw emeli aň modelleriniň täze toplumyny tanyşdyrdy. Hataryň ilkinji modeli Gemini Omni Flash boldy.
Täze ulgam gepleşik görnüşindäki tekst beýanlary arkaly wideoşekilleri üýtgetmäge mümkinçilik berýär. Ulanyjy «ýagyş goş», «fony üýtget» ýa-da «gahryman ylgasyn» ýaly buýruklary berip bilýär, şondan soň neýroulgam sahnanyň yzygiderliligini we obýektleriň daşky görnüşini saklap, üýtgeşmeleri awtomatik usulda girizýär.
Google-yň aýtmagyna görä, bu model öňki wideo generatorlaryna garanyňda fizikanyň kanunlaryny, hereket dinamikasyny we suwuklyklaryň özüni alyp barşyny göz öňünde tutýar, şonuň netijesinde bolsa wideolar has hakyky görünýär. Algoritm öňki girizilen düzedişleri hem ýadynda saklaýar, bu bolsa gaýtadan redaktirlenende gahrymanlaryň ýa-da sahna elementleriniň tötänleýin üýtgemeginiň öňüni alýar.
Google DeepMind-yň gözlegler boýunça uly direktory Dumitru Erhanyň habar bermegine görä, häzirki wagtda ulgam dowamlylygy 10 sekunta çenli bolan sesli wideolary döretmäge ukyplydyr. Kompaniýa bu çäklendirmäni ulaltmagyň üstünde işleýär.
Google DeepMind-yň tehniki direktory Koraý Kawukçuoglu Gemini Omni-niň öňki modeller bilen deňeşdirilende dünýäniň gurluşyna has çuňňur düşünýändigini belledi. Ulanyjylar sanly awatarlary döredip, olara öz sesleri bilen ses berip hem biler.
Howpsuzlyk maksatlary üçin Google wideoda başga biriniň sözleýşini üýtgetmek mümkinçiligini çäklendirdi. Döredilen ähli wideoşekillere «SynthID» sanly suw belgisi goýulýar.
Gemini Omni Flash eýýäm Google AI Plus, Pro we Ultra ulanyjylaryna Gemini programmasy hem-de Google Flow serwisi arkaly elýeterlidir. Generatora mugt girmek mümkinçiligi YouTube Shorts we YouTube Create App ulanyjylary üçin hem açylyp başlandy.