Google I/O konferensiýasynda multimodal EA modeli Gemini 2.5-iň täzelenen görnüşi hödürlendi. Indi ol hakyky wagtda audio döretmegi we emosiýalary göz öňünde tutup gürrüňdeşligi alyp barmagy başarýar. Bu funksiýalar Google AI Studio we Vertex AI arkaly işläp düzüjiler üçin elýeterlidir.
Gemini 2.5 Flash Preview hakyky ses aragatnaşygyny üpjün edýär. Model söhbetdeşiň sesindäki emosional öwüşgini anyklaýar, intonasiýany we aksenti sazlap bilýär hem-de 24 diliň arasynda geçip bilýär. Ol fon sesini aýryp, dialog wagty internetde maglumat hem gözläp bilýär.
Şeýle-de, sözleýiş sintezi funksiýasy kämilleşdirildi. Ulanyjylar sesiň stilini, tizligini we emosional aýdyňlygyny dolandyryp biler. Mundan başga-da, dürli ses bilen dialog döredip bolýar we bu modeli podkastlary, audio-kitaplary we beýleki media-taslamalary döretmek üçin ulanmaga mümkinçilik berýär.
Aç-açanlyk üçin SynthID tehnologiýasy ulanylýar, ol döredilen audiony EA önümi hökmünde belleýär. Täze mümkinçilikler Google AI Studio-da Stream we Generate Media goşundylarynda elýeterlidir.
Gemini 2.5 diňe bir tekstler däl, eýsem suratlar, audio we wideo bilen işläp bilýär, bu bolsa ony interaktiw programmalar, wirtual kömekçiler we döredijilik taslamalary üçin peýdaly edýär.