
Az OpenAI következő generációs mesterséges intelligenciájáról szóló videója érkezik egy kis társadalmi csavarral: Sora 2 Nemcsak egy hatékonyabb modellt dob piacra, hanem egy olyan alkalmazást is bemutat, amely azonnalivá teszi a klipek létrehozását, és ha szükséges, azonnal megoszthatóvá. Az ígéret egyszerű: felveszel egy rövid felvételt A hangod és az arcod rögzítéséhez kiválasztod a jelenetet, és a rendszer a felvételek között anélkül helyez el benne, hogy elveszítenéd a fonalat.
Ez a lépés kontextusba helyez egy olyan utat, amely a ChatGPT-vel kezdődött és képmodellekkel folytatódott: az első Sora Már utalt a tárgyak állandóságára és egy bizonyos vizuális koherenciára, de most az ugrás a következőre összpontosít: fizikai hűség és a hangintegrációban. A cél az, hogy a hibák emberi, ne algoritmikus hibák legyenek, és hogy a klip világa megtartsa eredeti állapotát a linkelt jeleneteknél.
Mi az újdonság a Sora 2 modellben?
Az OpenAI a Sora 2-t jelentős előrelépésként írja le, amely hihetőbb viselkedést biztosít a mindennapi tevékenységekben és az összetett jelenetekben: Ha egy labda nem megy be, akkor oda pattan, ahová landol. És nem tűnik el; ha több felvétel van, a környezeti állapot megmarad. Továbbá a rendszer gazdagabb utasításokat fogad el, és támogatja a rövid narratívákat, nagyobb kontrollal a stílus, az időtartam és az átmenetek felett.
Egy másik figyelemre méltó újdonság a hangzás: A modell hangokat, effekteket és hangképeket generál szinkronizálva a képpel, így a párbeszédek illeszkednek a környezethez (egy forgalmas utcától a tűzijátékig). Az eredmény egy teljesebb audiovizuális csomag, amely magasabbra teszi a lécet az előző verzióhoz képest.
A közösségi alkalmazás: függőleges hírfolyam, remixek és cameók
A modellel együtt az OpenAI elindít egy közösségi alkotásra és megosztásra tervezett alkalmazást. A szív egy… takarmány függőleges, mobil típus, klipszekkel akár 10 másodperc, például gombok, megjegyzések és opciók remix. A Neked oldal Természetes nyelven keresztül alkalmazkodik, és a közelben lévő emberekkel való interakciót helyezi előtérbe, hogy elkerülje a végtelen passzív fogyasztást.
Ahhoz, hogy megjelenjen egy klipben, az alkalmazásnak kép- és hangellenőrzésre van szüksége, és onnantól kezdve… engedélyezi a cameo-kat az általad vagy mások által generált jelenetekben. Nincs feltöltve a kameratekercsről: a rögzítés magában az alkalmazásban történik, így könnyen vezérelhető és engedélykövetés mindig
Identitás, jóllét és biztonság
A hasonlóság igazolását a következők kísérik: értesítések minden alkalommal, amikor valaki felhasználja a képedet, még akkor is, ha a videó vázlat formájában marad. Ezenkívül visszavonhatod az engedélyeket, és kérheted az olyan klipek eltávolítását, amelyekben szerepelsz, emberi moderációval a zaklatás és a személyes adatokkal való visszaélés megelőzése érdekében.
Az OpenAI szerint a tapasztalat célja az alkotás ösztönzése. végzetgörgetésTizenévesek számára vannak megtekintési és generálási korlátok, további vezérlőelemek a cameókhoz és a ChatGPT szülői eszközei. A vállalat jelzi, hogy a szintetikus tartalmakat forrásjelekkel és digitális hitelesítő adatokkal jelölik a nyomon követhetőség megkönnyítése érdekében.
A Sora 2 elérhetősége, hozzáférése és árazása
A telepítés ekkor kezdődik: iOS meghívásos alapon az Egyesült Államokban és Kanadában, azzal a tervvel, hogy később további országokra is kiterjesztik a hozzáférést. Jelenleg Spanyolországban nem érhető el. A szolgáltatás elindul ingyenes, a számítási kapacitástól függően korlátozott és lesz egy jobb minőségű Sora 2 Pro változat a ChatGPT előfizetők számára, valamint webes hozzáférés és egy jövőbeli API.
Amit jól csinál a Sora 2, és ami még hiányzik belőle
A példák művészi tornát, szaltókat vagy akciójeleneteket mutatnak be következetesebb fizikával, animációban vagy stop-motionben pedig az eredmények... különösen masszívnak tűnikEnnek ellenére továbbra is fennállnak hibák: a realisztikus jelenetekben olyan részletek, mint természetellenes röppályák vagy pattanások (például egy strandröplabda-mérkőzésen), és az egymást követő lövéseknél hiányozhat a koherencia.
Verseny és piaci környezet
A Sora 2 egyre növekvő versenyhelyzetben landol: Kifutópálya a Gen-4-gyel A kreatív fronton a Google integrálja a Veo 3-at a YouTube-ba, a Meta pedig egy mesterséges intelligencia által generált rövid videókból álló hírfolyamot tesztel. A TikTok eközben szigorítja az érzékeny szintetikus tartalmakra vonatkozó szabályokat. Az OpenAI fordulópontja a következő: fogadj a saját társasági élményeidre a videómotorod körül.
Szerzői jogok és védelmi intézkedések
A cég a következővel működik: szűrők, amelyek blokkolják a kéréseket potenciálisan problémás a szerzői jogi kérdések miatt, amelyek néha megakadályozzák bizonyos klipek létrehozását. Ezzel párhuzamosan az OpenAI szerzői jogi perekkel néz szembe, amelyek közül a New York Times-ügy az egyik legjelentősebb, és a jogtulajdonosok tartalomkizárási és eltávolítási mechanizmusait védi.
Mit tehet a felhasználó
Alkotók, kis ügynökségek vagy egyéni profilok számára a Sora 2 megnyitja az utat a klipek készítése hanggal és effektekkel alacsony költséggel és gyorsan. A cameo funkciók és az állapotmegtartás a felvételek között lehetővé teszik a rövid jelenetek folytonosságát, míg a remix opciók és a közösségi hírfolyam arra ösztönöz, hogy építsd a videóidat. együttműködési formátumok kerek.
Az audiovizuális modell és a közösségi alkalmazás kombinációjával a Sora 2 célja, hogy a videógenerálást mindennapossá tegye, de… egyértelmű határok a biztonság, az identitás és a jogok terénAz ajánlat 10 másodperces klipekkel, kötelező képellenőrzéssel és szerzői jogi szűrőkkel indul, korlátozott elérhetőséggel és egy Pro és API elérési úttal, amely meghatározza a fejlesztését.