A múlt héten a Pablinux elmondta a Kdenlive új verzióját, a KDE projekt videószerkesztő eszközét. Amint egyszer megjegyeztem, inkább az OpenShot-ot részesítem előnyben, amelynek alacsonyabb a tanulási görbéje, deMivel nagyon érdekelt a beszéd-szöveg eszköz, amelyet ez az új verzió tartalmaz, úgy döntöttem, hogy megnézem.
Bár írtam a cikkeim részét a Windows ennek vagy annak a programnak az alternatíváiról (senki sem nevezheti magát Linux bloggernek, ha nem írt ilyet), ez nem egy olyan megközelítés, amelyet szeretek. Úgy gondolom, hogy a programokról saját jellemzőik szerint kell beszélni. Ha valamilyen módon meg kell határoznom a Kdenlive-t, akkor azt mondom, hogy egy videószerkesztő azoknak a hobbistáknak, akik azt akarják, hogy alkotásaik profinak tűnjenek.
Mondtam a múltban, és megtartom (jöjjön egyenként), hogy az ingyenes és nyílt forráskódú szoftvereknek vannak multimédiás munkáinak könyvtárai, amelyek az Adobe és a Blackmagic termékeket puszta játéknak tűnnek. A nagy probléma az, hogy senkit nem érdekelt ezeknek az eszközöknek az összeállítása egy egyszerű és vonzó kezelőfelülettel, valamint teljes és könnyen érthető dokumentációval. Bár a Kdenlive korántsem érte el célját, fejlesztői jó úton járnak.
A beszéd szöveggé alakításának képessége esetén a Kdenlive két eszközt használ a Python csomagindex.
A Vosk egy nyílt forráskódú és offline beszédfelismerő eszközkészletn. Beszédfelismerési modelleket kínál 17 nyelv és nyelvjárás számára: angol, indiai angol, német, francia, spanyol, portugál, kínai, orosz, török, vietnami, olasz, holland, katalán, arab, görög, perzsa és filippínó.
A Kdenlive a Vosk modelleket használja egy Pythonban írt modulon keresztül.
Az átirat birtoklása azonban nem elég. Szinkronizálnod kell a videóval is. Ehhez szükségünk van egy másik modulra a Pythonban a feliratok létrehozásához.
A Kdenlive ellenőrzi, hogy telepítve vannak-e ezek a modulok. PEhhez először telepítenie kell a python3-pip csomagot a disztribúcióra, majd futtatnia kell a parancsokat:
pip3 install vosk
pip3 install srt
Ezután telepítenünk kell a hangmodelleket. Ehhez megnyitjuk a Kdenlive-ot, és megyünk is Beállítások A Kdenlive Speech to Text konfigurálása.
A modellek betöltéséhez két lehetősége van: vagy töltse le a modelleket innen ezen az oldalon és kézzel töltse be őket (Először be kell jelölnie az Egyedi modem mappák jelölőnégyzetet), vagy be kell illesztenie a hivatkozást a listából, amely ugyanazt az oldalt mutatja.
A Beszéd szöveggé eszköz használata
- Győződjön meg arról, hogy a Nézet menüben be van-e kapcsolva a felirat. Ezután töltse fel az átírni kívánt videót.
- Vigye a videót az első videó sávra, és csúsztassa a kék vonalat az átírni kívánt hossz mentén.
- Kattintson a felirat fülre, majd a + jelre
- A tetején egy tipp található. Kattintson a szem bal oldalán található ikonra.
- Válassza ki az átírási modellt, és ha klipet szeretne átírni, akkor az összes klipet egy idővonalon vagy az idővonal egy részén. Kattintson a Feldolgozás gombra
Összehasonlítottam a Speech to tech-t a felhőeszköz ingyenes verziójával, és láttam saját felirattal ellátott videókat a Youtube-tól és a fizetős tanfolyamok platformjaitól. Azt kell mondanom, hogy nem tökéletes, de nem rosszabb, mint az említett alternatívák. Problémái vannak, amikor a beszélőknek nincs jó dikciójuk, vagy a zene vagy más hang miatt. De elképzelve azt a kérdést, amit feltesznek nekem, igen, fel lehet használni egy sorozat vagy film feliratozására. Bár a jelzett korlátozások miatt előfordulhat, hogy kézzel kell kitölteni őket.
És ha a Kdenlive srácai kissé felteszik az elemeket és integrálnak egy fordító modult, akkor a dolog tökéletes lenne.
Van, amin lehetne javítani. Ma, ha meg akarja változtatni a feliratok megjelenését, be kell illesztenie a kódot. És nem lehet exportálni őket. Csak beágyazva láthatja őket a videóba.
De, mint fentebb mondtam, a projekt minden kétséget kizáróan jó úton halad.
A jobb oldali szerkesztőmezőben kijelölheti az összes szöveget, átmásolhatja a vágólapra, majd beillesztheti a kívánt helyre