Beszéd Felismerés – Hangból Szöveget
A legújabb, 24.10.29 verzióval a Shotcut új AI alapú funkciót kapott, amely az OpenAI Whisper technológiáján alapul. A funkció a „Subtitles > Speech to Text” menüpont vagy a „Speech to Text” ikon használatával érhető el, és lehetővé teszi, hogy videóidhoz automatikusan generálj feliratokat.
Gyors és Pontos Alapmodell
Az új verzióban található alapmodell jó sebességet és pontosságot biztosít, miközben kis méretű marad. Azonban ha még pontosabb eredményekre van szükséged, nagyobb méretű, „ggml” formátumú modellt is letölthetsz és beállíthatsz a „Speech to Text” párbeszédpanelen keresztül – bár ebben az esetben számíts lassabb feldolgozási időre.
Hogyan Működik a Beszéd Felismerés?
A „Speech to Text” funkció két feladatot hoz létre, amelyeket a „Jobs” panelen követhetsz nyomon: először exportálja az audiót, majd átalakítja szöveggé. Az eredmény egy új feliratsávként jelenik meg a „Subtitles” panelen, így egyszerűen hozzáadhatod a kész videódhoz.
Több lehetőséged is van az elkészült felirat felhasználására. Exportálhatod külön fáljba, vagy akár bele is égetheted a videóba. De azt is megcsinálhatod, hogy az idővonalon egy új sávot hozol létre és oda szúrod be a kész szöveget.
De jöjjön az egyik legfontosabb kérdés.
Ismeri a ShotCut AI a magyar nyelvet?
A válasz: igen, de nem pontos a végeredmény. Azaz a feliratok elkészítése után alaposan át kell nézni a szöveget és bele kell javítani. Szükség esetén a töréspontokat is igazítani kell. De ezzel az új funkcióval így is rengeteg időt és munkát spórolhatunk meg!
Technikai Részletek
Jelenleg az új funkció Apple Silicon GPU-t támogat, egyébként erősen párhuzamosított módon a CPU-n fut. Érdemes tudni, hogy a feliratok időzítése nem mindig tökéletes, és előfordulhatnak kisebb csúszások. A pontos időzítést a modell és az eszköz biztosítja, de korlátozott erőforrások miatt nem tudják tovább finomítani.
Figyelmeztetések a Használathoz
Az OpenAI által fejlesztett Whisper modellekkel kapcsolatban fontos figyelmeztetéseket is kaptunk. Az OpenAI nem javasolja a Whisper modellek használatát olyan felvételek átírására, amelyek nem a rögzített személy beleegyezésével készültek, valamint olyan döntéshozatali folyamatokban sem, ahol a pontatlanság súlyos következményekkel járhat.
Az új Shotcut verzió tehát egy izgalmas és hasznos új funkcióval bővült, amely lehetővé teszi, hogy feliratozási munkáidat AI-alapú beszédfelismeréssel egyszerűsítsd. Töltsd le a frissítést, és próbáld ki a „Whisper to a Scream” verzió újdonságait!
Hozzászólások
Offline?
Beküldte Kempelen -
Értékelés:
Ez tulajdonképpen offline? Letölt az ember egy 4-5 gigás adatmodellt és működik is? Vagy hogy kell ezt elképzelni? Köszi!
Offline?
Beküldte kami911 -
Értékelés:
A Shotcut videószerkesztő legújabb funkcióját a Whisper.cpp projekt hozta el, amely az OpenAI által kifejlesztett Whisper modellt alkalmazza:
https://github.com/ggerganov/whisper.cpp
A Shotcut alapértelmezett beállításként egy kisebb méretű modellt tartalmaz, amely megfelelő sebességet és pontosságot biztosít, bár nem a legnagyobb méretű. Ezt a modellt úgy is elképzelhetjük, mint a beszédfelismerés „agyát”. Ha még jobb minőségre van szükséged, lehetőség van egy nagyobb és pontosabb modell letöltésére ggml formátumban, amelyet a Speech to Text párbeszédablakban lehet beállítani. Ezzel azonban lassabb feldolgozási sebességed lesz.
Még ezek az újdonságok vannak:
Beküldte kami911 -
Értékelés:
Átmenetkezelési fejlesztések
Ripple törlés: Egy átmenet ripple (láncolt) törlésével a program most már visszaállítja a teljes klipeket, amelyek az átmenet részei voltak.
Sima törlés (lift): Az átmenet sima törlése esetén nem marad rés a klipek között; a szomszédos klipek automatikusan kitöltik az űrt.
Szomszédos klip elmozdítása: Ha egy klipet elmozdítunk az átmenet mellett, akkor a program automatikusan növeli az átmenet időtartamát, ahelyett, hogy rés keletkezne.
További fejlesztések
Exportálás egyszerűsítése: Az Export > Videó > Resample gombot eltávolították, így most csak figyelmeztető üzenetek jelennek meg bizonyos változtatások esetén.
Projekt megnyitása mappában: Új menüpont került a Fájl > Mutasd a projektet a mappában lehetőséghez.
GPS szöveg videószűrő: Hozzáadásra került a tizedes számok opció a GPS szöveg videószűrőben, hogy pontosabb értékeket lehessen megadni.
Projektek átnevezése: A Legutóbbi projektek helyett mostantól csak Projektek néven szerepel ez a lista, és az elemek nem tűnnek el automatikusan, ha elérik a maximum hosszúságot.
Eltávolítási lehetőség: A projektek helyi menüjébe új Eltávolítás opció került.
GPU hatások rejtése: A Reframe videószűrő és gomb el van rejtve, ha a GPU hatások be vannak kapcsolva.
FFmpeg frissítése: Az FFmpeg legújabb, 7.1 verziójára történt frissítés.
Hibajavítások
Lejátszási lista összeomlás: Több lejátszási listához kapcsolódó összeomlási hibát javítottak, például a diavetítéshez való hozzáadás során fellépő véletlenszerű hibákat.
Felirat sáv megnyitása: Javítottak egy összeomlási hibát, amely akkor lépett fel, ha egy felirat sáv tartalmak nélkül volt a projektben.
Reframe videószűrő hibák: Kijavították a Reframe szűrő hibásan számított méreteit és arányait, amelyek exportálási hibákhoz vezettek.
AVCHD videó formátum: Az AVCHD videók képkocka-sebességének problémáit, valamint egyéb formátumokat is érintő kétszeres sebesség hibát kijavították.
Proxy videók iPhone 16 Pro-ra: Javították a proxy videók létrehozását iPhone 16 Pro videóknál, amelyek térbeli hangot tartalmaznak.
GPU és nem GPU szűrők: A GPU szűrők mostantól megfelelő sorrendben kerülnek beillesztésre a nem GPU szűrők alá.
Diavetítés párbeszédablak: Javították a diavetítés generátorának túlzott magasságát, amely függőleges videó módban jelentkezett.
GPS szöveg szűrő beállításai: Javították a GPS szöveg szűrő GPS eltérítés értékének visszaállási hibáját.
Idő újra leképezés (Time Remap): Az Idő újra leképezés szűrő maximális idejének korlátozása javítja a fehér képkockák megjelenését.
Az új fejlesztésekkel és javításokkal a Shotcut most még megbízhatóbb és hatékonyabb eszköz lett a videószerkesztők számára.
Offline?
Beküldte balacy -
Értékelés:
Szuper fejlesztés, már nagyon kellett. Ami nagyon nagy előny, hogy telepítéskor már egy használható módot kapunk, ellenben a Kdenlivét be kell állogatni, hogy legyen benne ilyen.
Offline?
Beküldte balacy -
Értékelés:
Megéri az idő? Igen, mert kevesebb a javítás, és valljuk be nem túl kényelmes a szerkesztgetés a vágó programban.