1994 Flashback

10. Februar 2025

Stan­dard: Blah, Blah, Blah, lüg, miss­ver­steh, nicht aus­kenn - falsch aus­sag, Bevöl­ke­rung ver­arsch, was bin ich für ein gro­ßer Exper­te, blah…

Bildschirmfoto 2025 02 10 um 10 30 55

Und dann wie anno 1994, als Trot­tel wie sie noch nicht im Inter­net unter­wegs waren:

Ers­tes Kom­men­tar (zum Zeit­punkt des Aufrufs)

Bildschirmfoto 2025 02 10 um 10 31 55

Kor­rekt.

Da rackerst du dich als Stan­dard Redak­teur ne Stun­de ab um kom­plet­ten bull­shit zu pro­du­zie­ren, und dann kommt ein Nut­zer daher, der mehr als eine Stun­de inves­tiert hat, der dich ein­fach kor­ri­giert, wo gibts denn sowas? Also nicht im Netz seit 1994!

Back­ground.

Ich lass mir seit drei Jah­ren Unter­ti­tel maschi­nell über­set­zen - und das vom Tool von “Akbar on Development”

https://www.syedgakbar.com/projects/dst

Ich habe mir das Equi­va­lent von 35 1950er comics maschi­nell über­set­zen las­sen, als ich die mal für drei Wochen gele­sen habe.

YHTCj4S

Dabei jedes mal die güns­tigs­ten Model­le ver­wen­det, um noch eine brauch­ba­re Qua­li­tät zu erhalten.

Hier ein Ver­gleich­front­end für eini­ge Model­le und Sprachen:

https://frontendtranslator.onrender.com/compare-translate

Bildschirmfoto 2025 02 10 um 11 04 20
Bildschirmfoto 2025 02 10 um 11 04 31

Bei TTS ist das aktu­ell viel­ver­spre­chends­te Modell kokoro-tts
https://huggingface.co/spaces/webml-community/kokoro-webgpu

Sie­he auch: https://claudio.uk/posts/audiblez-v4.html

edit: Die bes­te kom­er­zi­el­le Lösung zur Zeit ist: https://cartesia.ai

Das ehe­mals bes­te kos­ten­lo­se Modell, das noch kei­ne Into­na­ti­on from word con­text beherrscht Ivo­na Mar­le­ne für Deut­sche Into­na­ti­on und Ivo­na Amy für bri­tish English:
https://speech2go.online/ (Die Android Apps (apkpure.com) kos­ten­los nutzbar.)

Hier das tat­säch­li­che Fazit:

Es liegt am Lan­guage pair.

Eini­ge Model­le sind deut­lich bes­ser als andere.

Das Resul­tat war seit mehr als einem Jahr immer brauchbar.

Pri­ce per­for­mance Sie­ger war ChatGPT 4o. Rea­so­ning Model­le habe ich dafür noch nicht ver­wen­det. Mul­ti line trans­la­ti­on wird oft­mals zum Pro­blem beim Untertitel-Formating, wes­halb die meis­ten im Pro­duk­ti­ons­um­feld wohl nur sin­gle line Kon­text nut­zen dürf­ten. Promp­t­ing to skip, if unsu­re hilft um Gib­be­rish wei­ter zu reduzieren.

Deepl wird aktu­ell bereits von aktu­el­len LLM Base models ausgestochen.

Model­le die ähn­lich wahr­schein­li­che Wort Über­set­zun­gen anzei­gen, und die bei Bedarf wech­seln las­sen - erspa­ren bereits in 99% manu­el­les Nach­über­set­zen, nach ein­ma­li­ger manu­el­ler Korrektur.

Idio­me blei­ben problematisch.

TTS die Into­na­ti­on aus dem Kon­text auto­ma­ti­siert ablei­tet ist bereits sehr gut.

TTS die es schafft dabei das Voice Pro­fil des Spre­chers zu clo­nen noch mal deut­lich besser.

Sie­he:

Was mich bereits zu fol­gen­dem Nut­zungs­pro­fil bewo­gen hat -- auch wenn mein Eng­lisch in Rea­ding, Use of Eng­lish and Lis­tening der höchs­ten Punk­te­be­wer­tung von CEFR Level C2 ent­spricht (bes­ser geht nicht) las­se ich mir doch bereits fürs casu­al watching einer doo­fen Serie, oder eines Films Unter­ti­tel auto­ma­ti­siert von eng­lish auf Deutsch über­set­zen, da ich Deutsch ent­spann­ter (weni­ger Akti­vie­rung) lese. Und das seit nem Jahr. For­mel­les Sie Feh­ler, fal­sche Pro­no­mi­na Wech­sel (erneut, Kon­text­li­mit “per Zei­le”) -- alles egal, ich les es lie­ber auf Deutsch.

Zwei drei gro­be Schnit­zer Pro Film, bei denen man kurz auf­lacht, die aber meist im Kon­text des Films sofort rich­tig iden­ti­fi­ziert wer­den kön­nen -- dafür kor­ri­gier ich nichts.

Beson­ders wich­tig wird es für mich bei Fil­men die ich ger­ne in einer Spra­che sehen wür­de, die ich ver­ste­he, bei denen aber nur ander­spra­chi­ge Unter­ti­tel vor­lie­gen. Auch das klappt bei­na­he immer. Über­set­zun­gen nach eng­lish sind dabei qua­li­ta­tiv bei­na­he immer bes­ser. (Hol­län­disch Deutsch ist die ein­zi­ge Aus­nah­me von der Regel, die mir bis­her unter­ge­kom­men ist.).

Mensch­lich erstell­te Unter­ti­tel sind in 80% der Fäl­le in Punk­to Text­qua­li­tät immer noch deut­lich besser.









Hinterlasse eine Antwort