Det er måske et dumt spørgsmål: Kan Folketinget ikke bare bruge Whisper (på en lokal server) og dermed få live transskriberet taler på fremmedsprog?
Og hvis Whisper endnu ikke understøtter Grønlandsk, måske noget af simultantolkningsbudgettet kunne bruges på at fork’e og udbygge modellen?
Det er slet ikke sikkert whisper KAN understøtte grønlandsk. Grønlandsk er et sprog med en meget meget anderledes grammatik end dansk, så al oversættelse er i et vist omfang fortolkning og gendigtning, og det er bare enormt svært for en computer at finde ud af, specielt når teknologien baserer sig på stokastiske modeller og ikke på analyse.
USA har i cirka 60 år smidt utroligt mange penge - milliarder og milliarder af dollars - efter MIT for at forsøge at lave god oversættelsessoftware som kan håndtere andre sprog end dem der er tæt beslægtede (fx dansk & engelsk), og de har stort set ikke noget at vise frem.
Tak for dit perspektiv. Jeg er tildels uenig. Ja, grønlandsk har sine grammatiske udfordringer, men sprogmodeller kan i dag håndtere strukturelt forskellige sprog ret godt.
Efter min overbevisning handler det ikke kun om, hvor meget grønlandsk ligner andre sprog, men at vi mangler nok lokal træningsdata i høj kvalitet (transkriberet tale).
MIT, som du refererer til, er til ældre, regelbaseret oversætning, og ikke machine learning-modeller. Jeg bør præcisere, at Whisper, som jeg nævner, er designet til talegenkendelse - ikke til oversættelse. Selve oversættelsen er den største udfordring. Det ser dog ud til, at der findes tjenester, som nu arbejder på dette med AI: https://nutserut.gl/