Posts by Anna Kai
My PhD thesis, fresh from the press. I'll be defending it on Friday!
nors.ku.dk/english/cale...
Finally: My PhD defence is next Friday, November 7! There should be a Zoom link out soon—stay tuned! Hope to see some familiar faces on my screen 🧑🏻💻
We accept submissions in both English and Danish!
Just took over the position as editor-in-chief of the Journal of Language Works - a journal for BA and MA students working broadly with language.
Deadline for submissions, Sept. 1: tidsskrift.dk/lwo
Fedt at du har gode erfaringer! Hvilken model har du brugt?
Ikke helt sikker på hvad du mener med kodning/analyse. Tænker du på at den (muligvis) både oversætter og transskriberer på samme tid?
Jeg har indtil videre kun forsøgt mig med whisper. Eksemplet er baseret på deres “small”-model, men resultatet er ikke meget bedre med “medium”-modellen. Det skal lige siges at resultaterne er gode for engelsk - hvor der jo også er meget mere data
Thanks so much for this. I find your tutorials immensely helpful! Sadly, whisper performs quite poorly for Danish, also with the larger models.
Anvendelsesmulighederne synes (når man dykker bare en smule ned i materien) relativt begrænsede, og det virker ikke som om særligt mange er interesserede i at finde ud af hvad de her værktøjer reelt kan, så længe der kan spares penge (læs: arbejdskraft) på den korte bane. (5/5)
Men I en sproglig analysesammenhæng gør det altså værktøjet temmeligt ubrugeligt.
Og det bekræfter også lidt en nagende følelse jeg har gået med; at der er alt for meget hype omkring kunstig intelligens ift. hvad det rent faktisk kan (4/5)
Tyg lige på den. Det betyder at op mod 50 % af alle ord kan være forkert transskriberet.
Havde værktøjet virket, havde det været en game changer for sådan en som mig som bruger umådelige mængder af tid på databehandling (3/5)
Whisper er OpenAI's værktøj til talegenkendelse, og dansk er angivet som et "supported language" i dokumentationen. Og hvad vil det mon sige at være et "supported language", spørger du?
At sproget har en "word error rate" på under 50 % i test af modellen (2/5)
platform.openai.com/docs/guides/...
En halvdårlig transskription af et interview på dansk
Mit første forsøg med at bruge OpenAI's Whisper-model til automatisk transskription af talesprog. Vedhæftet er en halvdårlig transskription af mig der indleder et interview med en deltager.
Hvis ikke jeg havde lyttet til filen utallige gange, ville jeg tro jeg var ved at få et stroke 🧵(1/5)
Alle de nævnte udtryk anvender kildedomæner kendt fra metaforteorien, såsom KROP og BEVÆGELSE/RETNING, men at en sag der "står lige oppe i luften" skulle være nem at opklare, står ikke lige oppe i luften for mig. Nogen der kan forklare?
Det kan godt være at rigspolitiet nægter at have hørt om systematisk "vask" af sager, men når man har udviklet et så omfattende sprogligt inventar til at beskrive fænomenet, kan der næppe være tvivl om at det er en udbredt praksis - og en praksis der tales om.
www.dr.dk/nyheder/indl...
Two people frown at a phone. One says to the other, “Bluesky seems to be the app where you post about being on Bluesky.”
Are we doing it right? #NewYorkerCartoons
nyer.cm/CTZvmGD
🖊️ @jasonadamk.bsky.social