🚨 Nieuw Papier
Een LLM trainen om een laag-resource taal te spreken
(EACL workshop, 2026)
Tulu wordt gesproken door meer dan 2 miljoen mensen in het kustgebied van Karnataka en LLM's kunnen het eigenlijk niet spreken. We hebben 85% grammaticale nauwkeurigheid bereikt zonder iets te finetunen of een enkel nieuw trainingsvoorbeeld te verzamelen.
🔥 Nieuw onderzoek: Kunnen coderingsagenten daadwerkelijk GPU-inferentiecode optimaliseren?
We hebben ISO-Bench gebouwd: 54 echte optimalisatietaken van @vllm_project & @sgl_project en ontdekten dat agenten vaak het probleem begrijpen, maar de oplossing niet kunnen uitvoeren.
🚨 Schokkend: De kwaliteit van het antwoord dat je krijgt van de LLM hangt af van de taal die je gebruikt!
Ons nieuwe paper onthult hoe LLM's taal met cultuur verweven, wat leidt tot cultureel verschillende antwoorden puur op basis van de taal van de vraag 👇
Geaccepteerd op LM4UC, AAAI!