Polština je podle výzkumu nejlepším jazykem pro zadávání příkazů pro AI.
Polština se podle výzkumu americké Marylandské univerzity v Baltimoru a společnosti Microsoft ukázala jako nejpřesnější při zadávání příkazů umělé inteligenci. V mezinárodním srovnání 26 jazyků získala první místo před francouzštinou a italštinou, zatímco angličtina skončila až šestá. Výsledky byly zveřejněny v rámci nového benchmarku OneRuler, který testuje schopnost velkých jazykových modelů (LLM) zpracovávat dlouhé textové vstupy.
Podle autorů studie „One ruler to measure them all: Benchmarking multilingual long-context language models“ (Jedno kritérium pro všechny jazyky: Měření vícejazyčných modelů s dlouhým kontextem – pozn. red.) polština dosáhla průměrné úspěšnosti 88 procent, zatímco angličtina necelých 84 procent. Modely AI přitom obvykle trénují na největším množství dat právě v angličtině a čínštině, ale čínský jazyk se v žebříčku umístil s výsledkem 62 procent až na čtvrtém místě od konce.
Zkoumali sedm typů úkolů
Zkoumání probíhalo na sedmi typech úkolů, rozdělených do kategorií vyhledávání a agregace, s kontexty od 8 tisíc do 128 tisíc tokenů. Výzkumníci zjistili, že čím je kontext delší, tím více se prohlubuje rozdíl ve výkonnosti mezi tzv. vysokozdrojovými jazyky, jako jsou evropské, a nízkozdrojovými, jako svahilština či sothština. Rozdíl se zvýšil z 11 na 34 procent při nejdelších textech.
Přes relativně omezené množství dat, na kterých se velké jazykové modely učí polsky, dosahují v tomto jazyce vyšší přesnosti odpovědí, méně chyb a lepších výsledků při analýze rozsáhlých dokumentů. Autoři studie uvedli, že polština se ukázala jako nejvhodnější jazyk na tzv. promptování – zadávání dlouhých a komplexních otázek AI.