Farkas Anna – Társadalmi torzítások a gépi tanulásban: Esettanulmány a Google Fordítóról

Farkas Anna

Szociológia BA, 2020

témavezető: Németh Renáta

A közelmúltban több kutatás is készült azzal kapcsolatban, hogy a gépi tanuló algoritmusok hajlamosak megismételni vagy felerősíteni a valós társadalmi különbségeket. Ezt az algoritmikus torzításnak nevezett jelenséget a szakdolgozat egy Google Fordítóról készült esettanulmányon keresztül mutatja be, amely a gépi fordításban megjelenő nemi torzítást vizsgálja foglalkozások magyar-angol fordításánál. Az esettanulmány célja a Google Fordítóban megjelenő nemi torzítás mértékének mérése volt és azt vizsgálta, hogy az „ő egy orvos”-hoz hasonló mondatokat az algoritmus a hímnemű „he” vagy a nőnemű „she” személyes névmással fordítja-e.

A kutatás a nemi torzítás megállapításához a fordításokat a foglalkozások valós nemi arányához viszonyítja, illetve ahhoz, hogy a társadalom hogyan gondolkodik a foglalkozásokról: A különböző foglalkozásokat inkább nőiesnek vagy inkább férfiasnak tartják? A társadalom véleményét a foglalkozásokról az Inspira Group kutatócég segítségével egy omnibusz kérdőíves kutatás keretében mértük fel. Az esettanulmány bemutatja, hogy a Google Fordító fordításai jobban lefedik a társadalom foglalkozásokról alkotott véleményét, mint a foglalkozások valós nemi arányát.

A szakdolgozat egy kiegészítő kutatást is tartalmaz, amely azt mérte fel, hogy hogyan változnak a fordítások, ha a foglalkozások elé jelzőket teszünk. Ezek a mondatok a „jó”, „nagyon jó”, „rossz”, „nagyon rossz” jelzőket tartalmazták.

A szakdolgozat ezen a linken olvasható.