БАКУ, 11 сен — Sputnik. Бразильские исследователи под руководством Луиса Ламба обнаружили, что алгоритмы сервиса Google Translate демонстрируют предвзятость при переводе предложений с одного языка на другой без грамматической категории рода, сообщает N+1.
По результатам перевода нескольких тысяч предложений с 12 языков без грамматического рода на английский выяснилось, что технические профессии гораздо реже соотносятся у сервиса с женщинами, чем профессии в сфере здравоохранения. К тому же, распределение представителей полов в профессиях не соответствует реальной статистике трудоустройства.
Среди выбранных языков без грамматического рода были венгерский, йоруба, эстонский, финский, суахили, а предложения строились по формуле X is a Y, где X — местоимение третьего лица, а Y — слово, обозначающее профессию.
Во всех выбранных языках местоимение третьего лица выражается единым словом, а обозначения профессий также были соотносимы с обоими полами, среди них были такие профессии как врач, программист и организатор свадеб. Всего было использовано 1019 профессий из 22 разных категорий.
Обнаружено поддельное мобильное приложение, крадущее фото и документы >>
По результатам перевода предложений было выявлено отклонение при указании определенных профессий. Так, сервис представителей технических профессий в 71% к мужскому роду, а к женскому лишь в четырех. Однако, при указании профессий из отрасли здравоохранения количество переводов с женским родом увеличилось до 23%.
Авторы исследования для снижения степени сексизма в работе переводчика предложили простое решение: включить для безродовых языков случайный выбор местоимения при переводе.