Êtes-vous capable de dire si c’est une fille ou un garçon qui a écrit un texte tapé à l’ordinateur? Et bien, un certain algorithme peut le faire avec une efficacité de 80%.
Pour pouvoir déterminer le sexe de l’auteur, l’algorithme du professeur Moshe Koppel a recours à l'évaluation de la récurrence de 467 mots clés. Les hommes préfèreraient catégoriser les choses et ils utilisent des déterminants ainsi que des quantificateurs. De leur côté, les femmes s’intéressent plus aux relations et utilisent plus les pronoms personnels.
Efficace à 79.5% (82.6% pour les textes non-fictifs), cet algorithme est un peu semblable à celui des logiciels anti-spam où il faut reconnaître le texte d’un pourriel. Son utilité : peut-être connaître si c’est vraiment une fille ou un garçon à qui on parle sur l’Internet ?