Personne n’aurait prédit qu’à partir de la découverte de l’ADN, on fabriquerait un outil qui permettrait de combattre le pourriel. Des scientifiques en bioinformatique du
Centre de Recherche TJ Watson d’IBM ont mis au point un filtre antipourriel basé sur la technique utilisée pour analyser des séquences génétiques d’ADN.
En analysant des séquences d’ADN, on peut déterminer de quelle protéine il s’agit. Pour détecter les pourriels, le fonctionnement est assez semblable. Chung-Kwei, c'est le nom du système, va détecter des groupes de mots dans les pourriels pour déterminer si c'en est un ou pas. Peut-être n’est-ce pas nouveau comme technique à première vue; la différence est que ce système s’entraîne tout seul à détecter les mauvais courriels. On lui donne des milliers de courriels jugés comme des pourriels et d’autres qui ne sont pas considérés comme tels.
Le système apprend à différencier les deux types de courriels avec les mots qu’il y a à l’intérieur. Un exemple simple: s’il voit plusieurs annotations différentes de «Sexe» dans les pourriels d’entraînement, comme «$exe, s3xe, etc», il notera que ce mot est généralement utilisé pour les pourriels. On n’a pas à lui donner tous les mots à bloquer. S’il fallait bloquer tous les courriels ayant plusieurs mots reliés au «sexe», on en bloquerait beaucoup qui serait de vrais messages.
Le filtre est efficace à 96,5%. Lors d’un test, les scientifiques ont entraîné le système avec 60 000 pourriels différents et 20 000 vrais courriels. Suite à l’entraînement qui a duré 15 minutes, le filtre s’est avéré un succès lorsqu’on lui a demandé de filtrer des courriels. Sur 60 000 pourriels, il n'en a oublié qu’un seul. Encore plusieurs tests sont à faire avant de le mettre sur le marché.