IBM esta aplicando las ideas desarrolladas en ordenar la secuencia molecular del ADN para la detección del Spam. Los spammers están incluyendo “un lenguaje coloquial o incluso típico de oficina” lo que confunde a los detectores de anti-spam basados exclusivamente en sistema de análisis Bayesian*.
En respuesta IBM esta desarrollando nuevos filtros más sofisticados para la lucha contra el Spam. Se cree que la idea de los programas usados para buscar patrones que se repetían en secuencias del ADN se podrían aplicar para buscar las frases que se repitén y que ofrecen a menudo correos “basura”.
Un nuevo programa llamado Chung-Kwei ( nombre basado en el feng-shui y que es el equivalente de proteger la casa , a proteger elordenador) se esta probando con el envió másivo de correos legales y de spam.
Según informa “New Scientist” el programa detecta casi el 97% de los mensajes Spam . IBM esta utilizando técnicas de filtrado así como el uso de otro productos como “SpamGuru”, una nueva tecnología de filtrado de correo disponible con Lotus Workplace 2.0.
*El teorema de Bayes es la fundamentacion metamática para este sistema de deteccion de Spam, funciona considerando los mail como un conjunto de palabra y combinaciones de letras y simbolos. Mediante el analisis de dos coleciones de mails, una de Spam y otra de correo sano, crea diccionarios con las ocurrencias de combinaciones mas frecuentes en cada uno, de esta manera es capaz de analizar y comparar cada mail con estos diccionarios, estableciendo un umbral a partir del cual, los que lo superen son considerados Spam y marcados como tal.
Fuente: The register