Sitio para la difusión de conocimiento informático. 

Twitter RSS

Entrenar SPAM/HAM en Bayes

Entrenamiento de Bayes – Spamassassin

El entrenamiento de correos en Bayes para Spamassassin, ya sea como HAM o SPAM, se realiza manualmente utilizando la herramienta “sa-learn”. Eso requiere exportar el correo envaiado por el usuario a un formato .eml y luego copiarlo hasta el servidor de correo para ejecutar la herramienta “sa-learn” y entrenar el correo como SPAM o HAM.

Ej. de entrenamiento manual:
– Entrenar un correo como SPAM: sa-learn –spam mail.eml
– Entrenar un HAM como HAM: sa-learn –ham mail.eml
– Verificamos la nueva puntuación del correo forzando a que
Spamassassin lo vuelva a procesar: cat mail.eml | spamassassin –lint -D | more
Al final de la salida de este comando veremos la puntuación que Spamassassin le otorgó a nuestro correo.

Para facilitar la tarea, a continuación detallamos como podemos configurar nuestro DNS interno y Postfix para enviar correos a entrenar en Bayes a la casilla ham@ham.ham para entrenar el correo como HAM; y spam@spam.spam para entrenar el correo como SPAM.

Continue Reading

 

Bayes en Spamassassin

Bayes en Spamassassin

El clasificador Bayesiano de Spamassassin trata de identificar el spam al ver lo que se llaman tokens, palabras o secuencias cortas de caracteres que se encuentran comúnmente en el spam o el ham. Si he entregado 100 mensajes a sa-learn que tiene la frase ampliación del pene y digo que se trata de un spam, cuando el mensaje 101 llega con las palabras pene y ampliación, el clasificador Bayesiano estará bastante seguro de que el nuevo mensaje es spam y aumentará la puntuación de ese mensaje. Más información en: http://wiki.apache.org/spamassassin/BayesFaq

En el siguiente ejemplo veremos como configurar Bayes en Spamassassin, usando una base de datos en MySQL lo que nos dará mayor rendimiento en el procesamiento de los correos. Quitando las tareas detalladas en el punto 3.1 del índice detallado a continuación, nos dejará una instalación de Bayes con una base de datos MySQL local. Lo que nos permite el punto 3.1 es poder replicar los nuevos correos aprendidos como SPAM o HAM, a otro servidor de correo y viceversa. Esto nos permite optimizar el procesamiento de correos y tener un respaldo de nuestra base Bayesiana.

Índice:
1.1 Instalación de Bayes
2.1 Configuración para MySQL
3.1 Configuración para Cluster MySQL
4.1 Comandos para administrar Bayes

Continue Reading

 

Spamassassin + DCC y Razor2

Plug-in DCC y Razor2

Qué es DCC?: DCC o Distributed Checksum Clearinghouse es un filtro de contenido anti-spam que se ejecuta en una variedad de sistemas operativos. La idea de la DCC es que si los destinatarios del correo podría comparar el correo que reciben, pueden reconocer un correo masivo no solicitado. Un servidor DCC atiende a informes de “fuzzy” sumas de comprobación de mensajes de los clientes y responde a consultas sobre el recuento total de las sumas de comprobación de los mensajes de correo. Consulte la página de DCC: http://www.rhyolite.com/dcc/.

Qué es Razor2?: Agentes Razor2 se conectan a la red Cloudmark Collaborative Security para informar sobre el spam y   comprobar el fingerprints. Cloudmark proporciona un acceso libre y abierto a la CCSN pero se reserva el derecho negar el acceso a cualquier persona.

Índice:
1.1 Instalación de DCC
2.1 Instalación de Razor2
3.1 Probando DCC y Razor2

Continue Reading

 

Anti-Spam Spamassassin

Anti-Spam Spamassassin

Está solución anti-spam  ya es ampliamente conocida y utilizada en varias soluciones de correo, por lo que la intención de esta publicación no es repetir lo ya conocido por todos. Sin embargo hagamos un breve repaso para aquellos que no la conocen:  SpamAssassin es un programa informático publicado bajo la licencia Apache 2.0, utilizado para el filtrado de SPAM en el servicio de correo electrónico basado en reglas. Ahora es parte de la Fundación Apache. SpamAssassin utiliza una variedad de técnicas de detección de spam, que incluye la detección de spam basado en DNS y el filtrado Bayesiano, programas externos, listas negras y bases de datos en línea.  El programa puede ser integrado con el servidor de correo para filtrar automáticamente todo el correo para un sitio, o por usuarios individuales en su propio buzón y se integra con varios programas de correo. SpamAssassin es altamente configurable, si se utiliza como un filtro de todo el sistema todavía puede ser configurado para soportar por las preferencias del usuario. Sin embargo les dejaremos algunas en este post para su instalación, configuración y administración.

Índice:
1.1 Instalación
2.1 Configurando Spamassassin
3.1 Probando Spamassassin
4.1 Integrando Spamassassin a Postfix

Continue Reading

 
Home Linux OS Archive for category "Spamassassin"