Filtrer son courrier électronique avec procmail

À quoi sert procmail ?

Procmail est un programme qui sert à filtrer les courriers électroniques. Grâce à lui, vous pouvez rediriger votre mail, le trier ou vous protéger contre le spam. Vous pouvez configurer votre mail avec un .procmailrc.

Ce que doit contenir un .procmailrc

Un .procmailrc commence par les lignes suivantes :

PATH=/bin:/usr/bin
MAILDIR=$HOME/Mail
LOGFILE=$MAILDIR/procmail.log
PATH=/bin:/usr/bin
On indique à procmail le chemin des programmes qu'il va utiliser.
MAILDIR=$HOME/Mail
On indique à procmail où se trouve votre répertoire de mail.
LOGFILE=$MAILDIR/procmail.log
On indique à procmail le nom d'un fichier où il mettra tous ses rapports d'activité et ses messages d'erreur (les logs). Les logs sont précieux pour faire des tests.

Comment ça marche ?

Les recettes

Les « recettes » (recipes) sont les éléments de base du .procmailrc. Leur principe est le suivant : on commence par spécifier des conditions (une condition dit à procmail ce qu'il doit regarder dans le courrier, par exemple l'adresse de l'expéditeur, ou encore le champ « Sujet ») puis on indique l'action à accomplir si les conditions sont remplies (par exemple, rediriger le courrier, ou l'envoyer à la poubelle).

Une recette a toujours le format suivant (le # introduit un commentaire pour expliquer le code, vous n'avez pas à recopier la partie après le #) :

:0 [drapeau(x)] [: [fichier verrou] ]
# Les conditions commencent chacune par *
      * condition(s)
      action à accomplir

Expressions régulières

Pour spécifier les conditions, on se sert d'expressions régulières. Une expression régulière est une notation permettant de définir des schémas de recherche. Pour cela, on se sert de métacaractères, aussi appelés jokers.

Joker Signification
^ Début de ligne
$ Fin de ligne
. Un caractère quelconque
[xy] N'importe quel caractère dans l'ensemble spécifié
[^xy] N'importe quel caractère hors de l'ensemble spécifié
foo|bar foo ou bar
c* Un nombre quelconque (même 0) de répétitions du caractère c

Quelques exemples :

Rediriger certains mails vers une autre adresse électronique

Redirection de base

Pour rediriger votre courrier électronique vers une autre adresse, c'est simple :

:0
# il n'y a pas de condition : tous les courriers sont concernés
# le "!" demande le forward vers l'adresse spécifiée
! toto@northpole.foo 

Redirection avec conditions

Toujours plus fort, maintenant . Imaginons que vous soyiez un fan de Scoubidou. Votre page web porte sur Scoubidou. Choupi (votre meilleur ami, souvenez-vous), vous a aidé à le réaliser. Vous souhaitez relayer les courriers qui vous arrivent et qui parlent de Scoubidou à Choupi. Avec procmail, vous pouvez le faire.

:0
# Concernés : tous les mails dont le sujet contient « Scoubidou »
* ^Subject:.*Scoubidou.* 
# On forwarde à Choupi
!  choupi@scoubidou-fan.com 

Comme vous pourrez le constater, les conditions peuvent porter sur tous les champs d'un courrier électronique : From, To, CC, Bcc, etc.

Ajoutons que dans cet exemple, vous souhaiteriez sans doute vous aussi lire les courriers « Scoubidou. » Avec la recette ci-dessus, ces courriers sont simplement reexpédiés vers Choupi, et vous ne les avez jamais dans votre boîte aux lettres. Nous allors utiliser un drapeau (flag) qui est une sorte d'option, qui modifie le comportement standard de procmail. Il suffit d'ajouter c après le :0, ce qui demande à procmail de copier dans le répertoire de mail les courriers qui arrivent. L'exemple complet est donc le suivant :

:0 c
# Concernés : tous les mails dont le sujet contient « Scoubidou »
* ^Subject:.*Scoubidou.*
# On forwarde à Choupi
!  choupi@scoubidou-fan.com

Filtrer le spam

Filtrer suivant le sujet

La plupart des spams sont des mails provenant d'expéditeurs bidons et différents à chaque fois, et qui ont pour point commun de vous promettre de l'argent, de vous proposer du Viagra, des diplômes par cher, et autres joyeusetés. Procmail vous permet d'identifier plus ou moins ces mails en fonction de leur sujet, et de les envoyer directement à la poubelle. De même, le filtrage par sujet permet de filtrer les mails pyramidaux (chaînes de l'amitié, fausses alertes de virus, etc.), que vous pouvez être amené à recevoir plusieurs fois.

Dans l'exemple suivant, vous allez filtrer tous les mails dont le sujet contient le mot « Viagra » en les envoyant vers /dev/null, la poubelle (attention, contrairement à Windows ou MacOS, vous ne pouvez pas récupérer des données de /dev/null, c'est un aller simple pour le grand vide).

:0
# Sont visés tous les mails dont le sujet contient Viagra
* ^Subject: .*Viagra.*
# Et on les envoie à la poubelle
/dev/null
La présence d'un /dev/null dans votre .procmailrc est dangeurese : la moindre erreur de syntaxe, la moindre coquille est susceptible d'envoyer tout votre mail dans /dev/null, soit le vide intersidéral d'où vous ne pouvez récupérer aucun courrier. En cas d'accident, vous pouvez vous adresser au SPI, mais faites particulièrement attention en éditant votre .procmailrc.

Vous pouvez également utiliser la syntaxe suivante :

:0
* ^Subject: .*Viagra.*
{
 EXITCODE=67 HOST
}

Pourquoi cet EXITCODE et pas /dev/null (la poubelle) ? Ce code renvoie une « address unknown » à l'expéditeur du courrier électronique (pour avoir la liste de tous ces codes, lire /usr/include/sysexits.h).

Attention, utiliser un exitcode n'est pas toujours une bonne idée. Certes, il vous procure la satisfaction de renvoyer au spammeur ses spams. Mais cela ne sert pas à grand chose : bien souvent, le spammeur filtre les messages d'erreur qui lui sont renvoyés. Que vous fassiez le mort (en reroutant les spams vers /dev/null) ou que vous lui renvoyez 150 messages d'erreur ne l'empêchera pas de continuer à vous spammer s'il y tient. D'autre part, mettre des exitcodes dans son .procmailrc peut être gênant pour vous si vous faites partie d'une mailing-list : le message d'erreur risque d'être répercuté à toute la liste.

Vous est-il déjà arrivé de recevoir, après avoir envoyé un mail à un camarade de l'Ecole, un courrier avec le sujet "Returned mail: Can't create output", et contenant le message cryptique suivant ?

  ----- The following address had permanent fatal errors -----
<pikachu@clipper.ens.fr>

Cela est certainement dû à un exitcode dans un .procmailrc...

Filtrer suivant l'expéditeur

Dans d'autres cas, vous pouvez très bien connaître l'adresse électronique de ceux qui vous spamment. Ce peut être une liste de diffusion à laquelle vous avez été abonné, volontairement ou non, et à laquelle les administrateurs de la liste ne vous désabonnent pas. La recette qu'il vous faut est la suivante : tous les courriers provenant de l'adresse spam@foo.bar seront impitoyablement envoyés à la poubelle (dans /dev/null, en fait).

:0
* ^From: .*spam@foo.bar
/dev/null

Filtrer suivant l'encodage

Vous recevez beaucoup de mails en provenance de Corée, qui sont un charabia illisible. Vous voudriez les filtrer. On rappelle que procmail peut filtrer sur n'importe quel en-tête de message. Si vous regardez les en-têtes d'un spam coréen (appuyez sur H, que vous utilisiez mutt ou pine, pour y avoir accès), vous verrez un champ appelé Content-type. Dans ce champ est déclaré charset="ks_c_5601-1987". Il vous suffit de filtrer cet encodagespour être débarrassé de la plupart des spams coréens :

:0
* ^Content-Type: .*charset="ks_c_5601-1987"*
/dev/null

De manière plus perverse, certains spams coréens ne déclarent pas leur encodage au bon endroit, pour éviter justement ce genre de filtres. L'encodage est alors annoncé dans le sujet. Pour y remédier, ajoutez simplement :

:0
* ^Subject: .*EUC-KR.*
/dev/null

:0
* ^Subject: .*ks_c_5601-1987.*
/dev/null

Trop de filtres nuit

Attention en installant des filtres anti-spam : vous prenez le risque d'écarter des courriers qui en fait n'en sont pas, mais qui répondent tout de même à vos règles.

Ce sera le cas d'un prof coréen qui vous écrit si vous filtrez les encodages coréens, d'un courrier parlant de FreeBSD si vous filtrez le mot « free », etc. Plus vos règles sont strictes, moins vous recevrez de spam, mais plus vous aurez de chances de perdre du courrier.

Pour cette raison, il vaut parfois mieux envoyer les courriers suspects dans un dossier spécial, appelé « spam », par exemple. Voir ci-dessous comment faire.

Envoyer directement certains mails dans un dossier particulier

Cette recette est particulièrement utile pour les listes de diffusion (mailing-lists) : vous pouvez envoyer tous les courriers provenant de la liste directement dans un dossier spécial, qui contiendra seulement les courriers de ce genre.

Admettons que vous apparteniez à la liste des amis de Scoubidou. Cette liste a pour adresse scoubidou@zoinx.foo, et tous les courriers de la liste ont pour champ expéditeur :

To: Les Amis de Scoubidou <scoubidou@zoinx.foo>

Vous voulez regrouper les courriers de la liste dans un dossier appelé « scoubidou. » La recette qu'il vous faut est la suivant :

# Le dernier ":" demande l'utilisation d'un fichier verrou
:0:
# La condition : tous les fichiers contenant 'scoubidou@zoinx.foo' 
# dans le champ 'To: '
* ^To.*scoubidou@zoinx.foo
# Action : placer tous ces mails dans le dossier « Scoubidou »
$HOME/Mail/scoubidou 

À quoi sert le fichier verrou ? Imaginons que deux courriers de la liste arrivent en même temps : deux procmails essaieront d'envoyer les deux messages dans le dossier en même temps. Si vous utilisez un fichier verrou, le premier procmail verrouillera le dossier pendant qu'il écrira son message dans le dossier, empêchant ainsi le second message d'y accéder. Une fois que le premier procmail aura fait son travail, le second prendra le relais en toute sécurité.

Attention ! Si vous classez ainsi vos mails, vous perdrez les avertissements « You have new mail. » Pour remédier à ce problème, il va s'agir d'utiliser une fonctionnalité du shell zsh...

Il suffit d'ajouter dans votre .zshrc la ligne suivante :

MAILPATH="$MAIL:$HOME/mail/Scoubidou?You have new mail in Scoubidou."

Si vous voulez appliquer la même technique à plusieurs dossiers, il faut les séparer par des symboles « : » de sorte que si vous êtes aussi fan des Schtroumpfs, vous pourrez, en plus de la recette procmail adaptée, mettre les lignes suivantes dans votre .zshrc :

MAILPATH="$MAIL:$HOME/mail/Scoubidou?You have new mail in Scoubidou.\
:$HOME/mail/Schtroumpfs?You have new mail in Schtroumpfs."

Un dossier spécial spam

Une application intéressante de classement concerne le spam. Pour des raisons évoquées plus haut, il n'est parfois pas prudent d'envoyer le courrier suspect directement vers /dev/null/ : vous risquez de perdre du vrai courrier. Il vaut mieux parfois rerouter le courrier vers un dossier spécial que vous consulterez seulement de temps à autres.

Prenons un exemple. Beaucoup de spams ont un Content-type en text/html, c'est-à-dire du HTML seulement sans copie texte. Inversement, il n'y a guère que les spams pour être en text/html : les gens normaux avec un logiciel mal configuré n'envoient guère que du HTML+ texte (donc un Content-type en multipart/alternative). Vous voulez donc filtrer le text/html. Mais l'expérience prouve que certains logiciels particulièrement malfaisants envoient des courriers parfaitement normaux en text/html. Solution : envoyer tous ces mails dans un dossier spécial.

Application :

:0
* ^Content-Type: text/html.*
$HOME/Mail/spam

Recettes imbriquées

Un dernier exemple pour la route ! Encore plus fort, maintenant ! Nous allons reprendre l'exemple du courrier à relayer à votre ami Choupi. Dans l'état où nous vous avions laissé, vous saviez lui relayer le courrier contenant « Scoubidou » dans le sujet et en garder une copie chez vous. Maintenant nous allons vous montrer comment faire ceci, mais en envoyant vos copies à vous dans le dossier « Scoubi. » Il s'agit donc d'une recette constituée de deux recettes imbriquées (chaque recette commence par un :0, souvenez-vous) :

:0:
* ^Subject:.*Scoubidou.*
{
  :0 c
# On fait suivre vers Choupi
  ! choupi@scoubidou-fan.com
# et en plus de ça...
  :0  
# ... on dépose la copie dans le dossier « Scoubi »
$HOME/Mail/scoubi
}

Conclusion

Ceci ne montre qu'une partie des possibilités de procmail. Vous pouvez faire beaucoup de choses plus compliquées mais tout aussi utiles : ajouter systématiquement un champ (Reply-To, par exemple), éviter les boucles... Pour davantage de renseignements, consultez les pages de man. man procmail est une description de procmail lui-même. Vous y trouverez les options de procmail, man procmailrc est très complet mais indubitablement compliqué. man procmailsc est à réserver aux experts de procmail. man procmailex propose des exemples prêts à utilisation. C'est sans doute la page de man la plus utile pour celui qui veut se familiariser davantage avec procmail.

Auteur  Marie-Lan Nguyen. Dernière modification : 2003-04-18