tuteurs.ens.fr/internet/courrier/procmail.tml

532 lines
18 KiB
Text
Raw Normal View History

<?xml version="1.0" encoding="UTF-8"?>
2002-12-16 07:21:00 +01:00
<!DOCTYPE html
PUBLIC "-//ENS/Tuteurs//DTD TML 1//EN"
"tuteurs://DTD/tml.dtd">
<html>
<head>
<title>Procmail</title>
</head>
<body>
<h1>Filtrer son courrier électronique avec procmail</h1>
2002-12-16 07:21:00 +01:00
<h2>À quoi sert procmail ?</h2>
2002-12-16 07:21:00 +01:00
<p>Procmail est un programme très puissant qui sert à filtrer les
courriers électroniques. Grâce à lui, vous pouvez rediriger votre
mail, le trier ou encore vous protéger contre le spam.
</p>
<p>
Pour donner des instructions à <code>procmail</code>, il vous faut
créer un fichier nommé <code>.procmailrc</code> (dans le monde Unix,
les fichiers commençant par un point et terminant par « rc » sont
2005-05-09 09:51:17 +02:00
souvent des fichiers de configuration).
</p>
2002-12-16 07:21:00 +01:00
<div class="attention"><h1><img
src="&url.tuteurs;icones/panneau_attention.png" alt="/!\" />
Attention ! <img src="&url.tuteurs;icones/panneau_attention.png"
alt="/!\" /></h1> Lisez bien l'<strong>intégralité</strong> de ce
2005-05-09 09:51:17 +02:00
tutorial, surtout les avertissements, avant d'installer un
<code>.procmailrc</code>. Procmail est un outil puissant et
dangereux. Vous risquez de perdre des courriers importants en
recopiant n'importe quoi à tort et à travers. Mieux vaut passer 5 minutes
de plus à lire tout plutôt que devoir dire coucou au SPI parce que vous
2003-05-18 21:32:21 +02:00
aurez perdu du courrier... </div>
<h2><a name="procmailrc">Ce que doit contenir un <code>.procmailrc</code></a></h2>
<p>
Commencez par créer un fichier nommé <code>.procmailrc</code> avec
votre éditeur préféré, puis copiez-collez les instructions qui suivent
(nous vous expliquons ci-dessous ce qu'elles veulent dire) :
</p>
2002-12-16 07:21:00 +01:00
<pre>
PATH=/bin:/usr/bin
MAILDIR=$HOME/Mail
SPAMBOX=spam
2002-12-16 07:21:00 +01:00
</pre>
<p>Explication ligne par ligne :</p>
2002-12-16 07:21:00 +01:00
<dl>
<dt><code>PATH=/bin:/usr/bin</code></dt>
<dd>On indique à procmail le chemin des programmes qu'il va
2002-12-16 07:21:00 +01:00
utiliser.</dd>
<dt><code>MAILDIR=$HOME/Mail</code></dt>
<dd>On indique à procmail où se trouve votre répertoire de mail.</dd>
<dt><code>SPAMBOX=spam</code></dt>
<dd>Cette ligne crée une « boîte à spam » (le répertoire
<code>$HOME/mail/spam</code>) dans votre boîte aux lettres. C'est là
que partiront les courriers suspects. Voir <a href="#spambox">infra</a>.</dd>
2002-12-16 07:21:00 +01:00
</dl>
<p>
Ces instructions de début sont la base pour faire marcher correctement
<code>procmail</code>, mais en soi, elles ne suffisent pas. Il vous
faudra spécifier, dans la suite du fichier, ce que vous voulez filtrer
à l'aide de règles de filtrage. C'est ce que nous vous expliquons
ci-dessous.
</p>
<p>
Vous pouvez aussi ajouter la ligne suivante :
</p>
<pre>
LOGFILE=$MAILDIR/procmail.log
</pre>
<p class="continue">
Ceci demande à Procmail de créer un journal (<i lang="en">log</i> en
anglais) de ce qu'il fait. Ce journal est très précieux pour faire des
tests, mais quand on l'oublie il prend très rapidement beaucoup de
place. Songez à l'effacer régulièrement quand vous en faites un.
</p>
<div class="attention">
<strong>Syntaxe :</strong> les retours à la ligne sont importants. Ne
recopiez pas tout à la suite. Les lignes commençant par # sont des
commentaires. De manière générale, ne prennez pas d'initiative pour
changer les recettes présentées ici si vous ne savez pas ce que vous
faites. </div>
<h2>Comment ça marche ?</h2>
2002-12-16 07:21:00 +01:00
<h3>Les règles de filtrage</h3>
2002-12-16 07:21:00 +01:00
<p>Les « recettes » (<i lang="en">recipes</i>) sont les éléments de
base du <code>.procmailrc</code>. Leur principe est le suivant :
on commence par spécifier des conditions (une condition dit à procmail
2002-12-16 07:21:00 +01:00
ce qu'il doit regarder dans le courrier, par exemple l'adresse de
l'expéditeur, ou encore le champ « Sujet ») puis on indique l'action à
2002-12-16 07:21:00 +01:00
accomplir si les conditions sont remplies (par exemple, rediriger le
courrier, ou l'envoyer à la poubelle).</p>
2002-12-16 07:21:00 +01:00
<p>
Une recette a toujours le format suivant (le # introduit un
commentaire pour expliquer le code, vous n'avez pas à recopier la
partie après le #) :</p>
2002-12-16 07:21:00 +01:00
<pre>
:0 [<a href="#flag">drapeau(x)</a>] [: [<a href="#lock">fichier verrou</a>] ]
# Les conditions commencent chacune par *
* condition(s)
action à accomplir
2002-12-16 07:21:00 +01:00
</pre>
<p>
Chaque recette s'ajoute dans le fichier <code>.procmailrc</code>, à la
suite du bloc de début (voir <a href="#procmailrc">ci-dessus</a>).
</p>
<h3>Expressions régulières</h3>
2002-12-16 07:21:00 +01:00
<p>
Pour spécifier les conditions, on se sert d'expressions
régulières. Une expression régulière est une notation permettant de
définir des schémas de recherche. Pour cela, on se sert de
métacaractères, aussi appelés jokers.
</p>
2002-12-16 07:21:00 +01:00
<table class="tableau">
2002-12-16 07:21:00 +01:00
<tr>
<th>Joker</th>
<th>Signification</th>
</tr><tr>
<td>^</td>
<td>Début de ligne</td>
2002-12-16 07:21:00 +01:00
</tr><tr>
<td>$</td>
<td>Fin de ligne</td>
</tr><tr>
<td>.</td>
<td>Un caractère quelconque</td>
2002-12-16 07:21:00 +01:00
</tr><tr>
<td>[xy]</td>
<td>N'importe quel caractère dans l'ensemble spécifié</td>
2002-12-16 07:21:00 +01:00
</tr><tr>
<td>[^xy]</td>
<td>N'importe quel caractère hors de l'ensemble spécifié</td>
2002-12-16 07:21:00 +01:00
</tr><tr>
<td>foo|bar</td>
<td>foo ou bar</td>
</tr><tr>
<td>c*</td>
<td>Un nombre quelconque (même 0) de répétitions du caractère c</td>
2002-12-16 07:21:00 +01:00
</tr>
</table>
<p><br />Quelques exemples :</p>
2002-12-16 07:21:00 +01:00
<ul>
<li><code>^From:</code> : cette condition vise toutes les chaînes
de caractère <code>From:</code> au début d'une ligne. On dirait une
en-tête de courrier électronique, non ? :-)</li>
<li><code>^From:.*choupi.*</code> : cette condition vise toutes
les chaînes de caractère <code>From:</code> au début d'une ligne,
suivies d'un ou plusieurs caractères, puis de choupi, puis d'un ou
plusieurs autres caractères. Cette fois, on a défini l'ensemble des
mails provenant d'une adresse contenant l'expression choupi : de
cette façon, on vise tous les mails provenant de Choupi, votre
2002-12-16 07:21:00 +01:00
meilleur ami.</li>
<li><code>^(From|Cc|To).*choupi.*</code>  cette fois, on vise
tous les mails qui viennent de Choupi, ceux où Choupi est en Cc:, et
ceux adressés à Choupi.</li>
2002-12-16 07:21:00 +01:00
</ul>
<h3>Rediriger certains mails vers une autre adresse électronique</h3>
2002-12-16 07:21:00 +01:00
<h4>Redirection de base</h4>
<p>
Pour rediriger votre courrier électronique vers une autre adresse,
c'est simple. Ici, on redirige le courrier vers l'adresse
<code>toto@polenord.pn</code>. Il n'y pas de condition (cela concerne
tous les mails). Le point d'exclamation (!) sert à dire qu'il faut
faire une redirection. Ajoutez donc à votre <code>.procmailrc</code>
la règle suivante :</p>
2002-12-16 07:21:00 +01:00
<pre>
:0
! toto@polenord.pn
2002-12-16 07:21:00 +01:00
</pre>
<h4>Redirection avec conditions</h4>
<p>
2005-05-09 09:51:17 +02:00
Toujours plus fort, maintenant. Imaginons que vous soyiez un fan
de Scoubidou. Votre page web porte sur Scoubidou. Choupi (votre
meilleur ami, souvenez-vous), vous a aidé à le réaliser. Vous
2002-12-16 07:21:00 +01:00
souhaitez relayer les courriers qui vous arrivent et qui parlent de
Scoubidou à Choupi. Avec procmail, vous pouvez le faire.
</p>
2002-12-16 07:21:00 +01:00
<pre>:0
# Concernés : tous les mails dont le sujet contient « Scoubidou »
* ^Subject:.*Scoubidou.*
# On forwarde à Choupi
! choupi@scoubidou-fan.com
2002-12-16 07:21:00 +01:00
</pre>
<p> Comme vous pourrez le constater, les conditions peuvent porter sur
tous les champs d'un courrier électronique : From, To, CC, Bcc,
2002-12-16 07:21:00 +01:00
etc.</p>
2003-05-18 21:32:21 +02:00
<p>Ajoutons que dans cet exemple, vous souhaiteriez sans doute vous
aussi lire les courriers « Scoubidou ». Avec la recette
2005-05-09 09:51:17 +02:00
ci-dessus, ces
courriers sont simplement reexpédiés vers Choupi, et vous ne les avez
jamais dans votre boîte aux lettres. Nous allors utiliser un <a
2002-12-16 07:21:00 +01:00
name="flag">drapeau</a> (<em lang="en">flag</em>) qui est une sorte
d'option, qui modifie le comportement standard de procmail. Il suffit
d'ajouter c après le :0, ce qui demande à procmail de copier dans
le répertoire de mail les courriers qui arrivent. L'exemple complet
est donc le suivant :</p>
2002-12-16 07:21:00 +01:00
<pre>
:0 c
# Concernés : tous les mails dont le sujet contient « Scoubidou »
* ^Subject:.*Scoubidou.*
# On forwarde à Choupi
! choupi@scoubidou-fan.com
2002-12-16 07:21:00 +01:00
</pre>
<h3>Filtrer le spam</h3>
<p>
On appelle « spam » le courrier électronique envoyé en masse, non
sollicité, généralement publicitaire. Un filtre tel que
<code>procmail</code> vous permet de lutter contre ce phénomène, mais
il est plus efficace d'avoir une stratégie d'ensemble combinant
logiciel anti-spam, filtre et prévention. Référez-vous à notre <a
href="antispam.html">page anti-spam</a> pour en savoir plus.
</p>
2002-12-16 07:21:00 +01:00
<h4>Filtrer suivant le sujet</h4>
<p> La plupart des spams sont des mails provenant d'expéditeurs bidons
et différents à chaque fois, et qui ont pour point commun de vous
promettre de l'argent, de vous proposer du Viagra, des diplômes par
cher, et autres joyeusetés. Procmail vous permet d'identifier plus ou
2002-12-16 07:21:00 +01:00
moins ces mails en fonction de leur sujet, et de les envoyer
directement à la poubelle. De même, le filtrage par sujet permet de
filtrer les mails pyramidaux (chaînes de l'amitié, fausses alertes de
virus, etc.), que vous pouvez être amené à recevoir plusieurs fois.
2002-12-16 07:21:00 +01:00
</p>
<p>
Dans l'exemple suivant, vous allez filtrer tous les mails dont le
sujet contient le mot « Viagra » en les envoyant vers votre poubelle à
spam, <code>$HOME/mail/spam</code>. Voire <a href="#spambox">infra</a>
pour plus d'explication.
2002-12-16 07:21:00 +01:00
</p>
<pre>
:0
# Sont visés tous les mails dont le sujet contient Viagra
* ^Subject: .*Viagra.*
# Et on les envoie à la poubelle à spam
$SPAMBOX
2002-12-16 07:21:00 +01:00
</pre>
<h4>Filtrer suivant l'expéditeur</h4>
2002-12-16 07:21:00 +01:00
<p> Dans d'autres cas, vous pouvez très bien connaître l'adresse
électronique de ceux qui vous spamment. Ce peut être une liste de
diffusion à laquelle vous avez été abonné, volontairement ou non, et à
laquelle les administrateurs de la liste ne vous désabonnent pas. La
recette qu'il vous faut est la suivante : tous les courriers
provenant de l'adresse <code>spammeur@tagada.com</code> seront
impitoyablement envoyés dans votre boîte à spam.</p>
2002-12-16 07:21:00 +01:00
<pre>
:0
* ^From: .*spammeur@tagada.com
$SPAMBOX
2002-12-16 07:21:00 +01:00
</pre>
2003-03-07 14:59:35 +01:00
<h4>Filtrer suivant l'encodage</h4>
<p>Vous recevez beaucoup de mails en provenance de Corée, qui sont un
2003-03-07 14:59:35 +01:00
charabia illisible. Vous voudriez les filtrer. On rappelle que
procmail peut filtrer sur n'importe quel en-tête de message. Si vous
regardez les en-têtes d'un spam coréen (appuyez sur <code>H</code>,
que vous utilisiez mutt ou pine, pour y avoir accès), vous verrez un
champ appelé <code>Content-type</code>. Dans ce champ est déclaré
<code>charset="ks_c_5601-1987"</code>. Il vous suffit de filtrer cet
encodagespour être débarrassé de la plupart des spams
coréens :</p>
2003-03-07 14:59:35 +01:00
<pre>
:0
* ^Content-Type: .*charset="ks_c_5601-1987"*
$SPAMBOX
2003-03-07 14:59:35 +01:00
</pre>
<p>De manière plus perverse, certains spams coréens ne déclarent pas
leur encodage au bon endroit, pour éviter justement ce genre de
filtres. L'encodage est alors annoncé dans le sujet. Pour y remédier,
ajoutez simplement :</p>
2003-03-07 14:59:35 +01:00
<pre>
:0
* ^Subject: .*EUC-KR.*
$SPAMBOX
2003-03-07 14:59:35 +01:00
:0
* ^Subject: .*ks_c_5601-1987.*
$SPAMBOX
</pre>
<p>
Si vous êtes sûr de ne pas vouloir de mails en encodage coréen, vous
pouvez mettre ces mails à la poubelle au lieu de les mettre adns la
boîte à spam. Sur UNIX, la poubelle est
<code>/dev/null</code>. Attention, contrairement à la poubelle de
Windows ou MacOS, il n'y a pas de filet de sécurité, on ne peut plus
récupérer les données une fois poubellisées. Ceci donne :
</p>
<pre>
:0
* ^Subject: .*EUC-KR.*
2003-03-07 14:59:35 +01:00
/dev/null
</pre>
<div class="attention">
<strong>Attention</strong> : la présence d'un <code>/dev/null</code>
dans votre <code>.procmailrc</code> est dangereuse : la moindre
erreur de syntaxe, la moindre coquille est susceptible d'envoyer tout
votre mail dans <code>/dev/null</code>, soit le vide intersidéral d'où
vous ne pouvez récupérer aucun courrier. En cas d'accident, vous
pouvez vous adresser au <a href="http://www.spi.ens.fr/">SPI</a>, mais
faites particulièrement attention en éditant votre
<code>.procmailrc</code>.</div>
<h4>Trop de filtres nuit</h4>
<p>En installant des filtres anti-spam : vous prenez le risque
d'écarter des courriers qui en fait n'en sont pas, mais qui répondent
tout de même à vos règles. Ce sera le cas d'un prof coréen qui vous
écrit si vous filtrez les encodages coréens, d'un courrier parlant de
FreeBSD si vous filtrez le mot &#171; free &#187;, d'un courrier dont
le sujet contient « bissextile » si vous filtrez « sex », etc. Plus
vos règles sont strictes, moins vous recevrez de spam, mais plus vous
aurez de chances de perdre du courrier.</p>
<p>Pour cette raison, il vaut parfois mieux envoyer les courriers
suspects dans un dossier spécial, appelé &#171; spam &#187;, par
exemple. Voir ci-dessous comment faire.</p>
2002-12-16 07:21:00 +01:00
<h3>Envoyer directement certains mails dans un dossier
particulier</h3>
<p> Cette recette est particulièrement utile pour les listes de
diffusion (<em lang="en">mailing-lists</em>) : vous pouvez envoyer
2002-12-16 07:21:00 +01:00
tous les courriers provenant de la liste directement dans un dossier
spécial, qui contiendra seulement les courriers de ce genre.</p>
2002-12-16 07:21:00 +01:00
<p> Admettons que vous apparteniez à la liste des amis de
2002-12-16 07:21:00 +01:00
Scoubidou. Cette liste a pour adresse
<code>scoubidou@zoinx.foo</code>, et tous les courriers de la liste
ont pour champ expéditeur :</p>
2002-12-16 07:21:00 +01:00
<pre>
To: Les Amis de Scoubidou &lt;scoubidou@zoinx.foo&gt;
</pre>
<p>Vous voulez regrouper les courriers de la liste dans un dossier
appelé « scoubidou ». La recette qu'il vous faut est la
suivant :</p>
2002-12-16 07:21:00 +01:00
<pre>
# Le dernier ":" demande l'utilisation d'un fichier verrou
:0:
# La condition : tous les fichiers contenant 'scoubidou@zoinx.foo'
# dans le champ 'To: '
* ^To.*scoubidou@zoinx.foo
# Action : placer tous ces mails dans le dossier « Scoubidou »
$HOME/Mail/scoubidou
2002-12-16 07:21:00 +01:00
</pre>
<p>À quoi sert le <a name="lock">fichier verrou</a> ? Imaginons
que deux courriers de la liste arrivent en même temps : deux
2002-12-16 07:21:00 +01:00
procmails essaieront d'envoyer les deux messages dans le dossier en
même temps. Si vous utilisez un fichier verrou, le premier procmail
verrouillera le dossier pendant qu'il écrira son message dans le
dossier, empêchant ainsi le second message d'y accéder. Une fois que
2002-12-16 07:21:00 +01:00
le premier procmail aura fait son travail, le second prendra le relais
en toute sécurité. </p>
2002-12-16 07:21:00 +01:00
<div class="encadre">
<strong>À noter :</strong> si vous classez ainsi vos mails, vous
perdrez les avertissements « You have new mail. » Pour
remédier à ce problème, il va s'agir d'utiliser une fonctionnalité du
shell zsh...
</div>
2002-12-16 07:21:00 +01:00
<p>Il suffit d'ajouter dans votre <code>.zshrc</code> la ligne
suivante :</p>
2002-12-16 07:21:00 +01:00
<pre>
MAILPATH="$MAIL:$HOME/mail/Scoubidou?You have new mail in Scoubidou."
</pre>
<p>Si vous voulez appliquer la même technique à plusieurs dossiers, il
faut les séparer par des symboles « : » de sorte que si vous êtes
aussi fan des Schtroumpfs, vous pourrez, en plus de la recette
<code>procmail</code> adaptée, mettre les lignes suivantes dans votre
.zshrc :
</p>
2002-12-16 07:21:00 +01:00
<pre>
MAILPATH="$MAIL:$HOME/mail/Scoubidou?You have new mail in Scoubidou.\
:$HOME/mail/Schtroumpfs?You have new mail in Schtroumpfs."
2002-12-16 07:21:00 +01:00
</pre>
<h4><a name="spambox">Une « boîte à spam »</a></h4>
<p>
Une application intéressante de classement concerne le spam. Pour des
raisons évoquées plus haut, il n'est parfois pas prudent d'envoyer le
courrier suspect directement vers <code>/dev/null/</code> : vous
risquez de perdre du vrai courrier. Il vaut mieux parfois rerouter le
courrier vers une boîte à spam.
</p>
<p>
L'avantage d'une boîte à spam est que vous n'êtes plus dérangé pour
rien par les avertissements « You have new mail ». Il vous suffit de
consulter la boîte de temps à autre, toutes les semaines disons, et de
faire un tri rapide de vrais spams et des faux.
</p>
<p>
Prenons un exemple. Beaucoup de spams ont un <code>Content-type</code>
en <code>text/html</code>, c'est-à-dire du HTML seulement sans copie
texte. Inversement, il n'y a guère que les spams pour être en
<code>text/html</code> : les gens normaux avec un logiciel mal
configuré n'envoient guère que du HTML+ texte (donc un
<code>Content-type</code> en <code>multipart/alternative</code>). Vous
voulez donc filtrer le <code>text/html</code>. Mais l'expérience
prouve que certains logiciels particulièrement malfaisants envoient
des courriers parfaitement normaux en
<code>text/html</code>. Solution : envoyer tous ces mails dans la
boîte à spam.
</p>
<p>Application :</p>
<pre>
:0
* ^Content-Type: text/html.*
$HOME/Mail/spam
</pre>
<h4>Recettes imbriquées</h4>
2002-12-16 07:21:00 +01:00
<p>
Un dernier exemple pour la route ! Encore plus fort,
maintenant ! Nous allons reprendre l'exemple du courrier à
relayer à votre ami Choupi. Dans l'état où nous vous avions laissé,
vous saviez lui relayer le courrier contenant « Scoubidou » dans le
2002-12-16 07:21:00 +01:00
sujet et en garder une copie chez vous. Maintenant nous allons vous
montrer comment faire ceci, mais en envoyant vos copies à vous dans le
dossier « Scoubi. » Il s'agit donc d'une recette constituée de deux
recettes imbriquées (chaque recette commence par un :0,
souvenez-vous) :</p>
2002-12-16 07:21:00 +01:00
<pre>
:0:
* ^Subject:.*Scoubidou.*
2002-12-16 07:21:00 +01:00
{
 :0 c
# On fait suivre vers Choupi
! choupi@scoubidou-fan.com
# et en plus de ça...
 :0
# ... on dépose la copie dans le dossier « Scoubi »
$HOME/Mail/scoubi
2002-12-16 07:21:00 +01:00
}
</pre>
<h2>Conclusion</h2>
<p> Ceci ne montre qu'une partie des possibilités de procmail. Vous
pouvez faire beaucoup de choses plus compliquées mais tout aussi
utiles : ajouter systématiquement un champ (Reply-To, par
exemple), éviter les boucles... Pour davantage de renseignements,
consultez les pages de man (si vous ne savez pas ce qu'est une page de
man, consultez notre <a href="&url.tuteurs;unix/aide.html">page sur
l'aide en ligne d'Unix</a>) :
2002-12-16 07:21:00 +01:00
</p>
<ul>
<li> <code>man procmail</code> est une description de procmail
lui-même. Vous y trouverez les options de procmail.
</li>
<li> <code>man procmailrc</code> est très complet mais indubitablement
compliqué.</li>
<li> <code>man procmailsc</code> est à réserver aux experts de
procmail.
</li>
<li> <code>man procmailex</code> propose des exemples prêts à
utilisation. C'est sans doute la page de man la plus utile pour celui
qui veut se familiariser davantage avec procmail.
</li>
</ul>
2002-12-16 07:21:00 +01:00
<div class="metainformation">
Auteur  Marie-Lan Nguyen. <date value="from git" /></div>
2002-12-16 07:21:00 +01:00
</body>
</html>