Profilage géographique

Formation

En Ligne

Prix sur demande

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Description

  • Typologie

    Formation

  • Méthodologie

    En ligne

Grâce à cette formation vous pourrez acquérir les connaissances nécessaires qui vous permettrons d’ajouter des compétences à votre profil et obtenir de solides aptitude qui vous offriront de nombreuses opportunités professionnelles.

Questions / Réponses

Ajoutez votre question

Nos conseillers et autres utilisateurs pourront vous répondre

À qui souhaitez-vous addresser votre question?

Saisissez vos coordonnées pour recevoir une réponse

Nous ne publierons que votre nom et votre question

Les Avis

Les matières

  • Profilage

Le programme

Introduction du cours

Bonjour à tous !
Je vais vous présenter dans ce tutoriel le profilage géographique.

Le profilage géographique est une technique notamment utilisée par la police pour retrouver des serial killers. Ce qu'elle a d'intéressant, c'est qu'elle met en évidence la manière dont trois branches paraissant plus ou moins éloignées sont utilisées de concert dans un même but. En effet, le profilage géographique est un excellent exemple montrant comment les sciences humaines, les mathématiques et l'informatique s'unissent pour combattre un ennemi commun (ou pas) : les serial killers.

Nous commencerons par voir comment fonctionne le profilage géographique en théorie, puis nous analyserons en détail les mathématiques qui se cachent derrière. Et finalement, nous coderons nous-mêmes un programme de profilage géographique avec ces connaissances nouvellement acquises.

En ce qui concerne la programmation, je vais tenter d'expliquer le tout en restant le plus général possible pour que vous puissiez utiliser le langage et la bibliothèque graphique que vous voulez. Néanmoins, les exemples seront donnés en C avec la bibliothèque SDL.

Du côté des prérequis pour la partie mathématique, il n'y a rien de bien compliqué, mais ce n'est pas extrêmement simple non plus. Je m'efforcerai bien entendu d'être le plus clair possible, mais il faut quand même connaître quelques bases, telles que le théorème de Pythagore, les fractions, la règle de trois etc.

Alors, vous êtes prêts à chasser des serial killers ? J'espère que vous êtes bien armés, car ils sont dangereux !

La théorieUn peu d'histoire

Le profilage géographique est une technique développée dans les années 90 par Kim Rossmo, un mathématicien policier. Il est le premier à avoir eu une approche différente dans les enquêtes concernant les serial killers.
En effet, les mathématiciens criminologues de l'époque essayaient de créer un modèle mathématique qui leur permettrait de déterminer le lieu du prochain crime d'un serial killer. Mais Rossmo a très vite compris que cette idée était quasiment irréalisable, car il y avait trop de variables en jeu. Il eut alors l'idée de faire la démarche contraire : plutôt que d'essayer de prédire le lieu du prochain crime, il a cherché à trouver le lieu de résidence du criminel.

Le jet d'arrosage

Jet d'arrosage
Pour illustrer cette idée, on emploie souvent la métaphore du jet d'arrosage. En effet, il est impossible de savoir où va tomber chaque goutte d'eau du jet. Il est aussi impossible de prédire l'endroit où le tueur va commettre son prochain crime.
En revanche, en analysant le motif formé par les gouttes d'eau, il est possible de déterminer leur origine. C'est ce que l'on fait lorsque l'on effectue le profilage géographique d'un serial killer. Via les coordonnées géographiques de chacun de ses crimes, on essaie de déterminer l'endroit où il habite.
Cette technique fonctionne très bien : des analyses comportementales ont prouvé que les serial killers ont une prédisposition à commettre leurs crimes près de chez eux, mais pas trop près non plus (nous y reviendrons). Ainsi, en général, plus on s'éloigne du lieu du crime, plus la probabilité qu'il s'agisse de la zone de résidence du criminel diminue.

L'être humain et l'aléatoire : une grande histoire d'amour

Un autre problème avec les humains, qui nous arrange bien dans ce cas, est la difficulté qu'ils rencontrent à imiter l'aléatoire. ^^
En effet, les serial killers ont tendance à chercher à commettre leurs crimes de manière aléatoire pour tromper la police. Mais ils vont ainsi créer un motif uniforme (à l'instar des gouttes d'eau autour du jet), qui sera tout sauf aléatoire. Il est donc relativement facile de créer un modèle mathématique qui permettra de situer le lieu de résidence du criminel à partir du motif formé par les lieux des crimes.

Observez ces deux images illustrant mes propos.
Si je demande à une personne quelconque de dessiner des points de manière aléatoire, il y a énormément de chances qu'elle me dessine quelque chose ressemblant à l'image de gauche. Mais un œil un peu critique remarquera très vite que cela n'a rien à voir avec de l'aléatoire. Une meilleure simulation de l'aléatoire, que l'on pourrait qualifier d'« aléatoire naturel », est quelque chose qui ressemblerait plutôt à l'image de droite.

Aléatoire « humain » (à gauche) et « naturel » (à droite)

La Formule

Maintenant que nous avons compris l'idée qui se cache derrière le profilage géographique, analysons son aspect un peu plus mathématique.

Rigel

Je disais donc que, pour parvenir à calculer le lieu de résidence du serial killer, Rossmo a développé une unique formule (la Formule de Rossmo), qui permet de calculer la probabilité que le tueur en série habite dans une certaine zone de la région concernée par les meurtres.

En fait, le terme probabilité n'est pas le terme correct pour désigner le résultat que nous renvoie la formule. En effet, cette dernière calcule, pour chaque zone de la carte, une certaine valeur. Et ce que l'on va faire, c'est simplement relativiser les différentes valeurs entre elles. Donc, si par exemple la plus haute valeur correspond à 2000, et la plus petite à 1000, nous allons définir que la première équivaut aux 100 %, et la seconde à 0 %. Ainsi, la zone de valeur 1500 vaudra 50 %.
Même si j'utiliserai dans la suite, pour des raisons pratiques, le terme « probabilité », il faudra comprendre qu'il s'agit d'une valeur relativisée, qui indique quelles sont les zones où le tueur a le plus de chances d'habiter, par rapport aux autres secteurs de la carte.

Bref, la formule va ainsi nous permettre de modéliser le comportement du serial killer en appliquant ce que l'on sait sur son mode opératoire (abrégé aussi M.O. pour modus operandi en latin).

Cette partie est bien entendu la plus difficile. Le travail du policier est de déterminer le profil psychologique le plus proche du serial killer. (Faut quand même leur laisser faire du boulot à ces policiers. Suffit pas de cliquer sur un bouton pour résoudre un crime. :-° )

Une fois que ce profil a été déterminé, il ne reste plus au policier qu'à entrer les coordonnées des crimes dans un logiciel, ainsi que les autres informations sur le profil du serial killer (vous verrez de quoi je parle plus tard). Le programme s'occupera de calculer les probabilités sur une carte et coloriera les différentes valeurs de probabilités en une certaine couleur. Le logiciel en question s'appelle Rigel et est utilisé partout dans le monde.

Sur l'image ci-dessous, nous pouvons observer un exemple de profil géographique (les zones en rouge représentant des régions à forte probabilité, tandis que les secteurs violets sont moins probables).

Exemple de profilage géographique

Bien entendu, ce qui nous intéresse est de savoir comment fonctionne ce programme ! …quoi, pas vous ?

Fonctionnement général de la formule

Nous abordons ici la partie difficile. Nous allons essayer de comprendre la Formule de Rossmo, qui permet d'afficher un profil géographique sur une carte. Âmes sensibles, s'abstenir, car ça pique les yeux. o_O

$p_{i,j} = \sum_{n=1}^{c} \left [ { \frac{\phi}{ (|X_i-x_n| + |Y_j-y_n|)^f } } + { \frac{(1-\phi)(B^{g-f})}{ (2B - \mid X_i - x_n \mid - \mid Y_j-y_n \mid)^g } } \right ]$

Ne vous inquiétez pas, nous allons découvrir ensemble la signification de cette belle formule.
Néanmoins, pour les personnes plus expérimentées, voici un court descriptif des symboles.

  • $p_{i,j}\in\mathbb{R}$ : probabilité p que le tueur réside à la coordonnée (i;j).

  • $c\in\mathbb{N}$ : nombre de crimes.

  • $X_i,Y_j\in\mathbb{N}$ : position du point de coordonnées (i;j).

  • $x_n,y_n\in\mathbb{N}$ : coordonnées du crime n.

  • $f\in\mathbb{R}$ : accentue ($f>0$) ou diminue ($f<0$) l'effet « plus on s'éloigne, plus la probabilité baisse ».

  • $g\in\mathbb{R}$ : accentue ($g>0$) ou diminue ($g<0$) l'effet de « zone tampon ».

  • $B\in\mathbb{R}$ : rayon de la zone tampon.

  • $\phi = \begin{cases} 1, & \mathrm{\quad if\;} ( \mid X_i - x_n \mid + \mid Y_i - y_n \mid ) > B \quad \iff \quad (X_{n},Y_{n}) \in [-B;B]\\ 0, & \mathrm{\quad else} \end{cases}$

Examinons à présent cette formule de façon plus détaillée. En premier lieu, imaginons la carte quadrillée d'une région :

Carte

Lors d'applications réelles, chaque carré du quadrillage correspondra évidemment à un pixel. Pour des raisons de lisibilité, j'ai utilisé des carrés un peu plus gros.

Vous remarquez que chaque carré est défini par les coordonnées i et j. La formule va en fait calculer pour chaque petit carré un à un (carré qui sera, pour rappel, un pixel en réalité) la probabilité que le tueur y réside.
La grosse formule que vous voyez ci-dessus devra dès lors être appliquée à l'ensemble des carrés de notre carte ! :o
C'est pour cela qu'elle contient $p_{i,j}$. Cela peut se traduire par : « la probabilité p que le tueur réside dans le carré de coordonnées i et j ». (Il est pas beau, le pouvoir qu'ont les maths de traduire une phrase en 3 symboles ? )

Observons donc par quel moyen la formule calcule cette probabilité. Tout d'abord, vous voyez ceci :

$p_{i,j} = \sum_{n=1}^{c} \left [ ... \right ]$

Le symbole $\Sigma$ est la lettre grecque sigma (majuscule) et signifie en mathématiques « faire une somme de tout ce qui se trouve entre crochets ». En fait, pour comprendre comment ça marche, sachez que le fonctionnement est similaire à une boucle en programmation. La lettre que vous apercevez sous le sigma est la variable (ici, c'est la lettre n). Cette variable va s'incrémenter à chaque tour de boucle, la valeur de départ étant la valeur indiquée sous le sigma (ici 1). La somme s'arrêtera lorsque n sera égal au nombre indiqué au-dessus du sigma (la lettre c).

Voici un rapide exemple pour que vous compreniez. Si l'on écrit :

$\sum_{n=1}^{10} n$

Cela signifie simplement : « faire la somme de 1 + 2 + 3 + ... + 10 ». Ou, si vous préférez, en voici l'équivalent en C++ (c'est quasiment pareil pour la majorité des langages de programmation) :

int resultat = 0; for(int n=1; n<=10; n++) resultat+=n;

Bref, si vous avez déjà programmé, vous ne devriez pas avoir de mal à saisir.

Revenons-en à notre formule. Si je vous dis maintenant que la lettre c signifie « nombre de crimes », vous devriez tout de suite comprendre ce que ceci implique.

$\sum_{n=1}^{c} \left [ ... \right ]$

Cela exprime que, pour la case que l'on est en train d'analyser, on va calculer la « probabilité » (qui sera en fait une valeur, comme je l'ai indiqué plus haut) que le tueur y habite, ce que l'on va faire pour chaque crime. Puis, toujours pour chaque crime, on va additionner cette valeur, d'où la somme. Admettons donc que nous nous trouvions dans le carré (2;3), et que notre tueur ait commis 2 crimes. Nous allons en ce cas d'abord calculer la valeur dans ce carré pour le crime numéro 1 (n=1) (disons que l'on trouve une valeur de 30). Ensuite, pour le même carré, nous prendrons le crime numéro 2 et calculerons la valeur (supposons que l'on obtienne 50). Alors, le résultat total pour cette case sera 80. Ce sera à nous ensuite de pondérer les différentes valeurs entre elles pour savoir quelles sont les cases les plus probables par rapport aux autres.

Maintenant que vous avez compris cette partie de la formule, nous allons pouvoir nous intéresser à ce qui se trouve à l'intérieur de la somme (c'est-à-dire tout ce qui est placé entre crochets). Car c'est cette partie de la formule qui calcule effectivement la probabilité.
Pour la suite, gardez bien en tête que la formule entre crochets concerne un seul carré de coordonnées (i;j) et un seul crime n. Donc n est une variable qui correspond au numéro du crime. Ainsi, si le tueur a tué 5 personnes, n=1 indiquera le crime numéro 1 etc. Et c sera, dans mon exemple, évidemment égal à 5.

Le cœur de la formule

Intéressons-nous maintenant à la partie de la formule qui calcule la probabilité pour le carré (i;j) et le crime n :

${ \frac{\phi}{ (|X_i-x_n| + |Y_j-y_n|)^f } } + { \frac{(1-\phi)(B^{g-f})}{ (2B - \mid X_i - x_n \mid - \mid Y_j-y_n \mid)^g } }$

Si vous cherchez bien, vous verrez que les lettres i, j et n sont en indice : $X_i \: Y_j \: x_n \: y_n$. Si vous avez bien compris le truc, vous devriez alors avoir deviné ce que ces quatre symboles représentent. Ce sont des coordonnées. Ainsi, $X_i$ est la coordonnée x du carré que l'on est en train d'analyser, et $Y_i$ en est la coordonnée y.

Pour ceux qui ont la mémoire courte :

Carte

Et les coordonnées $x_n \: y_n$ ?

Eh bien, ce sont les coordonnées x et y du crime numéro n tout simplement. Si vous avez saisi cela, vous ne devriez pas avoir trop de mal à décrypter la première fraction de la formule :

${ \frac{\phi}{ (|X_i-x_n| + |Y_j-y_n|)^f } }$

Bon, d'accord, peut-être les lettres dérangent-elles un peu. Ce sont en fait des constantes, notion que nous aborderons plus tard. Faisons donc abstraction de celles-ci et admettons que f vaille 1 et $\phi$ aussi. Nous obtenons en conséquence :

${ \frac{1}{ (|X_i-x_n| + |Y_j-y_n|) } }$

En fait, le dénominateur de la fraction est quelque chose de bien connu : c'est la distance de Manhattan entre deux points.

OK, pourquoi tu nous parles de New York maintenant ? o_O

Vous allez comprendre. Tout d'abord, il faut savoir que la distance entre deux points peut se calculer de plusieurs manières, la plus utilisée étant la distance euclidienne.

La distance euclidienne n'est rien d'autre que la distance la plus courte entre deux points (en vert sur l'image). Ainsi, si le cercle rouge représente le lieu du crime et le cercle jaune le lieu que l'on est en train d'analyser, alors la distance d entre ces deux points se calcule de la sorte (c'est simplement le Théorème de Pythagore) :

${ d = \sqrt[2]{(X_i-x_n)^2 + (Y_j-y_n)^2 }}$

D'accord. Mais pourquoi tu mentionnes un autre moyen de calculer les distances alors ?

Eh bien, à moins que votre tueur ne soit un oiseau ou qu'il ait un jet privé, cette distance ne représente rien pour nous !
Imaginez que, sur le dessin ci-dessus, les zones grises soient des routes, et les zones blanches des bâtiments (ce qui est une approximation assez correcte de la géographie de Manhattan et de plusieurs grandes villes aux États-Unis) : vous remarquez que notre distance euclidienne traverse les bâtiments.
C'est pourquoi nous allons...

Appeler le centre

Avez-vous besoin d'un coach de formation?

Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.

Profilage géographique

Prix sur demande