Le big data de "prédiction" de la délinquance

Là, franchement, Jean-Claude Gaudin le maire de Marseille y va carrément à la hache : http://www.lamarseillaise.fr/marseille/societe/61034-marseille-s-offre-oracle-pour-des-presages-securitaires

Plusieurs questions : y a-t-il des précédents en France ? Qu’en est-il des recommandations de la CNIL par rapport à ce genre de regroupement de données qui prend à la fois en compte déplacements, trafic routier, version “smart city” et la remontée de fil de conversation sur les réseaux sociaux ? Sinon, je pensais qu’on pouvait réagir à chaud.

Big Brother en marche (sans mauvais jeu de mot)… Moi avec tout cela j’ai parfois envie de couper totalement internet de ma vie. mais bon pour le boulot pas simple. :confounded:

Le cortecs, un laboratoire de zététique de la fac de Grenoble à fait une publi sur un de ces algorithmes de prédiction des délits. https://cortecs.org/mathematiques/predpol-predire-des-crimes-ou-des-banalites/

Il est probable que ce truc liberticide qui coûte super cher ne marchera même pas vraiment.

1 J'aime

Merci à toi, savez vous si c’est déjà appliqué (réalisé) dans d’autres villes ? en France et ailleurs ?

Très utilisé aux états unis. Tant par la police que par les tribunaux pour déterminer le type et la durée des sentences. Le principe scientifique derrière est basé sur une théorisation des réseaux (plus de gens en lien avec toi commettent de crimes plus tu as de “chances” d’en commettre à ton tour).

Plusieurs écoles existent, celles d’apprentissage sur les caractéristiques (je colle plusieurs millions de dossiers dans un algorithme d’apprentissage comme jeu de test et la prochaine fois que je vois un malfrat je demande à mon algorithme de donner ses probabilités de réhabilitation selon la sentence que je vais lui donner). Les algos qui viennent à l’esprit sont principalement des classifieurs donc on a les réseaux de neurones, les systèmes d’inférence bayésiens et tout le tralala.

Résultat: des algorithmes biaisés contre les noirs et les hispaniques (si on ne supprime pas le biais dans les données de départ c’est pas surprenant).

Deuxième école: celle des réseaux (un exemple: Structural Analysis of Criminal Network and
Predicting Hidden Links using Machine Learning
). Perso je crois plus dans la deuxième étant donné le problème des biais dans les données qu’on fournit aux algorithmes d’apprentissage “simples”. Si tu vis dans un pays ou les blancs ne sont jamais inquiétés pour des crimes l’algorithme te dira nécessairement que les noirs sont plus criminels puisque ce sont les seuls qu’il voit passer dans ses jeux d’entraînement. Le problème de cette méthode par contre c’est qu’elle “mange” principalement des informations sur de grandes population (là c’est du vrai big brother).

Un exemple de software prédictif existant et utilisé: predpol. Dans ce cas là il attaque le problème sous l’angle géographique, à partir de rapports ils donne un “score de criminalité” à des zones sur une carte et indique à l’utilisateur de patrouiller ces endroits.

La majorité de ces systèmes ne demandent pas plus d’infos que celles déjà disponibles (dossiers criminels, statistiques des crimes, etc) donc je suis (pour l’instant) circonspect quant au fait de décrire ça comme “big brother en marche”. Pour moi c’est juste un outil oppressif supplémentaire dans un système ou les informations de la majorité de la population est entre les mains d’une poignée d’individus qui les utilisent comme bon leur semble. Enfin j’imagine que c’est pas grave puisqu’on leur fait confiance et que de toute façon on n’a pas de vrai possibilité de contester.

On peut difficilement dire si ça marche ou pas on a pas assez de recul. En tout cas ça vends et ça fait de la tune.

1 J'aime

C’est justement l’algorithme étudié dans le dossier que je vous ai fait passer. En réalité, quand la majorité des crimes sont référencés dans les mêmes quartiers, c’est pas bien compliqué de deviner qu’un autre délit pourra être constaté dans le même ghetto.

On devrait peut être créer notre propre algorithme de prédiction des délits qui prédira que le prochain conflit d’intérêt aura probablement lieu dans une grande multinationale, une banque d’affaire, à la mairie de Marseille ou à l’assemblée nationale :grinning:

3 J'aime

Paradoxalement je pense pas que ça soit super difficile.

Il faudrait:

  1. Une base de données graph de depart avec les emplois présents ou passés des politiques

  2. Un croisement entre qui a pu croiser qui quand

  3. Qui a nommé qui ou et quand

Et ensuite un bête parcours de graph ou on vérifie le degré de chaque noeud.

Déjà on a une indication des gens les plus “connectés” donc qui peut tirer un max de ficelles.

Une ou deux transfo et BAM on sait qui a été lobbyiste avant d’être régulateur ou qui a été sous un grand patron avant de devoir lui dicter des règles.

Si on rajoute l’éventuel passé criminel je pense qu’on doit pouvoir trouver une heuristique pas trop dégueulasse sans grande difficulté.

Après celui qui ferait ça ferait probablement une attaque aiguë de saturnisme foudroyant calibre 9mm si ça marche.

4 J'aime

sans faire aussi compliqué,
on prend tous les élus mis en examens on affiche leurs mandats et ensuite on fait un tableau par fonction qui produit le plus !

1 J'aime

C’est génial comme idée, ce serait tellement drôle de voir les réactions provoquées xD

Tu m’as fait rêver :slight_smile:

Nan mais il y a clairement moyen de le faire! Même si c’est un outil factice, qui ferai semblant de cibler la délinquance (soit carte soit partis politiques) et à la fin il te sort la ville d’une personnalité politique importante condamnée ou mise en examen ou sous le joug d’une mise en examen mais protégée par la sacro-sainte immunité (attention a ne pas mettre de personnes simplement suspectées et sans procédure judiciaire approfondie sinon c’est du fakeNews ^^)

Et à la fin tu propose un lien vers le parti pirate pas trop intrusif mais clair et indiquant nos positions sur la surveillance de masse et sur la corruption des élus.

Par contre, il faut que le résultat final soit d’un niveau convainquant et qu’il ressemble pas à un site des années 2000, ou à truc fait vite fait.

Ensuite tu essaye de faire un max de bruit et d’intéresser des médias qui aiment bien communiquer sur ce genre de trolls ( typiquement Quotidien par exemple)

Beaucoup trop d’idée d’à quoi pourrai ressembler cette bêtise pirate :yum:

Pour la blague, un ancien pirate avait forké un truc, je viens de le remettre en ligne :

http://www.petitdemange.fr/HORUS/

Identification avec ce que vous voulez comme mot de passe :stuck_out_tongue:

1 J'aime

Super ! Ça prend beaucoup de temps de coder un truc comme ça (avec de la récup’), je me rend pas trop compte ?

Si il y a des gens partants pour “coder un algorithme” bidon, je veux bien donner la main pour produire de fausses données et/ou des images (logos,…)

Woah! Je sais pas où il avait trouvé ça, mais si le projet est libre je veux bien le code source!

Sinon, oui, ça prend du temps et pas qu’un peu si tu veux pas un résultat qui a l’air amateur.

Je lui demande pour confirmation (de mémoire on doit avoir des liens dans les pages) et je te passe cela :slight_smile:

Si à partir de ce thread, vous arrivez à sortir un “big data” de la prédiction des délits financiers, franchement… chapeau. D’autant que cela vaudrait le coup d’en faire vraiment de la pub, comme une “réponse” assez ironique aux élus de tous bords qui ne jurent que par les caméras de vidéo-surveillance et ce type de big data contre la délinquance de voie publique, en ignorant sciemment les délits en col blanc.

Avec ce genre d’expérimentation prédictive reposant finalement que sur des stat, il me vient une réflexion :

Admettons que les chercheurs soient tellement bons qu’ils arrivent a partir de big-data sur l’ensemble de la population (66 millions) à prédire le comportement 'terroriste" d’un individu discret (au sens statistique) avec une certitude de 99% ce qui serait énorme !
Admettons aussi qu’il y ait en réalité en France 1000 terroristes prêt à passer à l’acte. Le cauchemar.

Déjà, avec 1% d’incertitude sur 66 millions on se retrouve avec 660000 détections.
Autrement dit minimum 659000 faux positif. Minimum car une dizaine de véritables terreurs en puissance(les plus dangereux donc) peuvent aussi passer en faux négatif…

1 J'aime

J’ai l’impression qu’il y a une légère erreur dans tes stats. Non que ce ne soit pas exact mais dans l’interprétation et l’exploitation des données que tu fait. Si l’algorithme est capable de savoir à 99% si un individu est terroriste ou non ne signifie pas qu’il considère 99% de la population comme non terroriste et 1% comme terroriste. Cela signifie que si il détecte un positif, il y a 99% de chance que ce soit le cas. (ce qui serai monstrueusement élevé)

Après peut-être que je me trompe mais il semblerai que tu te mélange les pinceaux dans la significations de tes estimations :stuck_out_tongue_winking_eye:

Bjour,

il faut rajouter un élément dans les stats les personnes fiché S qui ont des permis de détention d’armes et donc d’achat de poudre et munitions !:joy:

1 J'aime