Lucas de Coster
Les données, l'or noir du 21 ème siècle.
Journal n 9 - 2/09/2021
Tous les jours, chacun d’entre nous produit l’équivalent de 18 360 000 pages de données numériques, soit 61 200 livres de 300 pages. La mauvaise nouvelle ? Ce chiffre ne fait qu’augmenter chaque année et cette croissance n'est pas près de s'arrêter. L’ensemble de ces données, le Big Data, que l’on surnomme “l’or noir du 21ᵉ siècle”, est un marché estimé à 203 milliards de dollars en 2020.
Des réseaux sociaux à la publicité, en passant par l’intelligence artificielle et nos démocraties, la gestion de nos données est l’un des grands défis de notre génération (le réchauffement climatique n’étant évidemment pas suffisant...). Mais avant de paniquer et partir vivre à la montagne élever des chèvres, essayons de comprendre quels sont les principaux enjeux du Big Data.

“Si c’est gratuit, c’est toi le produit”. Le Web est aujourd’hui dominé par quelques grandes entreprises, les fameuses GAFAM (Google, Apple, Facebook, Amazon, Microsoft) qui offrent une panoplie de services (recherche, vidéos, emails, réseaux sociaux) que nous utilisons au quotidien. Ces services ont tous un point en commun : ils sont entièrement gratuits et coûtent des milliards de dollars par an à entretenir. Mais alors comment ces entreprises n'ont-elles pas déjà fait faillite ? La réponse est simple, c’est grâce aux données. Ces ensembles d’informations numériques que nous produisons sont la monnaie d’échange qui finance aujourd’hui la plus grande partie du Web. En collectant une quantité massive de ces données (localisation, likes, contenu visionné, temps d’utilisation, mouvements), et en les associant à un profil unique à chacun d'entre nous, nous obtenons le rêve de tout publicitaire : la possibilité de cibler à grande échelle un public extrêmement précis.

C’est donc en vendant nos données à des publicitaires que des entreprises comme Google et Facebook valent aujourd’hui des milliards de dollars. Cependant, la publicité n’est que l’une des facettes les plus "inoffensives" de l’utilisation de nos données.
En 2016, au moment de l'élection américaine, l'équipe de Donald Trump décide de faire appel à un cabinet privé de marketing politique : Cambridge Analytica. Sa spécificité ? À partir des données d'environ 70 millions d'Américains, cette firme était capable de créer de milliers de profils types d'électeurs, ("indécis", "sensible au discours Républicain", "opposés à l'intervention en Afghanistan"). À l'aide de psychologues, sociologues, d'ingénieurs et de publicitaires, des campagnes massives de "publicité politiques" (ou propagande) ont été pensées et personnalisées pour chacun de ces profils, afin de les convaincre un par un à voter pour Trump.

La cerise sur le gâteau ? La plateforme publicitaire utilisée pour diffuser ses publicités n'est autre que celle de Facebook, qui est par ailleurs à l'origine des données de ces 70 millions d'Américains. Ce ne sont pas les exemples qui manquent. Le Brexit a été le premier véritable succès de "Cambridge Analytica", selon son ancien PDG, Alexander Nix. Vu le faible écart du résultat final, 52% pour et 48% contre, beaucoup citent la firme comme un acteur majeur du mouvement, sans qui le Brexit n'aurait peut-être jamais eu lieu. En clair, l'utilisation à des fins politiques des données est déjà une réalité, remettant ainsi en cause l'essence de nos démocraties, le vote.

Enfin, une facette peu connue, mais tout aussi importante de l'utilisation des données est celle de l'Intelligence Artificielle (IA). En effet, si chaque jour Siri et l'algorithme de YouTube deviennent de plus en plus performant, c'est grâce aux données. Sans entrer dans un jargon technique, l'IA fonctionne aujourd'hui grâce au Machine Learning, c'est-à-dire qu'à partir d'une quantité astronomique de données, une IA peut apprendre de nombreuses choses seule. Si l'on donne 5000 photos de chien à une IA, celle-ci sera capable d'identifier un chien dans une photo. Nous contribuons donc tous au développement des IA de demain, pour le meilleur et pour le pire.
Aujourd'hui dans les mains d'entreprises privées (de nouveau, les GAFAM), il est difficile de réguler le développement et l'utilisation de ces technologies dont les capacités totales nous sont encore inconnues. En 2018, Amazon fit un partenariat avec le Pentagone et produisit un algorithme de reconnaissance faciale capable d'identifier de potentiels victimes à travers la caméra d'un drone (équipé de missiles). Bien qu'un mouvement de protestation à la fois interne (employés de l'entreprise) et externe ait finalement mené à la cessation du projet, il reste un exemple concret d'application d'intelligence artificielle dans le domaine militaire.
Les données ont déjà changé notre réalité, et elles ne sont pas près d'arrêter de le faire. Mais nous pouvons et devons réguler leur utilisation pour préserver notre vie privée, le bien être de nos démocraties et le pouvoir de la technologie.
Lucas De Coster, TA