Utiliser l'IA pour lutter contre la fraude
Les cryptomonnaies comme le Bitcoin ont souvent occupé le devant de la scène au cours de ces dernières années. Ces jetons numériques partagent certaines des qualités des espèces et peuvent être achetés, échangés et dépensés. En réalité, tout un marché s'est développé autour du commerce des monnaies numériques, les investisseurs et les spéculateurs surveillant de près la moindre fluctuation.
En son centre se trouve Coinbase, basé à San Francisco, un portefeuille numérique et une plateforme d'échange où plus de 20 millions de commerçants et de consommateurs ont échangé plus de 150 milliards d'USD en cryptomonnaies depuis sa fondation en 2012.
Comme toutes les sociétés de services financiers, Coinbase doit offrir une expérience transparente aux consommateurs tout en prenant des mesures pour sécuriser l'environnement dans lequel ils évoluent. Pour cela, l'entreprise s'appuie sur l'intelligence artificielle (IA) en utilisant les outils de machine learning d'Amazon Web Services (AWS).
« L'IA est dans l'ADN de l'entreprise depuis le tout début », explique Soups Ranjan, responsable de la science des données chez Coinbase. « L'un des plus importants facteurs de risque qu'une bourse de cryptomonnaies doit maîtriser est la fraude, et le machine learning constitue la cheville ouvrière de notre système antifraude. »
À l'aide d'Amazon SageMaker, un outil permettant de créer, d'entraîner et de déployer facilement des modèles de machine learning, les ingénieurs de Coinbase ont mis au point un système axé sur le machine learning qui reconnaît les décalages et les anomalies dans les sources d'identification des utilisateurs, ce qui leur permet de prendre rapidement des mesures contre les sources de fraude potentielles.
« L'authentification des identités en ligne est en réalité un problème très complexe », note M. Ranjan. « Lorsque vous entrez dans un bar et que le videur regarde votre permis de conduire, il peut projeter une lumière d'une certaine fréquence et chercher des messages cachés tels que des hologrammes. »
Cette opération est impossible en ligne. C'est pourquoi Coinbase utilise SageMaker pour développer des algorithmes de machine learning pour l'analyse d'images afin de confondre les escrocs. Par exemple, un algorithme de similarité des visages extrait automatiquement les visages des pièces d'identité qui sont chargées, puis compare un visage donné à tous les visages des autres pièces d'identité qui ont été chargées. Les escrocs utilisent souvent la même photo pour plusieurs pièces d'identité. Sinon, ils devraient modifier le visage en plusieurs endroits. Cet algorithme de similarité des visages permet à l'entreprise de rapidement détecter la contrefaçon.
« Le machine learning nous aide à équilibrer les risques pour Coinbase et à proposer une certaine flexibilité pour les clients là où nous souhaitons qu'ils bénéficient de la meilleure expérience possible. »
Soups Ranjan
Responsable de la science des données
Coinbase
« Le machine learning nous aide à équilibrer les risques pour Coinbase et à proposer une certaine flexibilité pour les clients là où nous souhaitons qu'ils bénéficient de la meilleure expérience possible. »
Soups Ranjan
Responsable de la science des données
Coinbase
« En réalité, il est facile pour les clients de se tourner vers différents services pour les cryptomonnaies », explique M. Ranjan. « Le machine learning nous aide à équilibrer les risques pour Coinbase et à proposer une certaine flexibilité pour les clients là où nous souhaitons qu'ils bénéficient de la meilleure expérience possible. »
Les connaissances acquises lors de l'élaboration d'algorithmes de lutte contre la fraude permettent également à Coinbase de personnaliser les expériences en fonction des types d'utilisateurs. Il s'agit là d'une manière simple et intuitive de segmenter les investisseurs de détail qui achètent et conservent par rapport aux utilisateurs professionnels sophistiqués qui échangent énormément. Au cours d'un récent exercice de segmentation de la clientèle, un analyste de Coinbase a été en mesure d'écrire simplement un algorithme de clustering sur un ordinateur portable, puis de l'exécuter via SageMaker pour analyser la façon dont les clients utilisent les cryptomonnaies, en segmentant ceux qui s'intéressent exclusivement aux échanges et ceux qui investissent à long terme.
Cependant, la gestion des risques n'est qu'un aspect du problème. En effet, compte tenu de leurs racines numériques, il n'est pas surprenant que les cryptomonnaies, tout comme les marchés financiers plus traditionnels, aillent de pair avec un immense volume de données. « Notre entrepôt des données rassemble les données de divers microservices, y compris les données de blockchain et des utilisateurs, ce qui représente des centaines de téraoctets au total », explique M. Ranjan. « Ce chiffre a doublé depuis le début de l'année. »
Cependant, comme Coinbase opère dans un environnement hautement réglementé, l'entreprise prend des mesures supplémentaires pour garantir la protection des données des clients, même par le biais de ses propres ingénieurs et scientifiques des données. Tout code exécuté sur les serveurs de production de Coinbase a fait l'objet d'une révision et d'un examen par plusieurs groupes de personnes avant d'être lancé en production. « L'un de nos principes fondamentaux est que nous sommes une entreprise qui fait passer la sécurité avant tout, car nous stockons des cryptomonnaies pour le compte de nos clients », poursuit M. Ranjan.
L'accès restreint aux données dans un environnement hautement sécurisé rend le machine learning d'autant plus difficile. Coinbase surmonte cette difficulté en permettant aux ingénieurs de machine learning d'accéder aux journaux de données uniquement par le biais d'un code ayant fait l'objet d'un examen approfondi et validé dans Amazon Elastic Container Registry. En réalité, les ingénieurs de machine learning ne peuvent pas se connecter aux serveurs de production et exécuter un code qui n'a pas été examiné.
En fin de compte, l'existence des cryptomonnaies numériques repose sur la confiance. De plus, les entreprises comme Coinbase s'appuient sur AWS pour créer et maintenir cette confiance en s'efforçant de devancer constamment les risques.