Mastercard déploie un modèle tabulaire contre la fraude
Mastercard mise sur un modèle tabulaire entraîné sur des milliards de transactions pour mieux détecter la fraude, tout en limitant les risques liés aux données.
Mastercard vient de dévoiler une nouvelle approche pour renforcer la sécurité des paiements numériques : un modèle de fondation entraîné non pas sur du texte ou des images, mais sur des tableaux de données issus des transactions. L’objectif est clair : mieux repérer la fraude et les comportements anormaux, tout en réduisant l’exposition aux données personnelles. Au coeur de cette stratégie, un modèle tabulaire conçu pour apprendre des relations complexes entre champs structurés.
Un modèle de fondation entraîné sur des transactions
Mastercard indique avoir entraîné son modèle sur des milliards de transactions par carte, avec l’ambition de monter à terme à des centaines de milliards. Les données utilisées couvrent des événements de paiement et des informations associées comme la localisation du commerçant, les flux d’autorisation, les incidents de fraude, les rétrofacturations (chargebacks) ou encore l’activité liée aux programmes de fidélité.
Un point central mis en avant par l’entreprise : les identifiants personnels sont retirés avant l’entraînement. Le modèle ne chercherait donc pas à reconnaître des individus, mais à apprendre des schémas de comportement à grande échelle. Cette approche vise à limiter les risques de confidentialité souvent associés à l’IA dans les services financiers.
Mastercard affirme également que, même si l’anonymisation peut supprimer certains signaux potentiellement utiles pour l’évaluation du risque, le volume et la diversité des données comportementales permettraient de compenser cette perte. Autrement dit, la richesse statistique primerait sur la granularité individuelle.
Qu’est-ce qu’un LTM - large tabular model ?
Contrairement aux grands modèles de langage, entraînés sur des données non structurées et optimisés pour prédire le prochain token dans une séquence, un LTM s’appuie sur des tables de données multi-dimensionnelles. Il apprend les relations entre colonnes, variables et contextes transactionnels.
L’intérêt opérationnel est important : le modèle peut identifier des corrélations et des anomalies qui ne sont pas forcément capturées par des règles prédéfinies. Là où beaucoup de systèmes classiques reposent sur des seuils et des scénarios connus, un LTM peut repérer des configurations inattendues, parce qu’il apprend directement ce qui est prédictible dans les données brutes.
Mastercard présente ce modèle comme un moteur d’insights destiné à s’intégrer dans des produits et des workflows existants. La société distingue aussi le risque opérationnel d’un modèle en interaction directe avec des clients (souvent un LLM) de celui d’un modèle utilisé pour soutenir des décisions internes.
Côté infrastructure, Mastercard s’appuie sur Nvidia pour la plateforme de calcul et sur Databricks pour l’ingénierie des données et le développement du modèle.
Premiers cas d’usage : cybersécurité et détection de fraude
Le premier domaine de déploiement annoncé est la cybersécurité, avec un focus naturel sur la détection de fraude. Comme la plupart des acteurs du paiement, Mastercard opère déjà plusieurs systèmes qui analysent les transactions et cherchent des signaux suspects. Ces systèmes demandent généralement une forte contribution humaine au départ, puis des ajustements continus pour définir ce qui doit être considéré comme anormal.
Exemples typiques : une hausse soudaine de la fréquence d’achats, ou des paiements réalisés dans des zones géographiques très éloignées sur une période courte. Ces règles fonctionnent, mais elles peuvent générer des faux positifs, notamment lorsque le comportement réel d’un client sort des normes statistiques sans être frauduleux.
Mastercard indique que les premiers résultats montrent une amélioration dans certains cas par rapport aux techniques conventionnelles. L’entreprise cite notamment les achats de forte valeur mais peu fréquents : ils sont souvent signalés comme anomalies par des modèles traditionnels, alors que le nouveau modèle semblerait mieux distinguer les événements légitimes.
Une approche hybride, dictée par la réalité réglementaire
Plutôt que de remplacer d’un bloc les systèmes existants, Mastercard prévoit des déploiements hybrides combinant procédures établies et nouveau modèle. Cette prudence reflète le niveau d’exigence réglementaire qui encadre les décisions liées à la fraude, aux paiements et, plus largement, aux impacts potentiels sur les consommateurs.
L’entreprise reconnaît qu’aucun modèle unique ne peut être performant dans tous les scénarios. Le LTM est donc pensé comme un outil supplémentaire au sein d’un arsenal plus large, ce qui permet aussi de limiter les risques de dépendance à une seule brique technologique.
Au-delà de la fraude, Mastercard évoque d’autres terrains où les données structurées abondent : analyse de l’activité des programmes de fidélité, gestion de portefeuille, et analytique interne. Dans de nombreuses organisations, ces usages sont couverts par une multitude de modèles spécialisés, ce qui multiplie les coûts d’entraînement, de validation, de surveillance et de maintenance.
L’idée d’un modèle de fondation tabulaire, ajustable pour plusieurs tâches, est de simplifier ce paysage : moins de modèles à maintenir, et potentiellement une meilleure réutilisation des apprentissages.
- Détection de fraude et cybersécurité
- Analyse des programmes de fidélité
- Gestion de portefeuille
- Analytique interne et reporting
- Optimisation des workflows de décision
Risques, gouvernance et prochaines étapes
Cette stratégie multi-usages n’est pas sans risques. Un modèle largement déployé, s’il se trompe ou s’il est contourné, peut avoir des conséquences à grande échelle. Mastercard en est consciente, ce qui explique l’intégration progressive aux côtés des systèmes existants.
La feuille de route mentionne aussi l’ouverture d’un accès via API et la mise à disposition de SDKs pour permettre aux équipes internes de construire de nouvelles applications. Cela suggère une volonté d’industrialiser le modèle comme une plateforme, et pas seulement comme un projet de R et D.
Dans sa communication, Mastercard insiste sur les responsabilités liées aux données : confidentialité, transparence, explicabilité et auditabilité. C’est un point clé, car tout système influençant des décisions de fraude ou des résultats pouvant impacter l’accès à des services financiers est susceptible d’être fortement examiné par les régulateurs.
Enfin, même si les modèles tabulaires à grande échelle pourraient marquer une nouvelle étape pour l’IA dans les infrastructures de paiement et de banque, les preuves publiques restent limitées. Les performances avancées reposent pour l’instant sur des éléments communiqués par l’entreprise, et doivent donc être interprétées avec prudence.
La robustesse face à des attaques adversariales, les coûts de fonctionnement à long terme après entraînement, et l’acceptation réglementaire seront déterminants pour juger de l’adoption réelle de cette approche. Mastercard semble néanmoins parier que l’avenir de l’IA dans la finance ne se jouera pas uniquement sur le texte et les images, mais aussi sur la puissance des données structurées.
Pour suivre les orientations générales de l’entreprise, on peut consulter les informations institutionnelles sur la sécurité et l’innovation chez Mastercard : https://www.mastercard.com
Conclusion - En misant sur un modèle de fondation centré sur les données transactionnelles, Mastercard cherche à améliorer la détection de fraude tout en limitant l’usage de données personnelles. Le choix d’une approche hybride, combinée à un effort sur l’explicabilité et l’auditabilité, montre que la performance ne suffira pas : l’adoption dépendra aussi de la confiance, des coûts et du cadre réglementaire.
