API (Interface de Programmation d'Application)
Passerelle technique permettant à un logiciel de communiquer avec un modèle d'IA hébergé à distance.
Une API sert de point d’accès standardisé pour qu’une application envoie des requêtes à un service d’IA et récupère des réponses, sans connaître les détails internes du modèle. Elle joue le rôle de contrat : formats de données, méthodes disponibles, codes d’erreur, limites d’usage.
Comment ça fonctionne
Le plus souvent, l’échange se fait en HTTP (REST ou parfois gRPC). Le client envoie une requête contenant :
- des paramètres (ex. texte d’entrée, température, modèle visé),
- un jeton d’authentification (API key, OAuth),
- des métadonnées (id de requête, version).
Le serveur exécute l’inférence côté cloud puis renvoie une réponse structurée (souvent en JSON), avec éventuellement des informations de latence, de coût ou de quotas.
À quoi ça sert
- Intégrer l’IA dans une app web/mobile, un back-end, un workflow DevOps.
- Industrialiser l’accès au modèle : sécurité, contrôle d’accès, observabilité, montée en charge.
- Découpler le produit du fournisseur : on peut changer de modèle ou de version sans réécrire toute l’app.
Exemples concrets
Chatbot support, classification de tickets, extraction d’entités, génération de résumés, recherche sémantique, ou analyse d’images via un endpoint dédié.