
Le Craft des approches Data & AI
Implémenter des produits Data, ML ou GenAI performants et évolutifs
Data et AI avec Arolla
Construire des services Data + AI maintenables et évolutifs
Mettez du craft dans votre code Python
Python est omniprésent dans les architectures autour des données, ML ou GenAI. Pourtant le code Python écrit, malgré son importance croissante, n’est souvent pas assez testable, lisible et facile à faire évoluer. Nos crafters Python forment et accompagnent les data engineers et data scientists en mentoring pour apporter les pratiques craft adaptées à Python, Panda, Dataframes, ou tout autre framework spécifique.
Mettez du craft dans vos data
Les architectures orientées data ont une particularité forte : les données (datasets ou streams) ont autant d’importance que le code. Cela appelle un craft adapté : versionner, valider, tester les data, d’une façon compatible avec des volumes de données importants. Cela nécessite de prêter attention aux propriétés statistiques et aux invariants des données, et des outils adaptés, comme Great Expectations pour les tests.
Mettez du craft dans vos innovations digitales
- Data architectures : Conseil et réalisation d’architectures en flux (streaming), à fort parallélisme (par exemple le pattern map-reduce), ou hybride (patterns de Lambda architecture), modélisation des données pour atteindre des objectifs de performance ; modularisation des data (data mesh, data products)
- Modèles d’opération MLOps : Trouver le meilleur mode de colloboration entre les personnes qui créent les modèles et celles qui doivent s’assurer de leur exploitabilité
- Architectures LLM-based : multi-prompts, LLM, SLM, hybride LLM + logique déterministe, patterns RAG et vector DB, et technologies associées eg LangChain.

Focus sur des aspects clé des Smart Data
Collaboration et qualité de code + données

Rapprocher business et data science
- Comprendre le potentiel des données pour le business.
- Engager les experts métier avec curiosité et définir des attentes réalistes, vulgariser les opportunités atteignables
- Interviewer les experts pour découvrir la complexité du domaine d’activité et orienter les modèles.

Tests et code propre pour des projets ML efficaces
- Qualité de code : appliquer les principes SOLID et refactoriser les projets ML.
- Qualité des données : implémenter des tests unitaires pour les données avec des outils comme Deequ et Great Expectations.
- Conception production-ready : prendre en compte des considération d’opérations dès la conception des algorithmes.

Optimiser les Workflows ML avec MLOps
- Implémenter des portes de qualité des données pour un traitement rapide des erreurs.
- Partitionner les datasets en chunks indépendants et significatifs pour le business.
- Assurer l’interprétabilité de l’état du système, même en cas de défaillance.
Nous sommes avec eux
Succès clients


ALD Automotive
ALD Automotive est un leader mondial des solutions de mobilité offrant des services complets de location et de gestion de flotte dans 43 pays. Avec 6 500 employés dans le monde, ALD Automotive gère 1,70 million de véhicules.
EXPERTISES
Architecture (Azure) & Développement
CONTEXTE
Au sein d’ALD Automobile, filiale du groupe Société Générale, participation au développement et à la maintenance de Carmarket (B2B) et Showroom (B2C), deux plateformes de revente des véhicules en sortie de leasing.
SOLUTION & RÉALISATIONS
Développement d’une plateforme CarMarket de revente en ligne de véhicules d’occasion, avec une solution 100 % Cloud, 100% PaaS, Microsoft Azure, répondant à des enjeux de volumétrie importante de données, de disponibilité, de scalabilité et de performance.
BÉNÉFICES CLIENT
- Mise en place de l’environnement Azure
- Absorption des pics de charges des utilisateurs concurrents : 500+
- Engagement fort de fiabilité et de qualité de service
- Engagement de disponibilité de 99,99%, ce qui dépasse le 99.95% habituellement garanti par les fournisseurs de Cloud
- Automatisation du processus, sans intervention humaine
- Quasi-doublement des volumes de véhicules (au départ 375 000)
- Ajout d’une solution de recommandation par Machine Learning
- Utilisation croissante des Azure Functions
- Réalisation d’API (REST) avec Web API pour l’interfaçage avec d’autres applications (ex : CRM, back-offices internes et externes, plateforme de e-commerce de Boursorama pour la mise en vente des véhicules sur sites partenaires)
- Préparation et réalisation du changement de souscription (création des ressources Azure, recopie des données, mise à jour des processus de backup, monitoring …)


TotalEnergies
TotalEnergies Gas Renewables&Power, est la branche destinée à porter l'ambition du groupe dans les énergies bas carbone à travers le développement dans l'aval gaz, dans les énergies renouvelables ainsi que dans les métiers de l'efficacité énergétique.
EXPERTISES
Smart Data
CONTEXTE
L’objectif du projet (EMP) est de collecter les données de production et de stockage d’énergie renouvelable (Eolien, Solaire, Hydraulique, Biogaz, hydrogène) afin de les exploiter via des applications.
Ces applications couvrent deux types d’usage; la visualisation et supervision (Détection de panne) et l’analyse prédictive (Maintenance, Production).
SOLUTION & RÉALISATIONS
- Conception d’une base NOSQL (COSMOS)
- Acquisition des données depuis différentes sources (Logiciels tiers, Scada, Email)
- Transformation des données en les corrélant à des données externes (Météo, Budget)
- Analyse des données par une équipe de Datascience
- Visualisation des données et résultats des analyses via Cosmos
- Stockage des données brutes dans le datalake ainsi que les résultats d’analyse
- Architecture et développement.
#TDD #ArchitectureHexagonale #SOLID #IntégrationContinue
BÉNÉFICES CLIENT
- Données traitées en quasi temps réel
- Visualisation unique de systèmes et sources hétérogènes
- Réduction de l'interruption de service grâce à la prédiction.


Capsule
Capsule Technologies est le principal fournisseur mondial de solutions d'intégration d'appareils médicaux, de surveillance clinique et de surveillance du patient pour les hôpitaux et les centres de soins.
EXPERTISES
Smart Data
CONTEXTE
Le projet IQ a pour objectif de remonter, stocker et analyser l'usage des appareils Capsule sur le terrain, et permettre un suivi des outils remontant les données.
En terme d'architecture globale, les hôpitaux disposent d'appareils connectés qui transmettent l'information à différents serveurs. Un "agent" récupère les informations, puis transmet à intervalles réguliers des messages agrégeant certaines données. Ces messages sont transmis sur un EventHub par hôpital. Plusieurs jobs Stream Analytics lisent l'EventHub afin de séparer les données par domaine fonctionnel et les formater pour une analyse ultérieure..
SOLUTION & RÉALISATIONS
- Gestion du parc (site Web avec un SSO basée sur un Azure AD B2C) Azure Function, notamment pour une intégration des données SalesForce
- Architecture liée à la régionalisation et la sécurité des données personnelles et professionnelles (GDPR)
- Différents éléments SQL (procédures stockées, modélisation et maintenance)
- Mise à jour et la création de query Stream Analytics
- Analyse pour le remplacement de Stream Analytics, afin de trouver une solution plus adaptée aux besoins
- Mise en place de l'usage de Blob Storage et de Key vaults pour stocker les données plus sensibles.
#TDD
BÉNÉFICES CLIENT
- Définition d’une nouvelle architecture
- Réduction des coûts sur AZURE
- Gestiondu parc applicatif (Back to Front).


Stonal
STONAL fournit des logiciels SaaS aux clients qui sont des investisseurs immobiliers.
EXPERTISES
Smart Data
CONTEXTE
L’idée est de les accompagner pour numériser leur portefeuille immobilier, extraire les informations intéressantes de ces documents, fournir un service pour optimiser l’OPEX / CAPEX et assurer le besoin de maintenance.
L'objectif est de pouvoir rendre le projet modulable, limiter les dépendances possibles (approche micro-services), diminuer le Time To Market.
SOLUTION & RÉALISATIONS
- Expérimentation de nouveaux modèles avec HuggingFace
- "Containérisation" des différentes étapes de traitements des documents
- Déploiement des modèles sur SageMaker (AWS).
#TDD #Refactoring
BÉNÉFICES CLIENT
- Amélioration de la couverture des tests
- Mise en place d’un process ML Ops.


Decathlon
Decathlon est une entreprise française de grande distribution de sport et de loisirs. L’équipe est composée d’un Tech Lead, d’un Team leader et de 5 Data Engineers dont un qui occupe la casquette de Dev API: [il est en charge d'exposer la donnée sur une interface web].
EXPERTISES
Smart Data / Data
CONTEXTE
L’objectif de la mission est de mettre à disposition l’ensemble des données du prix conseillé par le groupe à l’EVP (écart prix vente).
Le choix du prix final d’un produit est effectué par le chef de rayon. Decathlon souhaite changer cette stratégie en choisissant un prix uniforme pour chaque produit afin d’harmoniser les prix dans tous les magasins au niveau national.
SOLUTION & RÉALISATIONS
- Migration du moteur d’ingestion de données existant (séparation des différents flux de données)
- Mise en place de la CI/CD
- Mise en place de la Data Quality (Data Management)
- Réflexion entre Deequ et Great Expectations
- Migration des jobs d’ingestion de données initialement sur Jenkins vers Airflow
#TDD #BDD #Agile #Refactoring
BÉNÉFICES CLIENT
- Mise en place de la Data Quality
- Parallélisation des jobs via Airflow
- 5 millions de lignes de calcul en 4 minutes