Ingénieur·e principal·e en données – ETL et intégrations
Lasso Informatics est une entreprise SaaS qui offre une plateforme active de gestion et d’analyse de données de recherche. Notre solution rassemble des données multimodales, imagerie, génétique, données comportementales et biospécimens, afin de soutenir des études de grande envergure. Des milliers de chercheurs à travers le monde s’appuient déjà sur notre plateforme, et nous poursuivons son évolution rapide afin de repousser les limites de la gestion des données de recherche.
Nous vivons pour l’innovation et cherchons à permettre aux scientifiques de se concentrer sur la science plutôt que sur la technologie, accélérant ainsi le passage de la recherche aux découvertes et aux traitements.
Notre équipe est profondément diversifiée, tant par ses parcours que par ses expertises. Nous croyons que les solutions les plus créatives et les plus puissantes émergent de perspectives variées. Vous évoluerez dans un environnement inspirant aux côtés de professionnel·le·s de renommée mondiale en médecine, physique, ingénierie, imagerie, épidémiologie, développement logiciel et génétique. Nous encourageons nos collègues à devenir des leaders d’opinion et à innover dans un domaine passionnant et en constante évolution.
Il s’agit d’un poste senior en ingénierie des données et en intégration de systèmes, axé sur la conception et l’exploitation de pipelines ETL de qualité production ainsi que sur des intégrations robustes.
Vous interviendrez sur l’ingestion, la transformation et le chargement des données, tout en tirant parti, lorsque pertinent, d’un moteur de flux de travail basé sur BPMN afin de modéliser et de gérer des processus complexes. Ce rôle se situe à l’intersection de l’ingénierie des données, du développement backend et des systèmes pilotés par des flux de travail, avec une distinction claire entre les responsabilités ETL et les capacités d’orchestration des workflows.
Concevoir, développer et exploiter des pipelines ETL et des intégrations de données de bout en bout.
Développer des workflows basés sur BPMN afin de modéliser et gérer des processus complexes.
Concevoir des services d’intégration et de logique de transformation en Java et en Python.
Intégrer des systèmes internes et externes à l’aide d’API REST, de passerelles API et de messagerie asynchrone.
Appliquer des stratégies appropriées de transformation et de chargement des données (batch et quasi temps réel).
Concevoir et optimiser des schémas PostgreSQL, des requêtes, des index et des mécanismes de chargement en masse.
Travailler avec des formats de données structurés et semi-structurés (JSON, CSV, XML, Parquet, Avro).
Assurer la qualité, la cohérence et la fiabilité des données grâce à des mécanismes de validation, de déduplication et d’idempotence.
Surveiller, dépanner et optimiser les pipelines ETL et services d’intégration en production.
Collaborer avec les équipes d’ingénierie, de produit et des partenaires externes sur les contrats d’intégration et les modèles de données.
Documenter les pipelines ETL, les workflows, les schémas et les procédures opérationnelles.
5 ans et plus d’expérience en ingénierie des données, ETL ou intégration de systèmes.
Solide expérience dans la conception et l’exploitation de pipelines ETL en production.
Maîtrise de Python et/ou Java dans des environnements backend ou de traitement de données.
Excellente connaissance de PostgreSQL et de SQL, incluant l’optimisation des performances.
Expérience pratique avec les techniques de transformation et de chargement des données (ETL vs ELT, chargements incrémentaux, concepts de CDC).
Expérience d’intégration de systèmes via des API REST et des passerelles API.
Expérience avec des moteurs de workflow basés sur BPMN ou des outils de modélisation de processus.
Expérience dans l’exploitation de systèmes distribués en environnement de production.
Forte aptitude au dépannage, au débogage et à l’exploitation opérationnelle.
Bonne connaissance des patrons d’architecture courants (ex. : architectures en couches, systèmes événementiels, patrons d’intégration).
Expérience avec des moteurs BPMN spécifiques tels que Camunda, Zeebe ou Flowable.
Expérience avec des architectures événementielles ou des systèmes de messagerie.
Expérience avec des plateformes cloud (AWS, GCP ou Azure).
Expérience avec Docker et Kubernetes.
Mise en place de pipelines CI/CD pour des systèmes de données ou backend.
Expérience dans des environnements réglementés ou soumis à des exigences de conformité.
Salaire et avantages sociaux compétitifs.
Culture de travail en présentiel, avec présence requise du mardi au jeudi.
Possibilités de leadership et de développement professionnel.
Équipe collaborative axée sur l’innovation, la qualité et l’impact scientifique.
Accès à des ressources de formation et à du perfectionnement professionnel continu.