Analyste / Scientifique de données À distance | Temps plein
À propos de Lasso Informatics Lasso Informatics est une jeune pousse en mode SaaS dotée d'une plateforme de gestion et d'analyse de données de recherche en direct qui regroupe des données multimodales (imagerie, génétique, comportementale et bioéchantillons) pour des études à grande échelle. Des milliers de chercheurs partout dans le monde utilisent déjà notre plateforme, et nous itérons et améliorons rapidement notre offre pour repousser les limites du possible en gestion de données de recherche. Nous vivons pour innover et donnons aux scientifiques les moyens de se concentrer sur la science, et non sur la technologie, ce qui accélère le chemin vers la science et vers les traitements. Notre équipe est incroyablement diversifiée, tant par ses origines que par son expertise — et ce n'est pas le fruit du hasard. Nous croyons que les solutions les plus créatives et les plus puissantes émergent de façons différentes d'appréhender le monde. Vous travaillerez dans un écosystème stimulant aux côtés de professionnels de renommée mondiale en médecine, physique, ingénierie, imagerie, épidémiologie, développement logiciel et génétique. Nous nous épanouissons en donnant à nos collègues les moyens d'être des leaders d'opinion et d'innover pour trouver de nouvelles solutions dans un domaine passionnant et en rapide évolution.
À propos du poste Nous sommes à la recherche d'une personne compétente à titre d'analyste ou de scientifique de données pour rejoindre notre équipe en pleine croissance à temps plein. Ce poste à distance se situe à l'intersection de la rigueur statistique scientifique et des outils de données modernes. Vous travaillerez en étroite collaboration avec une équipe de recherche multidisciplinaire pour extraire des informations pertinentes de jeux de données complexes, concevoir et évaluer des approches analytiques, et communiquer clairement les résultats à des auditoires scientifiques et non techniques.
Principales responsabilités
Concevoir, configurer et maintenir des tableaux de bord pour des groupes de travail spécialisés.
Effectuer des analyses statistiques à l'aide de R, Python et d'autres programmes, en appliquant des méthodes biostatistiques appropriées à la conception des études — notamment des modèles à effets mixtes et des techniques pour données longitudinales.
Appliquer des outils d'intelligence artificielle et d'apprentissage automatique pour soutenir la détection de tendances, la modélisation prédictive et l'évaluation de la qualité des données à travers des jeux de données multimodaux.
Évaluer les décisions liées à la conception expérimentale et des études et y contribuer, en veillant à la validité analytique et à la gestion appropriée des facteurs de confusion, des covariables et des considérations relatives aux échantillons.
Organiser et gérer les jeux de données et les dictionnaires de données, effectuer des contrôles de qualité et mener des analyses préliminaires pour maintenir une haute intégrité des données.
Collaborer de manière transversale pour définir les exigences relatives aux données, résoudre les problèmes de qualité et soutenir des processus de recherche reproductibles.
Produire une documentation technique claire sur les méthodes analytiques, les pipelines et les résultats, à l'intention d'auditoires scientifiques et internes.
Assurer le suivi des projets et contribuer à une culture de science rigoureuse et reproductible.
Qualifications
Requises
Doctorat en neurosciences, psychologie, épidémiologie, ingénierie, statistiques, informatique, ou une combinaison équivalente de formation et d'expérience.
5 ans ou plus d'expérience à temps plein en analyse de données et en fondements de la science des données — algorithmes, structures de données, visualisation de données et apprentissage automatique — de préférence dans un contexte clinique ou de recherche.
5 ans ou plus d'expérience à temps plein dans un langage de programmation scientifique tel que Python, R ou Matlab, avec une connaissance pratique des cadres et bibliothèques associés (p. ex. Tidyverse, Scipy, Sklearn, PyTorch, Polars).
Compétences avancées en biostatistiques, notamment en méthodes adaptées aux études observationnelles (transversales et longitudinales) et expérimentales.
Expérience démontrée dans l'application des principes de conception expérimentale : analyse de puissance, randomisation, conditions de contrôle et atténuation des biais.
Expérience démontrée dans l'utilisation d'outils d'IA et d'apprentissage automatique dans un contexte analytique ou de recherche.
1 an ou plus d'expérience de travail dans un environnement Linux, avec des systèmes de contrôle de version (p. ex. GitHub) et des plateformes de virtualisation logicielle (p. ex. Docker).
Maîtrise de la création de visualisations de jeux de données longitudinaux complexes.
3 ans ou plus d'expérience avec les réglementations sur la confidentialité des données (HIPAA, RGPD) et les normes d'éthique de la recherche.
Souhaitées
Expérience en neurosciences, génomique, recherche clinique ou dans une discipline apparentée des sciences de la vie.
Expérience avec des jeux de données de recherche à grande échelle et multimodaux couvrant des données d'imagerie, comportementales, génétiques ou de bioéchantillons.
Familiarité avec les pratiques de recherche reproductible, notamment R Markdown, Quarto ou des flux de travail équivalents basés sur des carnets de notes.
Compétences et attributs
Rigueur analytique combinée à une curiosité scientifique.
Autonomie et capacité à travailler de façon indépendante dans un environnement distribué à distance, en gérant efficacement plusieurs priorités et échéances.
Solides compétences en rédaction technique avec une capacité démontrée à documenter les méthodes et à communiquer les résultats avec précision.
Excellentes compétences en communication verbale ; capacité à vulgariser des résultats statistiques complexes pour des parties prenantes non techniques.
Bonne compréhension des obligations en matière de confidentialité des données et engagement envers une gestion responsable des données.
Grande attention aux détails et engagement sincère envers l'intégrité et la reproductibilité des données.
Nature collaborative, avec de solides compétences interpersonnelles et à l'aise pour contribuer à des environnements d'équipe ouverts et multidisciplinaires.
Avantages
Poste hybride ou à distance flexible.
Rémunération compétitive à temps plein et programme d'avantages sociaux.
Contribution significative à des recherches ayant un impact scientifique et clinique réel.
Expérience pratique couvrant l'ensemble de la chaîne analytique — de la conception expérimentale jusqu'à la livraison des résultats.
Possibilité de croître au sein d'une entreprise innovante à mission définie, à l'avant-garde de la gestion des données de recherche.
Environnement collaboratif au sein d'une équipe diversifiée et multidisciplinaire de chercheurs et de professionnels des données.