Qu’est-ce que l’ensemble de données synthétiques ?
Anciennement connu sous le nom d’ensemble de données pour étudiants de CanPath, l’ensemble de données synthétiques de CanPath a été manipulé pour imiter les données harmonisées au niveau national de CanPath, mais n’inclut ni ne révèle les données réelles des participants à CanPath.
Les enseignants de niveau universitaire et collégial au Canada peuvent utiliser gratuitement l’ensemble de données synthétiques de CanPath pour leurs cours académiques. CanPath fournira l’ensemble de données pour étudiants et un dictionnaire de données à l’appui.
« L’ensemble de données était facile à utiliser et le nombre de variables qu’il comprenait serait utile dans de nombreuses analyses. De plus, l’ensemble de données comprenait un très grand nombre d’observations, ce qui a permis de réaliser une analyse solide ».
Étudiant en maîtrise de santé publique, École de santé publique Dalla Lana, Université de Toronto
Exemples de projets d’étudiants
À l’été 2023, l’atelier d’été L’intelligence artificielle pour la santé publique (IASP) a rassemblé vingt-deux étudiants diplômés, boursiers postdoctoraux et chercheurs en début de carrière à l’Institut Fields de l’Université de Toronto (U de T). Les stagiaires ont reçu l’ensemble de données de CanPath pour étudiants. Pendant cinq jours, les stagiaires ont participé à diverses sessions d’apprentissage, y compris un défi de données qui allait de la sélection et de la préparation des données à la création de modèles d’apprentissage machine, à l’évaluation de la précision des modèles et, enfin, à la formulation de conclusions causales.
« Cette synthèse permet de mieux comprendre les problèmes liés à la santé, de les formuler avec les bonnes techniques et, enfin, de les résoudre ».
Hassan Maleki Golandouz, étudiant en doctorat à l’Université du Manitoba participant à l’atelier d’été IASP
Autres exemples de projets d’étudiants :
- Horaire de travail et consommation excessive d’alcool
- Consommation de fruits et légumes et cancer colorectal
- Tabagisme et sclérose en plaques
- Fécondation in vitro et maladies cardiovasculaires
- Anxiété et migraines
- Espace vert et obésité
- Éducation et tension artérielle
- Anxiété et dépendance
Veuillez noter : L’ensemble de données synthétiques de CanPath est destiné uniquement à la formation et ne peut être utilisé à des fins de publication. Les étudiants intéressés à savoir si les résultats de leur projet peuvent être reproduits à l’aide des données réelles de CanPath en vue d’une éventuelle publication peuvent postuler via le Processus d’accès à CanPath. Des frais réduits s’appliquent aux étudiants et aux stagiaires qui demandent l’accès aux données et aux échantillons biologiques de CanPath.