L’ensemble de données pour étudiants

L’ensemble de données de CanPath pour étudiants offre les étudiants l’occasion unique d’acquérir une expérience pratique de l’utilisation des données de CanPath.

Qu’est-ce que l’ensemble de données pour étudiants?

L’ensemble de données de CanPath pour étudiants est un ensemble de données synthétique qui a été façonné pour imiter les données harmonisées à l’échelle nationale de CanPath, mais qui n’inclut pas ni ne révèle les données réelles des participants à CanPath.

Les enseignants de niveau universitaire et collégial au Canada peuvent utiliser gratuitement l’ensemble de données de CanPath pour étudiants pour leurs cours académiques. CanPath fournira l’ensemble de données pour étudiants et un dictionnaire de données à l’appui.

Avantages de l’ensemble de données de CanPath pour étudiants

« L’ensemble de données était facile à utiliser et le nombre de variables qu’il incluait serait utile dans de nombreuses analyses. En outre, l’ensemble de données comprenait un très grand nombre d’observations, ce qui a rendu possible une analyse solide ».

Étudiant MPH, l’École de santé publique Dalla Lana de l’Université de Toronto

Qu’est-ce qui est disponible ?

Données canadiennes

L’ensemble de données synthétiques est similaire à un échantillon aléatoire de données de CanPath,  comprenant des participants du projet BC Generations, du projet Alberta Tomorrow, de l’Étude sur la santé Ontario, de CARTaGENE et de La VOIE Atlantique.

L’ensemble de données pour étudiants comprend plus de 40 000 observations couvrant 403 variables catégorielles provenant du questionnaire de base de CanPath et des questionnaires subséquents sur la maladie.

Domaines d’information

Les variables englobent des données sociodémographiques et économiques et des données sur le mode de vie et le comportement (p. ex., le tabagisme, la consommation d’alcool, la nutrition), la perception de la santé, et certaines maladies auto-déclarés telles que l’hypertension artérielle, l’arthrite et le premier cancer.

Variables d’exposition environnementale de CANUE

L’ensemble de données pour étudiants comprend également des variables environnementales provenant de l’ensemble de données du Consortium canadien de recherche en santé environnementale urbaine (CANUE), comme l’indice de privation matérielle et l’exposition moyenne annuelle à la pollution atmosphérique ambiante.

Processus d’accès à l’ensemble de données pour étudiants

La demande remplie et les pièces justificatives peuvent être soumises par courriel à apply@canpath.ca. Les demandes seront examinées dans un délai de deux semaines.

Critères d’admissibilité

  • Le candidat doit enseigner dans une université ou un collège canadien ;
  • L’ensemble de données est demandé pour une utilisation dans le cadre d’un cours ;
  • Les objectifs du cours sont pertinents au but, à la vision et à la mission de CanPath ;
  • L’ensemble de données de CanPath s’aligne sur les objectifs et les méthodes du cours.

Documents requis

  1. Formulaire de demande rempli
  2. Copie de la demande de CÉR*
    • Lettre de décision du CÉR ou preuve d’exemption
  3. Court CV du candidat (2 pages)
  4. Plan de cours**

*Une demande de CÉR, une lettre de décision et une preuve d’exemption ne sont nécessaires que si un autre ensemble de données est utilisé en même temps que l’ensemble de données de CanPath pour étudiants dans le cours.

**Le plan de cours doit mentionner l’utilisation de l’ensemble de données de CanPath pour étudiants.

Après chaque itération du cours, les utilisateurs doivent fournir à CanPath un retour d’information sur l’utilisation de l’ensemble de données à l’aide du formulaire d’utilisation de l’ensemble de données synthétiques.

Exemples de projets d’étudiants

À l’été 2023, l’atelier d’été L’intelligence artificielle pour la santé publique (IASP) a rassemblé vingt-deux étudiants diplômés, boursiers postdoctoraux et chercheurs en début de carrière à l’Institut Fields de l’Université de Toronto (U de T). Les stagiaires ont reçu l’ensemble de données de CanPath pour étudiants. Pendant cinq jours, les stagiaires ont participé à diverses sessions d’apprentissage, y compris un défi de données qui allait de la sélection et de la préparation des données à la création de modèles d’apprentissage machine, à l’évaluation de la précision des modèles et, enfin, à la formulation de conclusions causales.

« Cette synthèse permet de mieux comprendre les problèmes liés à la santé, de les formuler avec les bonnes techniques et, enfin, de les résoudre ».

Hassan Maleki Golandouz, étudiant en doctorat à l’Université du Manitoba participant à l’atelier d’été IASP
Students at the AI4PH Summer Institute, who partook in the CanPath Student Dataset challenge
Étudiants et membres du corps enseignant de l’institut d’été IASP

Autres exemples de projets d’étudiants utilisant l’ensemble de données :

Veuillez noter : L’ensemble de données de CanPath pour étudiants est destiné uniquement à la formation et ne peut être utilisé à des fins de publication. Les étudiants intéressés à savoir si les résultats de leur projet peuvent être reproduits à l’aide des données réelles de CanPath en vue d’une éventuelle publication peuvent postuler via le Processus d’accès à CanPath. Des frais réduits s’appliquent aux étudiants et aux stagiaires qui demandent l’accès aux données et aux échantillons biologiques de CanPath.

Soumettez une demande aujourd’hui

Questions ?