Retour à la page d’accueil



Exercice 1:

Vous avez collecté des données d’expression de deux gènes d’intérêt en réponse à la température dans différentes accessions d’Arabidopsis

Quelle méthode utiliseriez vous pour organiser et nommer les fichiers pour que ce soit lisible pour un ordinateur et un humain. Proposez des noms de fichiers

Il y a de nombreuses solutions à cet exercice. Imaginons par exemple que vous ayez un fichier par réplicat et date. Vous pouvez avec des fichier du type:

date1_geneXY_15c25c_col0_ler1_rep1.txt date1_geneXY_15c25c_col0_ler1_rep2.txt date1_geneXY_15c25c_col0_ler1_rep3.txt

date2_geneXY_15c25c_col0_ler1_rep1.txt date2_geneXY_15c25c_col0_ler1_rep2.txt date2_geneXY_15c25c_col0_ler1_rep3.txt

date”_geneXY_15c25c_col0_ler1_rep1.txt date3_geneXY_15c25c_col0_ler1_rep2.txt date3_geneXY_15c25c_col0_ler1_rep3.txt

(en remplaçant date1, date2 et date3 par la vrai date de l’expérience)

Ou peut être même que vous avez tous vos réplicats ensemble et vous avez un fichier par date:

date1_geneXY_15c25c_col0_ler1_rep1_2_3.txt date2_geneXY_15c25c_col0_ler1_rep1_2_3.txt date3_geneXY_15c25c_col0_ler1_rep1_2_3.txt

Ou alors vous avez un fichier par gène/température/accession/réplicat et date. Dans ce cas vous aurez beaucoup de fichier du type (uniquement les premiers sont indiqués):

date1_geneX_15c_col0_rep1.txt date1_geneY_15c_col0_rep1.txt date1_geneX_25c_col0_rep1.txt date1_geneX_15c_ler1_rep1.txt etc…

Certaines approches sont plus appropriées à vos données que d’autres. Le choix de l’organisation et du nom des fichiers se fera en fonction du type de données et de la manière dont elles sont collectées (souvenez vous, ne changez jamais les données brutes)




Exercice 2:

Une étude a été faite pour déterminer le sexe et le poids des animaux attrapés dans différentes parcelles expérimentales. L’expérience a été répétées sur deux années.

Problèmes d’organisation des données:

Le fichier “dataset_tidy.xls” contient les mêmes données qui sont bien organisées.