# \textbf{Module1 : Cahier de notes, cahier de laboratoire.} ## Exercie 1: -Faire une recherche dans GitLab: le chemin relatif dans le dépôt: 1-module1/exo1/aebef6b0a5.txt 2-module1/exo1/f683bbad4b.txt -Historique GitLab: 1-Retrouvez le fichier module1/exo2/readme.md et, en utilisant la fonction blame ou history de GitLab, retrouvez le commit responsable de l'ajout du titre Helloworld Python: - Le numéros du commit: 505c4e26afaeaae6f563fe8b593155ec9d6210ca - Auteur du commit: Arnaud Legrand # \textbf{Module2 : La vitrine et l'envers du décor: Le document computationnel.} ## Exercie 2:Savoir faire un calcul simple soi-même.(Python) l=[] // notre liste 1-Calculer la moyenne :mean() 2-l'écart-type:pstdev() 3-le min:min() 4-la médiane: median() 5-le max : max() # Exerice 3: Tracage de courbe voici un programme qui permet de tracer une courbure: import matplotlib.pyplot as plt import numpy as np plt.hist([14.0, 7.6, 11.2, 12.8, 12.5, 9.9, 14.9, 9.4, 16.9, 10.2, 14.9, 18.1, 7.3, 9.8, 10.9,12.2, 9.9, 2.9, 2.8, 15.4, 15.7, 9.7, 13.1, 13.2, 12.3, 11.7, 16.0, 12.4, 17.9, 12.2, 16.2, 18.7, 8.9, 11.9, 12.1, 14.6, 12.1, 4.7, 3.9, 16.9, 16.8, 11.3, 14.4, 15.7, 14.0, 13.6, 18.0, 13.6, 19.9, 13.7, 17.0, 20.5, 9.9, 12.5, 13.2, 16.1, 13.5, 6.3, 6.4, 17.6, 19.1, 12.8, 15.5, 16.3, 15.2, 14.6, 19.1, 14.4, 21.4, 15.1, 19.6, 21.7, 11.3, 15.0, 14.3, 16.8, 14.0, 6.8, 8.2, 19.9, 20.4, 14.6, 16.4, 18.7, 16.8, 15.8, 20.4, 15.8, 22.4, 16.2, 20.3, 23.4, 12.1, 15.5, 15.4, 18.4, 15.7, 10.2, 8.9, 21.0]) plt.show() # \textbf{Module3 : Analyse réplicable} ##Exercie1:Analyse de l'incidence du syndrôme grippal avec une copie locale des données -On télecharge les données dans un fichier locale. -on teste si le fichier local existe avant le télechargement. -on doit toujours ajouté un commentaire afin d'expliquer ce qu'on fait et pourquoi. ##Exercice2: Analyse de l'incidence de la varicelle -l'année ou l'épidemie est la plus forte est 2009. -l'année ou l'épidémie est la plus faible est 2002. ## \textbf{Module4 : La réalité du terrain } ##Quiz 14: 1-Quelle est l’interview du module 1 où des données de nature hétérogène sont discutées ?(b) 2- Que désigne-t-on par métadonnées?(b) 3-En français le nombre 21 se dit « vingt-et-un ». En allemand, on dit « einundzwanzig » (littéralement « un-et-vingt »). Quelle est la prononciation petit-boutiste et quelle est la prononciation gros-boutiste ?(a) 4-Le format FITS est un format destiné à stocker des résultats d’ajustement de modèle (fit en anglais).(b) 5-Le format FITS permet .(a et c) 6-Le format HDF5 est-il hiérarchique ?(a) 7- Les (grosses) données peuvent être archivées et distribuées sur :(b et c) ##Quiz 15: 1- Quels sont les limitations et les inconvénients d’un document computationnel (notebook) ? (a,d,f,g) 2-Quels sont les avantages d’un workflow(a,b,c) 3-Que peut-il se passer en terme de reproductibilité lorsque vous ne préservez pas l’environnement logiciel d’un calcul (a,b,c) 4-Comment préserver l’environnement logiciel d’un calcul effectué à l’aide du langage Python ou R (f,g) 5-Mettre à disposition l’environnement logiciel (sous forme binaire avec une image docker par exemple) d’un calcul permet à une tierce personne de (b) 6-Quelle plate-forme utiliser pour archiver et mettre à disposition un article de recherche(g) 7-Quelles plates-formes utiliser pour archiver et mettre à disposition des données(h,j) 8-Quelles plate-formes utiliser pour archiver et mettre à disposition du code (f,i,j) ##Quiz 16: 1-Quelles caractéristiques de l’arithmétique à virgule flottante rendent la reproductibilité difficile ? (a,c) 2- Quelles précautions augmentent la reproductibilité des nombres pseudo-aléatoires ? (b,c) #Reproduire le Sujet 7 : Autour du SARS-CoV-2 (Covid-19) Le but de ce sujet est de reproduire des graphes semblables à ceux du South China Morning Post (SCMP). ## On va tracé l’évolution du nombre de cas cumulé au cours du temps: 1-A l'adress: https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/ time_series_covid19_confirmed_global.csv; on va ramené les données du nombre de cas cumulé au cours du temps sous format csv. 2-A l'aide la bibliothèque matplotlib de python on va tracé le nombre de cas dans certains pays du fichier csv: france,iran,chine,belgique ,allmend uk. 3-Comme on peux le constaté dans la figure, la courbe de provence de chine n'est pas assez évolué, vue le petit nombre de cas dans ce pays par rapport au autre. Solution!: tracé la courbe à l'échelle logarithmique avec la commande: plt.yscale('log'). ##Nombre du nombre des décès au cours du temps: 1-Pour les cas de décès, on va les chercher dans le site: (timeseriescovid19deathsglobal.csv). 2-Meme astuce que pour les cas cumulé, on va tracé leurs évolution. ##Nombre de lits en abscisse et le nombre de décès en ordonnée: 1-Pour trouvé le nombre des lits par pays, on choisi le site OCDE . 2-Meme astuce que précedent, en trace le nombre de lits en fonction du nombre de décès.