Python

Le Python est devenu une partie incontournable du programme pour réussir les épreuves de mathématiques, mais elle est souvent négligée et mise de côté par les étudiants. L’objectif de cet article est que tu puisses maîtriser pandas et l’ensemble des fonctions utiles à l’analyse de données applicable dans les exercices et les annales. Tu pourras ainsi utiliser les notions ci-dessous pour te constituer des fiches et vérifier que tu es bien à jour en Python. Je te rappelle toutefois que cette liste reste non exhaustive et qu’il est indispensable de suivre les cours dispensés par tes professeurs pour être prêt(e) le jour J, tant sur la méthode que sur la rigueur attendue.

Qu’est-ce que pandas ?

L’informatique permet de traiter des quantités d’informations très importantes dans des domaines très variés. Pandas est une bibliothèque Python puissante, efficace et rapide pour lire, écrire, filtrer et trier des données dans différents formats (ex. : .txt, .csv, .xlsx…).

Pandas peut également être couplé avec d’autres bibliothèques Python. On retrouvera dans cette perspective une compatibilité en visualisation des données, par exemple avec matplotlib.pyplot, mais aussi en calculs, logiques et statistiques à partir de tableaux avec numpy. Finalement, Pandas est utile pour déterminer des indicateurs statistiques de base, qui permettent de comprendre la tendance globale d’une base de données.

Pour que tu sois capable d’utiliser correctement la bibliothèque pandas, il est nécessaire que tu saches lire des données sous forme de tableau, identifier les différentes composantes d’une table et les transcrire en format CSV.

Voici ce que tu dois connaître pour lire une table :

Prénom du propriétaire Prénom du chien Âge du chien
Alain Pablo 3
Jacques Omer 13
Pierre Jack 10
Jean Speedy 7

Ligne = enregistrement

Colonne = champ

Titre des colonnes = en-tête

Maintenant que tu sais lire et identifier les données sous forme de tableau, tu dois les transcrire sous forme de fichier CSV. Le CSV, qui signifie Comma-Separated Values (valeurs séparées par des virgules), est un format de fichier qui permet de stocker de manière simple une multitude de données.

Très simplement on transcrit donc les données du tableau ci-dessus sous ce format : 

Remarque :

  • Tu dois OBLIGATOIREMENT utiliser une virgule et pas un point-virgule pour que le fichier soit correctement écrit.
  • Tu peux ouvrir un fichier CSV avec un tableur comme EXCEL ou encore à l’aide du bloc-notes de ton ordinateur.
  • La bibliothèque pandas permet d’effectuer des opérations sur les fichiers CSV.

Créer une table pandas à partir d’un fichier CSV

Comme toute bibliothèque, tu dois d’abord importer pandas avant de pouvoir l’utiliser. Puis tu pourras créer une table pandas en assignant à un fichier un nom de table et en utilisant les commandes suivantes.

Remarque :

  • Dans certains cas, un exercice pourra te demander de travailler sur un environnement local de travail. Dans ce cas, tu pourras omettre le chemin d’accès et indiquer entre les parenthèses de « pd.read_csv » uniquement le nom du fichier CSV.
  • Tu peux aussi utiliser la commande « pd.read_csv » sans assigner de nom à ta table. Dans ce cas, Python affichera uniquement la table CSV sans lui associer de nom.

 

Exemple :

BONUS :

  • Tu peux importer que certains champs d’une table CSV à l’aide de cette commande :

Dans ce cas, la table pandas n’affichera QUE les trois premiers champs de la table CSV.

Commandes utiles pour extraire des informations d’une table pandas

Tu retrouveras ici quatre types de commandes qui te permettront d’extraire des informations d’une table qui ne concernent pas son contenu mais plutôt sa structure.

1 – Pour afficher les premières entrées de la table : nom_de_la_table.head() 

2 – Pour afficher le format de la table : nom_de_la_table.shape

3 – Pour afficher la liste des champs : nom_de_la_table.columns

4 – Pour afficher des informations utiles, comme les types de données ou le format : nom_de_la_table.info()

Commandes utiles pour filtrer les données d’une table pandas

Tu dois aussi être capable de filtrer les données d’une table. Dans ce cas, tu disposes de trois commandes à connaître pour réaliser des opérations.

1 – Pour extraire une sous-table à partir du nom des champs : nom_de_la_table[[Champ1,Champ2,…..]]

2 – Pour extraire une sous-table à partir d’un critère : nom_de_la_table[nom_de_la_table[critère]]

3 – Pour trier les données selon un champ choisi par ordre croissant : nom_de_la_table.sort_values(by=[Champ1])

Remarque : Attention aux parenthèses dans la dernière commande, elles sont nécessaires, sinon le code ne fonctionnera pas.

Exemple : 

Commandes utiles pour faire des statistiques

Finalement, il est possible que l’on te demande d’utiliser des tables pour réaliser des statistiques. Dans ce cas, pandas peut être utile pour :

1 – Te donner toutes les informations statistiques utiles (moyenne, médiane, écart type…) : nom_de_la_table.describe( )

2 – Te donner les boîtes à moustaches des différents champs (celle-ci est beaucoup moins utilisée, mais tu peux la connaître sans l’apprendre) : nom_de_la_table.boxplot( )

BONUS : Tu peux spécifier les colonnes à représenter en rajoutant des arguments à la commande boxplot après des parenthèses. Dans ce cas, tu pourras créer des sous-graphes selon le critère que tu donnes.

Exemple : 

Conclusion

Pandas est un outil incontournable pour manipuler efficacement de grandes bases de données et en extraire des informations pertinentes grâce à des commandes. Avec un peu d’entraînement, tu pourras maîtriser rapidement l’analyse, le filtrage et les statistiques à partir de données réelles.

N’hésite pas à t’entraîner sur des annales dès que possible : c’est le meilleur moyen de comprendre ce qui est attendu lors des épreuves et d’en extraire les éléments qui reviennent de manière récurrente.

Tu peux retrouver de manière plus générale tous les articles de maths ici. Retrouve ici le méga-répertoire qui contient toutes les annales de concours et les corrigés. Tu peux également accéder ici à toutes nos autres ressources mathématiques !