Retour

Formation "Data manipulation avec data.table"

Manipuler de gros jeux de données

Mis à jour le
Formation intra-entreprise Modélisation - méthodes statistiques Autre filière
La formation permet de découvrir le package R data.table particulièrement efficace dans l’import et la manipulation de gros jeux de données.

Les objectifs

  •  Manipuler des jeux de données avec la syntaxe data.table

Public :

Tout public

Pré-requis

  • Avoir suivi la formation "S'initier au logiciel R" ou niveau équivalent
  • Avoir une pratique régulière de R (plusieurs fois par mois)

Programme

  • Introduction à la manipulation de données avec data.table
  • L’intérêt d’utiliser le package data.table
  • Import/export de fichier
  • Sélection de variables et filtre,
  • L’agrégation avec by/keyby
  • La création de variable avec :=
  • Les fonctions setkey, setorder, setnames…
  • Les jointures
  • Les valeurs .SD, .SDcols, .I, .N…
  • La verticalisation avec dcast/melt

Evaluation des acquis

Questionnaire

Méthodes pédagogiques

Exposés et échanges
Applications pratiques sur logiciel

Autre formation sur le même thème

Toutes les formations statistiques

Référence : DATAB

Responsable pédagogique

pers
Maxime Legris
Data Analyst / Statisticien

Pour en savoir plus...

Conditions Générales de Vente Personnes handicapées Règlement intérieur

Autres formations sur le même thème