Notice du logiciel IDAMS de l'UNESCO

Détection et correction des valeurs non numériques

Détecter et corriger les valeurs non numériques, à l'aide de BUILD. En sortie, on obtient un dataset IDAMS où toutes les valeurs non numériques sont remplacées par des 9 et les champs laissés en blanc (champs vides) sont remplacés par des valeurs spécifiées par l'utilisateur. Toutes les corrections sont documentées sur les résultats.

le programme BUILD

$RUN BUILD
$FILES
DICTIN=…dictionnaire en entrée
DATAIN=…données en entrée
DICTOUT=…dictionnaire en sortie
DATAOUT=…données en sortie
$SETUP
titre
paramètres

Paramètres (sélection)
VNUM=CONTIGUOUS/NONCONTIGUOUS
vérifier que variables sont/ne sont par numérotées consécutivement
LRECL=80/n
longueur d'enregistrement de données
MAXERR=10/n
nombre maximum d'observations avec erreurs
PRINT=(OUTDICT/OUTCDICT/NOOUTDICT,RECODES)
OUTD/OUTC/NOOU impression du dictionnaire de sortie
RECODES
impression des observations dans lesquelles les champs vides ont été recodés

Exemple

$RUN BUILD
$FILES
DICTIN=cm.dic
DATAIN=cm.dat
DICTOUT=cm1.dic
DATAOUT=cm1.dat
$SETUP
'Vérification de champs non numériques'
lrecl=47 maxerr=100 print=recodes

Détection des valeurs invalides

Préparer des instructions spécifiant les codes valides ou les intervalles de valeurs pour chaque variable. On peut les préparer en avance pour toutes les variables.

Se servir du dataset obtenu en sortie de l'opération précédente comme entrée du programme CHECK, lequel produit une liste des observations avec valeurs invalides. Il convient de noter que la spécification des codes valides pour les variables peut aussi être tirée des enregistrements C dans le dictionnaire pour autant qu'ils aient été introduits au cours de sa préparation.

le programme CHECK

$RUN CHECK
$FILES
DICTIN=…dictionnaire en entrée
DATAIN=…données en entrée
$SETUP
filtre (facultatif)
titre
paramètres
spécifications de codes

Paramètres (sélection)
VARS=(liste de vars)
variables pour lesquelles les codes corrects sont à extraire du dictionnaire
IDVARS=(liste de vars)
variables à imprimer s'il y a un code incorrect pour l'observation
BUILDCHECK
Spécifications de codes

Liste de variables = liste de valeurs des codes corrects
ou
Liste de variables <> liste de valeurs des codes incorrects

Les codes peuvent être spécifiés un par un (séparés par une virgule), par intervalles (séparés par un tiret) ou par une combinaison des deux.

Exemple

$RUN CHECK
$FILES
DICTIN=cm.dic
DATAIN=cm.dat
$SETUP
'Vérification de codes invalides'
idvars=(v1-v3) vars=(v4,v5)
v11-v13=0-100,999

Exercice