Détecter et corriger les valeurs non numériques, à l'aide de BUILD. En sortie, on obtient un dataset IDAMS où toutes les valeurs non numériques sont remplacées par des 9 et les champs laissés en blanc (champs vides) sont remplacés par des valeurs spécifiées par l'utilisateur. Toutes les corrections sont documentées sur les résultats.
$RUN BUILD
$FILES
DICTIN=…dictionnaire en entrée
DATAIN=…données en entrée
DICTOUT=…dictionnaire en sortie
DATAOUT=…données en sortie
$SETUP
titre
paramètres
Exemple
$RUN BUILD
$FILES
DICTIN=cm.dic
DATAIN=cm.dat
DICTOUT=cm1.dic
DATAOUT=cm1.dat
$SETUP
'Vérification de champs non numériques'
lrecl=47 maxerr=100 print=recodes
Préparer des instructions spécifiant les codes valides ou les intervalles de valeurs pour chaque variable. On peut les préparer en avance pour toutes les variables.
Se servir du dataset obtenu en sortie de l'opération précédente comme entrée du programme CHECK, lequel produit une liste des observations avec valeurs invalides. Il convient de noter que la spécification des codes valides pour les variables peut aussi être tirée des enregistrements C dans le dictionnaire pour autant qu'ils aient été introduits au cours de sa préparation.
$RUN CHECK
$FILES
DICTIN=…dictionnaire en entrée
DATAIN=…données en entrée
$SETUP
filtre (facultatif)
titre
paramètres
spécifications de codes
Liste de variables = liste de valeurs des codes corrects
ou
Liste de variables <> liste de valeurs des codes incorrects
Les codes peuvent être spécifiés un par un (séparés par une virgule), par intervalles (séparés par un tiret) ou par une combinaison des deux.
Exemple
$RUN CHECK
$FILES
DICTIN=cm.dic
DATAIN=cm.dat
$SETUP
'Vérification de codes invalides'
idvars=(v1-v3) vars=(v4,v5)
v11-v13=0-100,999