miércoles, 27 de mayo de 2015

TEMA 9: PREPARACIÓN DE DATOS

  PREPARACIÓN DE DATOS 


RESUMEN

Cuando abra un archivo de datos o introduzca datos en el Editor de datos, podrá empezar a crear informes, gráficos y análisis sin ningún trabajo preliminar adicional. Sin embargo, hay algunas funciones de preparación adicional de los datos que pueden resultarle útiles, entre las que se incluyen:
n  Asignar propiedades de las variables que describan los datos y determinen cómo se deben tratar ciertos valores.
n  Identificar los casos que pueden contener información duplicada y excluir dichos casos de los   análisis o eliminarlos del archivo de datos.
n  Crear nuevas variables con algunas categorías distintas que representen rangos de valores de variables que tengan un mayor número de valores posibles.

§  Propiedades de variables
Los datos introducidos en la Vista de datos del Editor de datos o leídos desde un formato de archivos externo (como una hoja de cálculo de Excel o un archivo de datos de texto) carecen de ciertas propiedades de variables que pueden resultar muy útiles, como:
·        Definición de etiquetas de valor descriptivas para códigos numéricos (por ejemplo, 0 = Hombre y 1 = Mujer).
·        Identificación de códigos de valores perdidos (por ejemplo, 99 = No procede).
·        Asignación del nivel de medida (nominal, ordinal o de escala).


·         

Todas estas propiedades de variables (y otras) se pueden asignar en la Vista de variables del Editor de datos. También hay algunas utilidades que le pueden ofrecer asistencia en este proceso:

·         Definir propiedades de variables puede ayudarle a definir etiquetas de valor descriptivas y valores perdidos. Esto es especialmente útil para datos categóricos con códigos numéricos utilizados para valores de categorías.
·         Definir nivel de medición para desconocido identifica las variables (campos) que no tengan    un nivel de medición definido y permite definir el nivel de medición de esas variables. Es importante para los procedimientos en los que el nivel de medición puede afectar a los resultados o determinar qué funciones estarán disponibles.
·         Copiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos con IBM® SPSS® Statistics como plantilla para definir las propiedades de variables y archivos en el archivo de datos actual. Esto es particularmente útil si utiliza frecuentemente archivos de datos con un formato externo que tenga un contenido similar, como puedan ser informes mensuales en formato Excel.

§  Definición de propiedades de variables
Definir propiedades de variables está diseñado para ayudarle en el proceso de asignar atributos a variables, incluyendo la creación de etiquetas de valor descriptivas para variables categóricas (nominales u ordinales). Definir propiedades de variables:
·        Explora los datos reales y enumera todos valores de datos únicos para cada variable seleccionada.
·        Identifica valores sin etiquetas y ofrece una función de “etiquetas automáticas”.
·        Permite copiar etiquetas de valor definidas y otros atributos de otra variable en la variable seleccionada o de la variable seleccionada a varias variables adicionales.
Nota: Para utilizar Definir propiedades de variables sin explorar primero los casos, introduzca 0 para el número de casos que se van a explorar.

§  Para definir propiedades de variables
ü  Elija en los menús:
Datos > Definir propiedades de variables...
Cuadro de diálogo inicial para seleccionar las variables que se van a definir
ü  Seleccione las variables numéricas o de cadena para las que desea crear etiquetas de valor o definir o cambiar otras propiedades de las variables, como los valores perdidos o las etiquetas de variable descriptivas.
ü  Especificar el número de casos que se van a explorar para generar la lista de valores únicos.
ü  Resulta especialmente útil para los archivos de datos con mayor número de casos, para el cual una exploración del archivo de datos completo podría tardar una gran cantidad de tiempo.
ü  Especifique un límite superior para el número de valores únicos que se va a visualizar. Esto es especialmente útil para evitar que se generen listas de cientos, miles o incluso millones de valores para las variables de escala (intervalo continuo, razón).
ü  Pulse en Continuar para abrir el cuadro de diálogo Definir propiedades de variables principal.
ü  Seleccione una variable para la que desee crear etiquetas de valor o definir o cambiar otras propiedades de las variables.
ü  Introduzca el texto de etiqueta para los valores sin etiquetas que se visualicen en Rejilla etiqueta valores.
ü  Si hay valores para los que desea crear etiquetas de valor, pero no se visualizan dichos valores, puede introducirlos en la columna Valores por debajo del último valor explorado.
ü  Repita este proceso para cada variable de la lista para la que desee crear etiquetas de valor.
ü  Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las variables.

Definición de etiquetas de valor y otras propiedades de las variables

Cuadro de diálogo principal Definir propiedades de las variables
El cuadro de diálogo principal Definir propiedades de variables proporciona la siguiente información para las variables exploradas:
Lista de variables exploradas. Para cada variable explorada, aparecerá una marca de verificación en la columna Sin etiqueta (S/E) indicando que la variable contiene valores sin etiquetas de valor asignadas.
Para ordenar la lista de variables para que aparezcan todas las variables con valores sin etiquetas en la parte superior de la lista:

ü  Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables exploradas.

También puede ordenarla por nombre de variable o nivel de medida pulsando en el encabezado de columna correspondiente debajo de la Lista de variables exploradas.

§  Rejilla etiqueta valores
·        Etiqueta. Muestra las etiquetas de valor que ya se han definido. Puede añadir o cambiar las etiquetas de esta columna.
·        Valor. Valores únicos para cada variable seleccionada. Esta lista de valores únicos se basa en  el número de casos explorados. Por ejemplo, si sólo ha explorado los primeros 100 casos del archivo de datos, la lista reflejará sólo los valores únicos presentes en esos casos. Si el archivo de datos ya se ha ordenado por la variable para la que desea asignar etiquetas de valor, la lista puede mostrar muchos menos valores únicos de los que hay realmente presentes en los datos.
·        Recuento. Número de veces que aparece cada valor en los casos explorados.
·        Perdidos. Valores definidos para representar valores perdidos. Puede cambiar la designación de la categoría de los valores perdidos pulsando en la casilla de verificación. Una marca indica que la categoría se ha definido como categoría perdida por el usuario. Si una variable ya tiene un rango de valores definidos como perdidos por el usuario (por ejemplo 90 - 99), no podrá añadir ni eliminar categorías de valores perdidos para esa variable con Definir propiedades de variables. Puede utilizar la Vista de variables del Editor de datos para modificar las categorías de valores perdidos para la variable con rangos de valores perdidos.
·        Cambiado. Indica que ha añadido o cambiado una etiqueta de valor.

Nota: Si ha especificado 0 para el número de casos que se van a explorar en el cuadro de diálogo inicial, la rejilla etiqueta valores estará en blanco al principio, a excepción de algunas etiquetas de valor ya existentes y/o categorías de valores perdidos definidas para la variable seleccionada. Además, se desactivará el botón Sugerir para el nivel de medida.
Nivel de medida. Las etiquetas de valor son especialmente útiles para las variables categóricas (nominales u ordinales), y algunos procedimientos tratan a las variables categóricas y de escala de manera diferente, por lo que a veces es importante asignar el nivel de medida correcto. Sin embargo, por defecto, todas las nuevas variables numéricas se asignan al nivel de medida
de escala. Por tanto, puede que muchas variables que son de hecho categóricas, aparezcan inicialmente como variables de escala.
Si no está seguro de qué nivel de medida debe asignar a una variable, pulse en Sugerir.

Papel. Algunos cuadros de diálogo permiten preseleccionar variables para su análisis en función de papeles definidos.
Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables de otra variable a la variable seleccionada en ese momento o desde la variable seleccionada en ese momento a una o varias otras variables.
Valores sin etiquetas. Para crear automáticamente etiquetas para valores sin etiquetas, pulse en: Etiquetas automáticas.

Etiqueta de variable y formato de presentación
Puede cambiar de la etiqueta de variable descriptiva y el formato de presentación.
·         No puede cambiar el tipo fundamental de la variable (numérica o de cadena).
·         Para las variables de cadena, sólo puede cambiar la etiqueta de variable, no el formato de presentación.
·         Para las variables numéricas, puede cambiar el tipo numérico (como numérico, fecha, dólar o moneda personalizada), el ancho (número máximo de dígitos, incluyendo los indicadores decimales y/o de agrupación) y el número de posiciones decimales.
·         Para el formato de fecha numérica, puede seleccionar un formato de fecha específico (como dd-mm-aaaa, mm/dd/aa, aaaaddd)
·         Para formato numérico personalizado, puede seleccionar uno de los cinco formatos de moneda personalizados (de CCA a CCE).
·         Aparece un asterisco en la columna Valor si el ancho especificado es inferior al ancho de los valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes    o categorías de valores perdidos.
·         Aparece un período (.) si los valores explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categorías de valores perdidos no son válidos para el tipo de formato de presentación seleccionado. Por ejemplo, un valor numérico interno inferior a 86.400 no es válido para una variable de formato de fecha.




EVIDENCIAS FOTOGRÁFICAS 






No hay comentarios:

Publicar un comentario