Glosario de términos empleados Total terminos: 120

Regresar

Método para determinar cómo se distribuirá la muestra. En el muestreo estratificado se refiere, por lo general, a la determinación del número de unidades que se seleccionan de cada estrato. En el muestreo de conglomerados, se refiere a la decisión acerca del número de conglomerados que se selecciona y al tamaño de la muestra que se extrae en cada conglomerado. (IICA) .

Área que contiene un conjunto de localidades rurales con una población menor a 2,500 habitantes cada una, asentadas en terreno de uso generalmente agropecuario o forestal. ENOE (2008) .

Área que se encuentra dentro de una localidad urbana integrada por un conjunto de manzanas perfectamente delimitadas, cuyo uso de suelo no es forestal ni agropecuario. ENOE (2008).

Proximidad o contigüidad entre manzanas (las manzanas de al lado). (Diccionario)

Se refiere al espacio determinado por límites reales o imaginarios. (SDMV).

  • Ejemplos:
  • Ámbito Geográfico: Todo el territorio Nacional, Urbano y Rural. (SDMV)
  • Ámbito Poblacional: Población que reside en viviendas particulares. (SDMV).
  • Ámbito Temporal: Resultados de la encuesta trimestral, mensual, semanal. (SDMV).

AED. Proceso mediante el cual se examinan las filas de datos para encontrar sus características más importantes. Varias herramientas se usan dependiendo del tipo de datos como tablas de frecuencia simples, gráficos de barras de variables, distribución, medias, etc. o gráficos para variables continuas. El AED representa un aspecto esencial y básico para el análisis de datos. (OMS)

En una encuesta basada en muestras, se trata del fallo a la hora de obtener información de alguno de los participantes, por cualquier motivo. (OMS).

Conjunto de datos que pertenecen al mismo contexto almacenados sistemáticamente para su posterior uso en un ordenador. STEPS utiliza Microsoft Access. (OMS)

Una variable que toma diferentes valores posibles en las distintas unidades individuales de muestreo o análisis. En una encuesta por muestra, observamos o medimos los valores de una o más características en las unidades que forman la muestra. Por ejemplo observamos la superficie de la tierra cultivada con arroz, o el número de cabezas de ganado en una finca. (IICA).

Características de la población, por ejemplo edad, sexo, etnia y lugar de residencia. (OMS).

Método de generación de información estadística, mediante la obtención de datos de cada uno de los elementos que conforman el conjunto objeto de estudio. En determinados contextos puede denominarse inventario y cuando se cuenta la población y/o las viviendas se le llama conteo. Es un levantamiento conducido sobre el conjunto total de objetos de observación pertenecientes a una población dada o universo. ONU 2009 y OCDE.

Describe la cobertura de localidades del levantamiento. Estas pueden ser específicas como los nombres de las localidades, varios códigos para localizarlas, censos, mapas de sitios y rangos de latitud y longitud. (ONU 2009).

Es el error estándar relativo, es decir, el error estándar como una proporción de la magnitud de la estimación, representado con la letra V. (IICA).

Es una subpoblación en la cual los elementos que la componen poseen cierta característica que les hace ser propios de cierta cualidad o atributo. Por ejemplo, lugar geográfico, grupo étnico, ideología y organización social. Uno de los objetivos de la formación de conglomerados es el ahorro de recursos. Comúnmente las unidades de estudio al interior del conglomerado son heterogéneas entre ellas. (SDMV). Un conglomerado o clúster es un grupo de unidades con algún tipo de similitud. Por ejemplo, en un muestreo de niños en edad escolar, los que asisten a la misma escuela pertenecen a un mismo conglomerado o clúster porque comparten el mismo centro escolar, los mismos profesores y viven en el mismo barrio. (Banco Mundial). Conglomerado Grupo de individuos (normalmente definidos geográficamente). (OMS).

La correlación intraconglomerado es la correlación (o similitud) en los resultados o las características de las unidades que pertenecen al mismo conglomerado. Por ejemplo, los niños que asisten a la misma escuela tendrán, en muchas ocasiones, características similares o correlaciones en términos de la zona de residencia y el contexto socioeconómico. (Banco Mundial).

Los datos que cubren todas las unidades de la población de interés (o universo). Se diferencia de los datos de encuestas, que solo cubren una parte de la población. (Banco Mundial).

Los datos correspondientes a una muestra de la población de interés. Se diferencia de los datos censales. (Banco Mundial).

El desgaste de la muestra se produce cuando se pierden algunas unidades de la muestra entre una ronda de datos y la siguiente, por ejemplo, cuando hay personas que emigran y no se las localiza de una ronda a la siguiente. El desgaste de la muestra es un caso de falta de respuesta de la unidad. El desgaste de la muestra puede sesgar la evaluación de impacto si se correlaciona con el tratamiento. (Banco Mundial).

El error estándar de una muestra simple al azar de tamaño 1. (IICA). Desviación estándar. Medida de dispersión de una característica. La desviación estándar (o típica) cuadrática se conoce como varianza. Ambas se utilizan en la mayoría de las fórmulas estadísticas. (OMS).

También conocida como "doble diferencia" o "DD". El método de diferencias en diferencias estima el contra factual del cambio en el resultado de interés antes y después del programa en el grupo de tratamiento mediante el cambio de los mismos resultados de interés antes y después del programa en el grupo de comparación. Este método nos permite tener en cuenta y hacer desaparecer cualquier diferencia constante en el tiempo entre los grupos de tratamiento y de comparación. Las dos diferencias que se calculan son por lo tanto entre los momentos de antes y después, y entre los grupos de tratamiento y de comparación. (Banco Mundial).

Conjunto de procedimientos mediante los cuales se determinan el método de muestreo por aplicar, el tamaño de la muestra, la determinación de estratos, la distribución de la muestra y los procedimientos de selección, así como los elementos técnicos para la determinación de estimadores (Eurostat, 2002). Diseño de la muestra. Metodología utilizada para seleccionar a la parte de la población que será incluida en la encuesta. Los métodos incluyen probabilidades en las que cada miembro de la población tiene una oportunidad no igual a cero de ser seleccionado, y no probabilidades, en las que la selección se basa en la conveniencia, en redes o cupos. Los métodos no probabilísticas no son representativos de la población y por lo tanto no se usan en STEPS. Las decisiones sobre el diseño de la muestra son dependientes en parte de la disponibilidad de los marcos del muestreo actualizados (OMS).

Incluye aspectos sobre la encuesta como la elección y capacitación de los entrevistadores y el diseño del plan de tabulados. (SDMV).

Serie de procedimientos para determinar el método de muestreo por aplicar, bajo las consideraciones de cobertura, y desglose temático y geográfico establecidos en el diseño conceptual, así como los insumos disponibles en cuanto al marco de muestreo de referencia y recursos financieros; el tamaño de muestra y procedimientos de selección, así como el diseño y cálculo de estimadores, con base en el análisis y elección de las mejores alternativas para el proyecto. (SDMV).

Se refiere a la distribución de la muestra entre los diferentes estratos de diseño y dominios de estudio para los que se requieren realizar estimaciones. (SDMV).

Es un método utilizado para establecer como debe distribuirse la muestra. (INEI).

Probabilidades teóricas o frecuencias observadas en un conjunto de sucesos o valores. Muchas estimaciones o pruebas utilizadas en estadística dependen de si los datos tienen una distribución normal u otra específica. (OMS).

Unidad geográfica para las que se deben proporcionar estimaciones separadas. (ONU).

Se llama dominio de estudio a cualquier subpoblación acerca de la cual se planea la encuesta para proporcionar información numérica independiente y de precisión conocida (ONU).

El "efecto Hawthorne" se produce cuando, por el simple hecho de ser observadas, las unidades se comportan de manera diferente. (Banco Mundial).

El efecto John Henry se produce cuando las unidades de la comparación se esfuerzan más para compensar que no les han ofrecido tratamiento. Cuando se comparan las unidades tratadas con las unidades de la comparación que se esfuerzan más, la estimación del impacto del programa resulta sesgada; es decir, estimamos un impacto menor del programa en comparación con el impacto real que obtendríamos si las unidades de la comparación no realizaran un esfuerzo adicional. (Banco Mundial).

Método para generar información estadística mediante la captación de datos para un subconjunto de unidades seleccionadas de la población objeto de estudio. (SDMV).

Los errores de cobertura surgen por fallas en la cobertura adecuada de todos los componentes de una población que está siendo estudiada. Los marcos muéstrales incompletos a menudo dan como resultado errores de este tipo. (SDMV).

Medida que expresa el alcance de la diferencia entre las estimaciones derivadas de la muestra y el valor poblacional verdadero que se trata de estimar. Si las estimaciones son insesgadas, el error cuadrático medio y la variancia son equivalentes. (IICA).

Una medida de la magnitud en que difieren las estimaciones de varias muestras con respecto al valor esperado. Con un tamaño de muestra razonablemente grande, la distribución de los resultados muéstrales en todas las muestras posibles es aproximadamente normal y se pueden hacer afirmaciones, en términos de probabilidad, acerca de la medida en que se espera que la muestra se aproxime al valor esperado, expresándose las probabilidades en términos del error estándar. El error estándar se representa generalmente con la letra griega S (IICA).

Es la diferencia entre un parámetro poblacional y el valor estimado, derivado de una muestra probabilística, que es debido al hecho de que sólo se observa una parte de los valores, sesgos en las respuestas o su estimación, errores de observación y registro, etc. Los errores de muestreo generan una distribución muestral de los estimadores (OCDE). Error de muestreo. El sesgo en la estimación de encuestas derivadas de errores en el diseño e implementación; se refiere a la exactitud o la validez de una estimación en lugar de su fiabilidad o precisión. (ONU). Error de muestreo. Los errores de muestreo surgen al estimar la característica de una población observando solamente una porción de la población en lugar de la población entera. Se refiere a la diferencia entre las estimaciones derivadas de una encuesta basada en muestras y del valor "real" que resultaría si se produjera un censo de toda la población bajo las mismas condiciones. En los censos no hay errores de muestreo porque los cálculos se basan en toda la población. La medida de un error de muestreo se llama error estándar para un porcentaje o variable particular. La precisión se mide según el error estándar y se ilustra con los intervalos de confianza. (OMS).

Error causado por limitaciones inherentes a los insumos utilizados para producir los datos, o por retrasos y errores en la obtención y procesamiento de los datos actualizados (OCDE).

Inclusiones erróneas, omisiones o duplicidad de registros. Los marcos muéstrales incompletos, de origen o durante su mantenimiento, a menudo dan como resultado errores de este tipo. (SDMV).

Unidades no clasificadas o mal clasificadas por la industria, la geografía, el tamaño, etc. (SDMV).

Unidades con información de ubicación incompleta o incorrecta. Desviación estándar de la media de la mayoría de las muestras de una población. (SDMV).

El error estándar indica la distancia razonable que se espera entre la media de la muestra y la media de la población. No representa el conjunto de valores dispersos de la población, es decir que no es lo mismo que la desviación estándar. (OMS).

Es el conjunto de todos los resultados posibles de un experimento aleatorio. Cada experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas las soluciones posibles). (INEI).

Una cantidad calculada usando las observaciones muéstrales de una característica, con el propósito por lo general, de extraer alguna inferencia acerca de la población. La característica puede ser cualquier variable asociada con un miembro de la población, por ejemplo, edad, ingreso, condición de empleo, etc. La cantidad puede ser un total, un promedio, una media o algún otro percentil, o también una tasa de cambio, un porcentaje, una desviación estándar o cualquier otra cantidad cuyo valor se desea estimar en la población. (IICA).

Es una función matemática que toma como valores de entrada los datos recolectados en la muestra y que produce un valor numérico. (SDMV).

Cantidad numérica calculada con los datos de la muestra y que tiene por fin proporcionar información sobre un valor poblacional desconocido. (IICA). Estimación. Conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. En su versión más simple, una estimación de la media de una determinada característica de una población de tamaño N sería la media de esa misma característica para una muestra de tamaño n. También se refiere al valor aproximado resultante. (OMS).

Es un estadístico pensado para producir valores que, para la mayoría de las muestras, queden cercanos a una cantidad poblacional desconocida y que se desea estimar. Para un diseño muestral dado, el estimador es el método de estimación del parámetro de la población en los datos de la muestra. Por ejemplo, la media aritmética de la muestra es un estimador. (ONU).En estadística, un estimador es una función que se emplea para calcular un parámetro desconocido de la población; una estimación es el resultado de la aplicación de esta función a una muestra particular de datos. (Banco Mundial).

Método de estratificación mediante el cual se clasifica geográficamente el marco muestral combinado con el muestreo sistemático con probabilidad proporcional al tamaño. (ONU).Es el proceso de dividir una población en grupos, con el objeto de seleccionar una muestra separada en cada grupo. Cada grupo se hace por lo general lo más homogéneo internamente. Los grupos se llaman estratos. (IICA).

La división política del territorio y la conformación de localidades al interior, originan de manera natural una estratificación geográfica de todo el país. (MNV).

En este caso, el tamaño de los estratos en la muestra no guardará proporcionalidad con la población. Por el contrario, se define el tamaño de los estratos proporcionalmente a la desviación estándar de las variables objeto de estudio. Es decir, se toman estratos de mayor tamaño en los estratos con mayor variabilidad interna para representar mejor en el total de la muestra a los grupos poblacionales más difíciles de estudiar. (Ochoa). Estratificación óptima. Siempre la varianza del estimador del muestreo aleatorio simple es mayor que la del muestreo estratificado, excepto cuando la variable de estratificación no está relacionada con la variable en estudio y no se forman estratos. Siempre la varianza del muestreo con afijación proporcional es mayor que la varianza del muestreo con afijación óptima, excepto cuando todos los estratos tienen la misma varianza. (Vivanco). Estratificación óptima. Método que consiste en hallar una estratificación óptima, definida como aquella en la cual la varianza del estimador sea mínima al interior de los grupos (estratos) al tiempo que sea máxima entre los grupos (estratos), es decir, lograr que los estratos sean lo más homogéneos posibles en su interior y los más heterogéneos posibles y diferenciables entre sí. (Mansilla).

Es una parte de la población utilizada para un muestreo estratificado. Una encuesta con 2 estratos equivale en gran parte a llevar a cabo dos encuestas separadas, una por cada estrato. Cada estrato requiere el mismo número de participantes que una encuesta sencilla: en STEPS este número gira entorno a los 2,500 por estrato. (OMS).

El conjunto de elementos encuestados en realidad. Si alguno de los elementos se excluyen de la encuesta (por ejemplo los que viven en zonas remotas) habrá que juzgar si las inferencias sobre el estudio de la población son válidas para la población de referencia. (OMS).

Las evaluaciones son exámenes periódicos y objetivos de un proyecto, programa o política programada, en curso o completada. Las evaluaciones se usan para responder a preguntas específicas, relacionadas con frecuencia con el diseño, la ejecución y los resultados. (Banco Mundial).

Es un concepto relacionado con la probabilidad de selección y se interpreta como la cantidad de unidades en la población que representa una unidad en la muestra, llámese personas, viviendas, áreas económicas o agrícolas, etcétera. El factor de expansión permite inferir conclusiones sobre la población total a partir de la información de la muestra. (SDMV).

En una encuesta, cuando faltan datos o están incompletos. La falta de respuesta a nivel de unidades ocurre cuando no se dispone de información para algunas unidades de la muestra, es decir, cuando la muestra real es diferente de la muestra programada. El desgaste de la muestra es una forma de falta de respuesta a nivel de unidades. La falta de respuesta a nivel de variables se produce cuando los datos de algunas unidades de la muestra están incompletos en algún momento. La falta de respuesta puede provocar sesgo en los resultados de la evaluación si está asociada con el tratamiento. (Banco Mundial).

Una hipótesis es una explicación propuesta de un fenómeno observable. Véase también hipótesis nula e hipótesis alternativa. (Banco Mundial).

En la evaluación de impacto, la hipótesis alternativa es normalmente la hipótesis de que la hipótesis nula es falsa; en otras palabras, que la intervención tiene un impacto sobre los resultados. (Banco Mundial).

Una hipótesis nula es una hipótesis que puede ser falsificada sobre la base de los datos observados. La hipótesis nula propone normalmente una posición general o por defecto. En la evaluación de impacto, la hipótesis nula suele ser que no hay diferencia entre los grupos de tratamiento y de control, o dicho de otro modo, que la intervención no tiene impacto sobre los resultados. (Banco Mundial).

Un indicador es una variable que mide un fenómeno de interés para el evaluador. El fenómeno puede ser un insumo, un producto, un resultado, una característica o un atributo. (Banco Mundial).

Datos conocidos antes o simultáneamente a la realización de la encuesta, que no están basados en la encuesta pero pueden utilizarse para mejorar el diseño de la misma. Estos datos pueden usarse para la estratificación, para decidir las probabilidades de selección, o para estimar los resultados finales con los datos de la muestra. (IICA):

Un intervalo por arriba y debajo del valor estimado que puede esperarse que contenga el valor verdadero con una probabilidad conocida, suponiendo que no exista sesgo. (IICA). Intervalo de confianza. Medida de precisión de los datos de interés. Toda encuesta basada en muestras tiene lagunas de precisión debidas a errores de muestreo o a la ausencia de éstos. Para perfeccionar la estimación puntual, los estadísticos normalmente calculan un intervalo de valores que consideran que está dentro del parámetro. Normalmente la estimación puntual es el punto medio del intervalo, y los puntos finales del intervalo informan del tamaño del error con relación a la estimación, y sobre la "confianza" que podemos tener en que ese parámetro esté dentro del intervalo. (OMS).

Una población en la que las unidades de muestreo han sido numeradas o identificadas de alguna forma, la lista de unidades puede ser la base para la selección de una muestra. (IICA).

Lista de unidades en la población, por ejemplo el censo electoral, el registro de la población o un listín telefónico. Para que la muestra sea representativa de la población, el marco de la muestra tiene que incluir a todas las personas de la población (o sub-población) una, y sólo una vez, y no incluirá a personas que no pertenezcan a esta población. Debe ser actualizada. (OMS).

Es una lista exhaustiva que contiene a todos y cada uno de los elementos que forman parte de la población empleada como base para el muestreo. Así como la infraestructura del marco de muestreo, que sirve de apoyo para su funcionamiento, es un conjunto de materiales y dispositivos que delimitan, identifican y permiten tener acceso a los elementos de la población objetivo. Conjunto de materiales desde los cuales el muestreo puede seleccionar, tal como una lista o conjunto de áreas. (OCDE). Marco de muestreo es el conjunto de todas las unidades de muestreo de donde se selecciona la muestra. El marco puede ser una lista de personas o unidades de vivienda, un archivo de registros, o tarjetas perforadas, un mapa subdividido, etc. (IICA).

División del territorio nacional con fines estadísticos, en áreas a nivel estatal, municipal y básico, cuya delimitación se hace con base en rasgos naturales y de infraestructura, reconocibles y perdurables en el terreno, aunque estos no siempre coinciden con los límites políticos administrativos. Sistema para referenciar la información estadística de los censos y encuestas con los lugares geográficos correspondientes (Conteo 2005).

Es un marco de muestreo construido para seleccionar muestras para múltiples encuestas o para una misma encuesta en múltiples rondas. Contiene a todas las unidades de la población objetivo. (SDMV).

La lista más exhaustiva de unidades de la población de interés (universo) que puede obtenerse. Las diferencias entre el marco muestral y la población de interés generan un sesgo (en el muestreo). Cuando existe un sesgo en la cobertura, los resultados de la muestra no tienen validez externa para la totalidad de la población de interés. (Banco Mundial).

La media aritmética es el promedio de un conjunto de valores, es decir, la suma de todos los valores, dividida entre el número de valores. Debido a su simplicidad y a sus propiedades estadísticas, se utiliza más que otro tipo de medidas (como por ejemplo la mediana). (OMS).

El valor que deja a cada lado (por encima y por debajo) la mitad de los valores de la muestra. (OMS).

Método que consiste en extraer muestras en etapas múltiples basadas en la probabilidad. Este método ahorra costes y evita tener que trabajar con recopilaciones de listas exhaustivas de cada uno de los participantes. (OMS).

Mecanismo o metodología para la obtención de una muestra estadística que asigna a cada elemento una probabilidad conocida, y diferente de cero, de ser seleccionado. En el mecanismo de selección no influye la intuición humana ni el estado de ánimo. (SDMV).

Los métodos de selección aleatoria consisten en el conjunto de métodos que utilizan la asignación aleatoria para identificar el contra factual. Entre ellos están la asignación aleatoria del tratamiento, la oferta aleatoria del tratamiento y la promoción aleatoria. (Banco Mundial).

Subconjunto de unidades seleccionadas de una población, bajo condiciones preestablecidas. Es un subconjunto de un marco donde los elementos están seleccionados basados sobre un proceso de selección al azar con una probabilidad de selección conocida. ONU y OCDE. Muestra. En estadística, una muestra es un subgrupo de una población. Normalmente, la población es muy numerosa, lo que hace impracticable o imposible realizar un censo o una enumeración completa de todas las unidades en la población. En su lugar, los investigadores pueden seleccionar un subgrupo representativo de la población (utilizando un marco muestral) y recopilar estadísticas sobre la muestra; estas estadísticas pueden usarse para hacer inferencias o extrapolarlas a la población. El proceso se denomina muestreo. (Banco Mundial). Muestra es un subconjunto de una población. Aquí se refiere a una muestra de probabilidad en la que cada elemento de la población tiene una probabilidad conocida de selección. (IICA). Muestra. Subconjunto de la población objeto de la encuesta que ha sido seleccionada para ser incluida en la encuesta. (OMS). Muestra aleatoria. La mejor manera de evitar una muestra sesgada o no representativa es seleccionar una muestra aleatoria. Una muestra aleatoria es una muestra probabilística en la que cada unidad de la población muestreada tiene la misma probabilidad de ser seleccionada. (Banco Mundial). Muestra aleatoria. Una muestra de la población o subpoblación en la que cada individuo tiene la misma oportunidad o una posibilidad considerable de ser seleccionado y en la que la oportunidad de un individuo de ser seleccionado no altera ni afecta a la selección de otro individuo. Entre los ejemplos de muestreo aleatorio se incluyen el muestreo aleatorio simple, el muestreo por conglomerados y el muestreo estratificado. (OMS).

Una muestra obtenida extrayendo una muestra aleatoria de conglomerados o clusters, después de lo cual se pueden seleccionar todas las unidades que forman los conglomerados en la muestra, o se puede extraer aleatoriamente una serie de unidades dentro de cada conglomerado seleccionado. Cada conglomerado tiene una probabilidad definida de resultar seleccionado, y las unidades dentro de un conglomerado seleccionado también tienen una probabilidad definida de resultar seleccionadas. (Banco Mundial). Muestra de conglomerados. Un sistema de muestreo donde las unidades de análisis de la población se consideran agrupadas en conglomerados, seleccionándose luego una muestra de conglomerados. Los conglomerados seleccionados son los que determinan las unidades que finalmente formaran la muestra. La muestra puede incluir todas las unidades de los conglomerados seleccionados o una submuestra de unidades en cada conglomerado seleccionado. (IICA).

Un tipo de muestra (por lo general una muestra polietápica) en la que las unidades de muestreo son superficies individuales de terreno (segmentos) que pueden definirse en un mapa. Los segmentos cubren toda la superficie de tierra incluida en la encuesta, los segmentos no se superponen, y los límites de cada segmento deben estar claramente definidos de modo que puedan ser reconocidos e identificados por los entrevistadores en el terreno. Con frecuencia los segmentos son conglomerados de las unidades de análisis, por ejemplo, conglomerado de fincas o de unidades de vivienda. Cada unidad de análisis debe estar asociada a uno y sólo un segmento. (IICA).

Se obtiene dividiendo a la población de interés (marco muestral) en grupos (por ejemplo, hombres y mujeres), y extrayendo a continuación una muestra aleatoria dentro de cada grupo. Una muestra estratificada es una muestra probabilística: cada unidad dentro de cada grupo (o estrato) tiene la misma probabilidad de ser extraída. (Banco Mundial).

Es una muestra obtenida a partir del Marco Maestro de Muestreo de la que pueden seleccionarse submuestras que sirvan para más de una encuesta o ronda de encuestas. Una muestra "maestra" destinada a ser utilizada para múltiples encuestas y/o múltiples rondas de la misma encuesta, por lo general durante un período de tiempo de 10 años. (ONU).

Una muestra seleccionada mediante un método de muestreo probabilístico, es decir, basado en la teoría de la probabilidad (proceso aleatorio), esto es, por medio de un método que incluye el conocimiento de las posibilidades de que alguna unidad sea seleccionada. (SDMV).

(Llamada también muestra al azar sin restricciones). El tipo más simple de muestreo. Dado un tamaño de muestra n, cada una de las posibles combinaciones de n unidades elementales que puede formarse con una población de N unidades y que tiene la misma probabilidad de selección que cualquier otra combinación de n unidades. Además, cada elemento tiene la misma probabilidad de selección que cualquier otro elemento. (IICA).

El proceso de seleccionar un número de casos de todos los casos posibles en un grupo particular o universo Muestreo. El proceso mediante el cual se extraen unidades de un marco muestral producido a partir de la población de interés (universo). Se pueden utilizar varios procedimientos alternativos de muestreo. Los métodos de muestreo probabilístico son los más rigurosos porque asignan una probabilidad bien definida a la selección de cada unidad. Entre los métodos de muestreo probabilístico están el muestreo aleatorio simple, el muestreo aleatorio estratificado y el muestreo por conglomerados o clusters. El muestro no probabilístico (como el muestreo de conveniencia o por juicio) puede generar errores de muestra. (Banco Mundial).

Método de muestreo en el que la población se reparte entre subpoblaciones o estratos homogéneos, en los que el muestreo se lleva a cabo de manera independiente. En STEPS, la mayoría de las zonas eligen la estratificación definida por grupos de edad cada 10 años y por sexos. (OMS).

Método de muestreo basado en la probabilidad en el que cada miembro de la población tiene las mismas posibilidades de ser seleccionado. Las estimaciones sobre la población basadas en este método se consideran imparciales, pero necesitan una lista única completa de todos los miembros. (OMS).

Es una modalidad del muestreo probabilístico y de fuerte aplicación en la actualidad; que puede llevarse a cabo cuando el marco de muestreo contiene información sobre variables "auxiliares" que tienen una buena relación proporcional con la variable de estudio. Las unidades de observación se seleccionan con probabilidades desiguales y, a la vez, proporcionales a cierta variable auxiliar, logrando con esto que el cociente formado por la variable de interés y la auxiliar tenga mucho menor variabilidad que la de las lecturas individuales de la variable en estudio. Selección de los primeros - (segundo -, etc.) de las unidades de la etapa en la que cada uno se elige con probabilidad proporcional a su medida de tamaño; véase también el muestreo con probabilidad proporcional al tamaño estimado (PPT) en el texto. (ONU).

Un sistema en el que se seleccionan conglomerados con probabilidades variables y se submuestrea dentro de los conglomerados seleccionados. La muestra que se obtiene es una muestra autoponderada. (IICA).

Es una modalidad del muestreo probabilístico, flexible y potente, ampliamente usado en la práctica. Se basa en la conformación de subpoblaciones, llamadas estratos, mutuamente excluyentes. Una muestra probabilística es seleccionada en cada estrato de manera independiente. Si el estrato al interior es homogéneo respecto a la variable de interés, este tipo de muestreo es más eficiente. (SDMV). Muestreo estratificado. Técnica de organización del marco muestral en subgrupos que son internamente homogéneos y externamente heterogéneos para asegurar que la selección muestral esta "distribuida" de manera adecuada por los subgrupos importantes de población. (ONU). Muestreo estratificado. El método de muestreo que se aplica cuando el universo ha sido estratificado. Al menos debe seleccionarse una unidad en cada estrato. La probabilidad de selección puede variar de un estrato a otro. (IICA).

Es una muestra que es seleccionada por etapas, las unidades de muestreo en cada etapa son submuestras de unidades más grandes que las contienen y las cuales son elegidas en una etapa previa. Para un muestreo multietápico es necesario contar con un marco para cada etapa. Si el marco de muestreo es construido en el transcurso de la operación de muestreo, el muestreo multietápico tiene la ventaja adicional que para la siguiente etapa solo deben de ser listadas las partes seleccionadas de la población. (SDMV).

El tipo más común de muestreo de conglomerados. En este método se selecciona una muestra de conglomerados y luego, dentro de cada conglomerado seleccionado, se toma una submuestra de unidades. Si la submuestra de unidades constituye la última etapa de selección de la muestra, el diseño se denomina muestra bietápica (aun cuando cada una de esas unidades puede contener más de una unidad de análisis, como ocurre en el muestreo de superficies). Si la submuestra es a su vez un conglomerado de unidades donde se realizará una nueva selección, el diseño es trietápico o cuatrietápico, etc. (IICA).

Método de muestreo en el que la población se divide en conglomerados/ grupos, en el que se selecciona solamente un subconjunto de cada conglomerado en lugar del conglomerado completo. Este método utiliza a menudo las zonas de enumeración como unidad primaria de muestreo. (OMS).

Un método de selección de la muestra en el cual la población está listada en un cierto orden, seleccionándose para la muestra cada k-ésimo elemento. (IICA). Muestreo sistemático. Es la elección de una muestra a partir de los elementos de una lista según un orden determinado k (número al azar mayor que 1) recorriendo la lista a partir de un número aleatorio determinado. Por ejemplo, si k es 15 y el número de la primera unidad es 13, las unidades subsecuentes son 28, 43, 58, etc. Incluso si el tamaño de la muestra se espera antes del final de la lista, habrá que hacer participar a todos los individuos k° de la lista. (OMS).

El término en la fórmula de la variancia de una muestra simple al azar que refleja el efecto de la proporción de la población que integra la muestra. (IICA).

El nivel de significancia se señala habitualmente con el símbolo griego a"""" (alfa). Los niveles más habituales de significancia son del 5% (0,05), 1% (0,01) y 0,1% (0,001). Si una prueba de significancia resulta en un valor p inferior al nivel a"""", se rechaza la hipótesis nula. Dichos resultados se definen informalmente como "estadísticamente significativos". Cuanto menor sea el nivel de significancia, mayor será el nivel de evidencia. La elección del nivel de significancia es una tarea arbitraria, pero en el caso de muchas aplicaciones, se elige un nivel del 5% simplemente porque se trata de un nivel convencional. (Banco Mundial).

Está restringido a los pasos llevados a cabo para la selección de la muestra. (SDMV).

Cualquier conjunto de unidades o elementos claramente definidos para el que se calculan las estimaciones. Los elementos pueden ser personas, fincas, semillas, manzanas, condados, firmas comerciales, etc. En su mayor parte, se refiere al muestreo de poblaciones finitas que contienen un número finito de elementos. (IICA). Población. La población a la que se dirige la encuesta es el grupo de individuos de interés para la encuesta STEPS. Esta población está constituida por individuos que han sido seleccionados debido a que se incluyen dentro de los límites de edad y a veces también por su lugar de residencia en una determinada localidad geográfica. En teoría lo ideal sería que la población objeto de la entrevista fuera la misma que en realidad se incluye, pero en la práctica puede no sea exactamente la misma, por ejemplo puede ser imposible incluir en las muestras a personas que viven al otro lado de la frontera o a los marginados sociales. (OMS).

El conjunto de unidades elegibles para una intervención o un tratamiento. La población de interés se denomina a veces el universo. (Banco Mundial).

Conjunto de la población a quien los resultados de la encuesta deberían representar. Puede ser un país entero o una sola provincia. La muestra se elige entre los miembros de esta población. (OMS).

El inverso de probabilidad de selección; factor de inflación aplicado a los datos brutos; se denomina también ponderación del diseño. (ONU).

Ponderaciones que denotan lo inverso de la probabilidad incluida en la observación debido al diseño del muestreo. (OMS).

Se refiere a la capacidad de obtener un mismo resultado en mediciones diferentes realizadas en las mismas condiciones hechas a partir de una muestra de los datos o de un modelo estadístico. Se mide a partir del criterio de error del que realiza las estimaciones. La precisión aumenta cuando el error disminuye, y se puede mejorar aumentando el número de observaciones. (OMS).

Número entre 0 y 1 que representa la característica de un suceso del que existen razones para creer que se realizará. Cuando el suceso es imposible se dice que su probabilidad es 0 y se dice que es un suceso cierto cuando siempre tiene que ocurrir y su probabilidad es 1. En STEPS los datos de prevalencia se derivan a menudo de las estimaciones de la probabilidad. (OMS).

La probabilidad que tiene cada unidad de ser incluida en la muestra. (IICA).

Un método de selección de una muestra en la que las unidades se seleccionan con probabilidades desiguales de selección, siendo la probabilidad de cada unidad proporcional a una medida de tamaño. La medida del tamaño de una unidad es un número asignado previamente a esa unidad, antes de la selección, que se considera está altamente correlacionado con la estadística que se estima. La expresión probabilidad proporcional al tamaño se abrevia con las letras PPT. (IICA). Probabilidad proporcional al tamaño. Método de selección de una muestra basada en la probabilidad. Las unidades de muestreo tienen una posibilidad de ser seleccionadas en función de su tamaño. Este método se utiliza a menudo en el muestreo de etapas múltiples donde cada unidad primaria de muestreo se selecciona con una PPT. (OMS).

En estadística, el análisis de regresión incluye cualquier técnica para la formulación de modelos y el análisis de diversas variables, cuando se hace referencia a la relación entre una variable dependiente y una o más variables independientes o explicativas. En el caso de la evaluación de impacto, el análisis de regresión estima cómo el valor esperado del indicador del resultado de la intervención (Y; variable dependiente) cambia en función de pertenecer al grupo de tratamiento o de comparación (P; variable independiente), mientras las otras características de los beneficiarios (otras variables independientes) se mantienen fijas. (Banco Mundial).

Medida en la que una muestra tienen la misma distribución de las características de interés que la población objeto de la encuesta a partir de la que fue seleccionado. (OMS).

Muestreo en el que cada individuo de una población tiene una probabilidad notoria de selección. (OMS).

El sesgo de un estimador es la diferencia entre la expectativa del estimador y el valor real del parámetro que se está estimando. (SDMV). El sesgo en la evaluación de impacto, es la diferencia entre el impacto que se calcula y el verdadero impacto del programa. (Banco Mundial). Sesgo. Diferencia entre el valor esperado de un estimador y el valor poblacional verdadero que se trata de estimar. (IICA). Sesgo. Distorsión significativa de los resultados del estudio de la población en comparación con el valor real. Los sesgos pueden surgir por diversos motivos, como un error en la medición o la ausencia de respuesta. (OMS).

Error producido por una ausencia de respuesta. (OMS).

El sesgo de selección se produce cuando las razones por las que cada individuo participa en un programa se correlacionan con los resultados de interés de la intervención. Este sesgo se registra normalmente cuando el grupo de comparación no es elegible o se autoexcluye del tratamiento. (Banco Mundial).

Es una estrategia de producción de información sobre las características demográficas y socioeconómicas de los hogares y las personas, basada en el diseño y ejecución coordinada de un conjunto de encuestas diferentes entre sí en cuanto a sus objetivos y alcances, comparten un cierto marco conceptual y metodológico, complementan sus temas de investigación, sincronizan su realización en el tiempo y optimizan el uso de los recursos humanos y financieros. (CEPAL 1998).

Número de hogares o personas seleccionadas. (ONU). Tamaño de la muestra. Número de personas seleccionadas en la muestra. El tamaño simple se determina por la cantidad probable de variaciones de los parámetros aceptables, por el tamaño de las diferencias que se prevén entre subgrupos o entre dos puntos al mismo tiempo y por la amplitud probable de la ausencia de respuesta. (OMS).

Expresión matemática de una variación relativa en el tiempo. Se puede expresar como un número de sucesos por persona y año, por ejemplo 310 heridos en accidentes por 10,000 personas al año, lo que equivaldría a 310 heridos en accidentes por 1,000 personas cada 10 años, o 310 accidentes por 2,000 personas cada 5 años. (OMS).

Una unidad para la que deseamos obtener datos estadísticos. Las unidades pueden ser personas, familias, fincas o firmas comerciales; pueden ser tarjetas perforadas, productos fabricados mediante un proceso mecánico, etc. (IICA).

Elemento unitario del cual se obtienen mediciones de las variables de interés. Posee probabilidades de selección sobre el conjunto al que pertenece. (SDMV).

Es una de las unidades en las cuales un agregado es dividido con propósitos de muestreo. Cada unidad es considerada como única e indivisible en el proceso de selección (OCDE). Unidad de muestreo. Objeto del muestreo. Partes de la población de quien se han tomado muestras. Estas unidades deben cubrir la población completa y no solaparse. Por ejemplo cada elemento de la población pertenece a una y sólo una unidad. En un muestreo aleatorio simple, las unidades de muestreo son los individuos. En el muestreo por conglomerados, las unidades serán los pueblos u otras localidades. En cuanto al muestreo en etapas múltiples, las unidades difieren en cada nivel del muestreo. (OMS). Unidad de muestreo. Pueden ser iguales o diferentes a las unidades de análisis. Por ejemplo para obtener información acerca de las personas se podría usar un listado completo en un censo o un registro y seleccionar directamente una muestra de personas. Sin embargo, también se podría seleccionar una muestra de familias e incluir en la encuesta todas las personas de las familias seleccionadas. En forma similar, se podrían seleccionar edificios completos e incluir a todas las personas que residen en los edificios que forman parte de la muestra. La elección de la unidad de muestreo más eficiente es una consideración importante dentro del diseño de una encuesta. (IICA).

Son las unidades de muestreo que pertenecen a la primera etapa en un muestreo de dos o más etapas. Unidad administrativa definida geográficamente-seleccionada en la primera etapa de muestreo. (ONU). Unidad primaria de muestreo. Las unidades de muestreo recopiladas en la primera etapa del muestreo (OMS). Unidad primaria de muestreo. Las unidades que constituyen el marco de muestreo para la primera etapa de una muestra multietápica (IICA).

Unidades de muestreo utilizadas para la selección después de las unidades primarias de muestreo. (OMS).

Tener validez externa significa que el impacto causal descubierto en la evaluación de impacto se puede generalizar al universo de todas las unidades elegibles. Para que una evaluación tenga validez externa, es necesario que la muestra de la evaluación sea representativa del universo de unidades elegibles. (Banco Mundial).

El hecho de que una evaluación de impacto tenga validez interna significa que utiliza un grupo de comparación válido, es decir, un grupo de comparación que produce una estimación válida del contra factual. (Banco Mundial).

El valor promedio de las estimaciones muéstrales a través de todas las muestras posibles (IICA).

En la terminología estadística, una variable es una característica de la población de estudio. Toma valores determinados para cada observación y estos pueden variar entre individuos y/o a lo largo del tiempo. (Banco Mundial). Variable. Una variable es una característica (edad, sexo o peso en kilogramos) que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio. Pueden ser nominales o continuas, pero deben estar claramente definidas y registradas de manera sistemática. (OMS).

El cuadrado del error estándar representado por lo general mediante el símbolo S2 con un subíndice para indicar la estadística a la que se refiere. El mismo término se usa también sin subíndice para el cuadrado de la desviación estándar. Cuando existe alguna posibilidad de confusión, se usa la denominación variancia de muestreo para el cuadrado del error estándar y variancia de la población para el cuadrado de la desviación estándar. (IICA).

Cuadrado del coeficiente de variación que se representa generalmente como V2. (IICA).

Es un parámetro que indica qué tan dispersa está la variable aleatoria respecto al centro de la distribución de probabilidad. Es decir, la varianza refleja la dispersión de los valores empíricos alrededor de su promedio. (SDMV). Varianza. Medida de dispersión de un conjunto de valores, definido como el cuadrado de la desviación estándar. Los conceptos de varianza y de desviación estándar se utilizan en estadística. Incluso si no es fácil dar una definición precisa de varianza, es importante porque se utiliza a menudo en las fórmulas utilizadas para estimar las variaciones de las características de la población. (OMS).