Serie de variaciones. valores promedio. Desviación Estándar. error promedio de la media aritmética. Series de variación, sus elementos.

Se presentan en forma de series de distribución y se presentan en forma.

Una serie de distribución es uno de los tipos de agrupaciones.

Rango de distribución— representa una distribución ordenada de unidades de la población que se estudian en grupos según una determinada característica variable.

Dependiendo de la característica que subyace a la formación de la serie de distribución, se distinguen atributivo y variacional filas de distribución:

  • Atributivo- se denominan series de distribución construidas según características cualitativas.
  • Las series de distribución construidas en orden ascendente o descendente de valores de una característica cuantitativa se denominan variacional.
Serie de variación La distribución consta de dos columnas:

La primera columna proporciona valores cuantitativos de la característica variable, que se denominan opciones y son designados. Opción discreta: expresada como un número entero. La opción de intervalo varía desde y hasta. Dependiendo del tipo de opciones, puede construir una serie de variación discreta o de intervalo.
La segunda columna contiene número de opción específica, expresado en términos de frecuencias o frecuencias:

Frecuencias- estos son números absolutos que muestran cuántas veces un valor dado de una característica ocurre en conjunto, que denotan . La suma de todas las frecuencias debe ser igual al número de unidades de toda la población.

Frecuencias() son frecuencias expresadas como porcentaje del total. La suma de todas las frecuencias expresadas como porcentaje debe ser igual al 100% en fracciones de uno.

Representación gráfica de series de distribución.

Las series de distribución se presentan visualmente mediante imágenes gráficas.

Las series de distribución se representan como:
  • Polígono
  • Histogramas
  • Acumula
  • ojivas

Polígono

Al construir un polígono, los valores de la característica variable se trazan en el eje horizontal (eje x) y las frecuencias o frecuencias se trazan en el eje vertical (eje y).

El polígono de la Fig. 6.1 se basa en datos del microcenso de la población de Rusia en 1994.

6.1. Distribución del tamaño del hogar

Condición: Se proporcionan datos sobre la distribución de 25 empleados de una de las empresas según categorías arancelarias:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Tarea: Construya una serie de variación discreta y representela gráficamente como un polígono de distribución.
Solución:
EN en este ejemplo opciones es la categoría arancelaria del empleado. Para determinar las frecuencias es necesario calcular el número de empleados con la categoría arancelaria correspondiente.

El polígono se utiliza para series de variación discreta.

Para construir un polígono de distribución (Figura 1), trazamos los valores cuantitativos de las características variables (variantes) a lo largo del eje de abscisas (X) y las frecuencias o frecuencias a lo largo del eje de ordenadas.

Si los valores de una característica se expresan en forma de intervalos, entonces dicha serie se llama intervalo.
Serie de intervalos Las distribuciones se representan gráficamente en forma de histograma, acumulado u ojiva.

tabla estadistica

Condición: Se dan datos sobre el tamaño de los depósitos 20 individuos en un banco (mil rublos) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Tarea: Construya una serie de variación de intervalos con intervalos iguales.
Solución:

  1. La población inicial consta de 20 unidades (N = 20).
  2. Usando la fórmula de Sturgess, determinamos cantidad requerida grupos utilizados: n=1+3.322*lg20=5
  3. Calculemos el valor del intervalo igual: i=(152 - 2) /5 = 30 mil rublos
  4. Dividamos la población inicial en 5 grupos con un intervalo de 30 mil rublos.
  5. Presentamos los resultados de la agrupación en la tabla:

Con tal registro de una característica continua, cuando el mismo valor ocurre dos veces (como el límite superior de un intervalo y el límite inferior de otro intervalo), entonces este valor pertenece al grupo donde este valor actúa como el límite superior.

gráfico de barras

Para construir un histograma, los valores de los límites de los intervalos se indican en el eje de abscisas y, en base a ellos, se construyen rectángulos, cuya altura es proporcional a las frecuencias (o frecuencias).

En la Fig. 6.2. muestra un histograma de la distribución de la población rusa en 1997 por grupo de edad.

Arroz. 6.2. Distribución de la población rusa por grupos de edad.

Condición: Se da la distribución de 30 empleados de la empresa por salario mensual

Tarea: Muestra gráficamente la serie de variación del intervalo en forma de histograma y acumula.
Solución:

  1. El límite desconocido del (primer) intervalo abierto está determinado por el valor del segundo intervalo: 7000 - 5000 = 2000 rublos. Con el mismo valor encontramos el límite inferior del primer intervalo: 5000 - 2000 = 3000 rublos.
  2. Para construir un histograma en un sistema de coordenadas rectangular, trazamos a lo largo del eje de abscisas los segmentos cuyos valores corresponden a los intervalos de la serie varicosa.
    Estos segmentos sirven como base inferior y la frecuencia correspondiente (frecuencia) sirve como altura de los rectángulos formados.
  3. Construyamos un histograma:

Para construir acumulados, es necesario calcular las frecuencias acumuladas (frecuencias). Se determinan sumando secuencialmente las frecuencias (frecuencias) de intervalos anteriores y se denominan S. Las frecuencias acumuladas muestran cuántas unidades de la población tienen un valor característico no mayor que el considerado.

Acumula

La distribución de una característica en una serie de variación sobre frecuencias acumuladas (frecuencias) se representa mediante un acumulado.

Acumula o una curva acumulativa, a diferencia de un polígono, se construye a partir de frecuencias o frecuencias acumuladas. En este caso, los valores de la característica se colocan en el eje de abscisas y las frecuencias o frecuencias acumuladas en el eje de ordenadas (Fig. 6.3).

Arroz. 6.3. Acumulados de distribución del tamaño de los hogares

4. Calculemos las frecuencias acumuladas:
La frecuencia acumulada del primer intervalo se calcula de la siguiente manera: 0 + 4 = 4, para el segundo: 4 + 12 = 16; para el tercero: 4 + 12 + 8 = 24, etc.

Al construir un acumulado, la frecuencia acumulada (frecuencia) del intervalo correspondiente se asigna a su límite superior:

Ogiva

Ogiva se construye de manera similar a un acumulado con la única diferencia de que las frecuencias acumuladas se colocan en el eje de abscisas y los valores característicos se colocan en el eje de ordenadas.

Un tipo de acumulación es una curva de concentración o diagrama de Lorentz. Para construir una curva de concentración, se traza una escala en porcentajes de 0 a 100 en ambos ejes del sistema de coordenadas rectangulares. Al mismo tiempo, en el eje de abscisas se indican las frecuencias acumuladas y los valores acumulados de la participación. (en porcentaje) en volumen de la característica se indican en el eje de ordenadas.

La distribución uniforme de la característica corresponde a la diagonal del cuadrado en el gráfico (Fig. 6.4). Con una distribución desigual, el gráfico representa una curva cóncava dependiendo del nivel de concentración del rasgo.

6.4. Curva de concentración
Nombre del parámetro Significado
Tema del artículo: Serie de variación
Rúbrica (categoría temática) Producción

Valores observados de una variable aleatoria. X 1 , X 2 , …, x k son llamados opciones.

Frecuencia opciones X normalmente me llaman el número n yo (i=1,…,k), mostrando cuántas veces ocurre esta opción en la muestra.

Frecuencia Opciones (frecuencia relativa, fracción) xyo (i=1,…,k) generalmente se llama relación de su frecuencia n yo al tamaño de la muestra norte.

Las frecuencias y las frecuencias se llaman escamas.

Frecuencia acumulada Se acostumbra llamar al número de opciones cuyos valores son menores que uno determinado. X:

Frecuencia acumulada Se acostumbra llamar a la relación entre la frecuencia acumulada y el volumen de muestra:

Serie de variación (serie estadística): se acostumbra llamar a una secuencia de opciones escritas en orden ascendente y sus correspondientes pesos.

La serie de variación debe ser discreto(muestreo de valores de una variable aleatoria discreta) y continuo (intervalo)(muestra de valores de una variable aleatoria continua).

La serie de variación discreta tiene la forma:

Cuando el número de opciones es grande o la función es continua ( valor aleatorio puede tomar cualquier valor en un intervalo determinado), son intervalo serie de variaciones.

Para construir una serie de variación de intervalo, realice agrupamiento opción: se dividen en intervalos separados:

El número de intervalos a veces se determina usando Fórmulas de Sturges:

Luego se cuenta el número de opciones que caen en cada intervalo: frecuencias n yo(o frecuencia n yo/norte). Si la opción está en el límite del intervalo, entonces se adjunta al intervalo correcto.

La serie de variación de intervalo tiene la forma:

Opciones
Frecuencias

Función de distribución empírica (estadística) se acostumbra llamar a una función cuyo valor en un punto X es igual a la frecuencia relativa de la variante que toma un valor menor que X(frecuencia acumulada para X):

Polígono de frecuencia Se llama línea discontinua cuyos segmentos conectan puntos con coordenadas ( X 1 ; norte 1), (X 2 ; norte 2), …, (x k; nk). Está construido de manera similar. Polígono de frecuencia, que es un análogo estadístico de un polígono de distribución.

Vale decir que para una serie de variación continua se puede construir un polígono si los valores X 1 , X 2 , …, x k tomar los puntos medios de los intervalos.

Una serie de variación de intervalo generalmente se representa gráficamente usando histogramas.

gráfico de barras– una figura escalonada que consta de rectángulos cuyas bases son intervalos parciales de longitud h= xyo +1 – xyo, i= 0,…,k-1, y las alturas son iguales a las frecuencias (o frecuencias) de los intervalos n yo (yo).

Acumula(curva acumulativa) – una curva de frecuencias acumuladas (frecuencias). Para serie discreta El acumulado representa una línea discontinua que conecta los puntos o , . Para serie de intervalos El acumulado comienza desde un punto cuya abscisa es igual al comienzo del primer intervalo, y la ordenada es igual a la frecuencia acumulada (frecuencia) igual a cero. Otros puntos de esta línea discontinua corresponden a los extremos de los intervalos.

Serie de variaciones: concepto y tipos. Clasificación y características de la categoría "Serie Variación" 2017, 2018.

  • - Series de distribución variacional

    Distribución del volumen de negocios minorista Federación Rusa en 1995 por tipo de propiedad, millones de rublos. Tipos de series de distribución Tema VIII. Series de distribución Como resultado del procesamiento y sistematización de datos estadísticos primarios, obtenemos... .


  • - Serie de variación

    La transformación más sencilla de datos estadísticos es ordenarlos por tamaño. Una muestra de volumen de la población general, ordenada en orden no decreciente de elementos, es decir , se llama serie de variación: . En el caso de que el volumen de observaciones... .


  • - Tarea 2. Serie de variación de intervalos

    1. Con base en la muestra dada correspondiente a la variante de la tarea, construya una serie de variación de intervalo; cree un histograma y acumule (use dos métodos: insertar un gráfico de Excel y el modo "Histograma" del paquete "Análisis de datos"). 2. Analice el histograma resultante. ... .


  • - Compilar una serie de variaciones de la variabilidad de un rasgo en semillas u hojas de frijol de una planta de la misma edad. Identificar patrones de variabilidad de rasgos.

    Una población es una unidad estructural de una especie. Tamaño de la poblacion. Razones de las fluctuaciones demográficas. Relaciones entre individuos en poblaciones y entre diferentes poblaciones de la misma y diferentes especies. 1. Una característica importante de la especie es su asentamiento en grupos, poblaciones en...

    1. Todos los valores del inmueble en estudio que se presentan en la población en estudio se denominan valor del atributo (opción, opción), y un cambio en este valor variando. Las opciones se indican en letras minúsculas del alfabeto latino con índices correspondientes al número de serie del grupo. X i .

      Un número que muestra cuántas veces ocurre cada valor característico en la población que se está estudiando. frecuencia y denota f i . La suma de todas las frecuencias de la serie es igual al volumen de la población en estudio.

      Muy a menudo necesitas contar. frecuencia acumulada (S). La frecuencia acumulada para cada valor característico muestra cuántas unidades de la población tienen un valor característico no mayor que este valor. La frecuencia acumulada se calcula sumando secuencialmente los siguientes valores de atributos a la frecuencia del primer valor del signo de frecuencia:

    La frecuencia acumulada comienza a calcularse desde el primer valor del atributo.

    La suma de las frecuencias es siempre igual a uno o 100%. Reemplazar frecuencias con frecuencias permite comparar series de variación con diferentes números de observaciones.

    Las frecuencias de la serie (f i) en algunos casos pueden ser reemplazadas por las frecuencias (ω i).

    Si la serie de variación se da a intervalos desiguales, entonces para tener una idea correcta de la naturaleza de la distribución es necesario calcular la densidad absoluta o relativa de la distribución.

      Densidad de distribución absoluta (p F ) representa el valor de frecuencia por unidad de tamaño del intervalo de un grupo separado de la serie:

    R F = F/ i.

      Densidad de distribución relativa (p ω ) representa el valor de frecuencia por unidad de tamaño del intervalo de un grupo separado de la serie:

    R ω = ω / i.

    Para series con intervalos desiguales, solo estas características dan una idea más correcta de la naturaleza de la distribución que la frecuencia y la frecuencia.

      Distribución estadística de la muestra nombrar una lista de opciones (valores de signos) y sus correspondientes frecuencias o densidades de distribución, frecuencias relativas o densidades relativas distribuciones.

    Las diferentes series de distribución se caracterizan por un conjunto diferente de características de frecuencia:

    mínimo – serie de atributos (frecuencia, frecuencia),

    para los discretos se utilizan cuatro características (frecuencia, frecuencia, frecuencia acumulada, frecuencia acumulada),

    para los de intervalo, los cinco (frecuencia, frecuencia, frecuencia acumulada, frecuencia acumulada, densidades de distribución absolutas y relativas).

    1. Reglas para construir una serie de variación de intervalo.

    1. Representación gráfica de series de variación.

    La primera etapa en el estudio de una serie de variaciones es construir su imagen gráfica. Una representación gráfica de las series de variación facilita su análisis y permite juzgar la forma de la distribución. Para imagen grafica Se construyen series de variación en estadística, un histograma, un polígono y una distribución acumulada.

    Una serie de variaciones discretas se representa como el llamado polígono de frecuencias.

    Para mostrar una serie de intervalos, se utilizan un polígono de distribución de frecuencias y un histograma de frecuencias.

    Los gráficos se construyen en un sistema de coordenadas rectangular.

    Filas construidas sobre una base cuantitativa, son llamados variacional.

    La serie de distribución consta de opciones(valores característicos) y frecuencias(número de grupos). Las frecuencias expresadas como valores relativos (fracciones, porcentajes) se denominan frecuencias. La suma de todas las frecuencias se llama volumen de la serie de distribución.

    Por tipos, las series de distribución se dividen en discreto(construido en base a valores discontinuos de la característica) y intervalo(basado en valores continuos de la característica).

    Serie de variación representa dos columnas (o filas); uno de los cuales proporciona valores individuales de una característica variable, llamados variantes y denotados por X; y en el otro, números absolutos que muestran cuántas veces (con qué frecuencia) aparece cada opción. Los indicadores de la segunda columna se denominan frecuencias y convencionalmente se denotan por f. Observemos una vez más que en la segunda columna se pueden utilizar indicadores relativos, que caracterizan la proporción de la frecuencia de las opciones individuales en la suma total de frecuencias. Estos indicadores relativos se denominan frecuencias y se denotan convencionalmente por ω. La suma de todas las frecuencias en este caso es igual a uno. Sin embargo, las frecuencias también se pueden expresar como porcentajes, y luego la suma de todas las frecuencias da 100%.

    Si las variantes de una serie de variaciones se expresan en forma de cantidades discretas, entonces dicha serie de variaciones se llama discreto.

    Para características continuas, las series de variación se construyen como intervalo, es decir, los valores del atributo en ellos se expresan “de... a...”. En este caso, los valores mínimos de la característica en dicho intervalo se denominan límite inferior del intervalo y máximo, límite superior.

    Las series de variación de intervalos también se construyen para características discretas que varían en un rango amplio. Las series de intervalos pueden ser con igual Y desigual a intervalos.

    Consideremos cómo se determina el valor de intervalos iguales. Introduzcamos la siguiente notación:

    i– tamaño del intervalo;

    - el valor máximo de la característica para unidades de población;

    – el valor mínimo de la característica para unidades de población;

    norte – número de grupos asignados.

    , si n es conocido.

    Si es difícil determinar de antemano el número de grupos a distinguir, entonces para calcular el valor óptimo del intervalo con un tamaño de población suficiente, se puede recomendar la fórmula propuesta por Sturgess en 1926:

    n = 1+ 3,322 log N, donde N es el número de unidades en el agregado.

    El tamaño de los intervalos desiguales se determina en cada caso individual, teniendo en cuenta las características del objeto de estudio.

    Distribución estadística de la muestra llame a una lista de opciones y sus frecuencias correspondientes (o frecuencias relativas).

    La distribución estadística de la muestra se puede especificar en forma de tabla, en la primera columna de la cual se ubican las opciones y en la segunda, las frecuencias correspondientes a estas opciones. ni, o frecuencias relativas Pi .

    Distribución estadística de la muestra.

    Las series de intervalos son series de variación en las que los valores de las características subyacentes a su formación se expresan dentro de ciertos límites (intervalos). Las frecuencias en este caso no se refieren a valores individuales del atributo, sino a todo el intervalo.

    Las series de distribución de intervalos se construyen sobre la base de características cuantitativas continuas, así como de características discretas que varían dentro de límites significativos.

    Una serie de intervalos se puede representar mediante la distribución estadística de una muestra indicando los intervalos y sus frecuencias correspondientes. En este caso, la suma de las frecuencias de las variantes que caen dentro de este intervalo se toma como frecuencia del intervalo.

    Al agrupar por características continuas cuantitativas, es importante determinar el tamaño del intervalo.

    Además de la media muestral y la varianza muestral, también se utilizan otras características de la serie de variación.

    Moda Se llama la variante que tiene mayor frecuencia.

    El método de agrupación también le permite medir variación(variabilidad, fluctuación) de signos. Cuando el número de unidades en una población es relativamente pequeño, la variación se mide con base en el número clasificado de unidades que componen la población. la serie se llama clasificado, si las unidades están dispuestas en orden ascendente (descendente) de la característica.

    Sin embargo, las series clasificadas son bastante indicativas cuando es necesario. Características comparativas variaciones. Además, en muchos casos tenemos que tratar con poblaciones estadísticas que consisten en gran número unidades que son prácticamente difíciles de representar en forma de una serie específica. En este sentido, para un conocimiento general inicial de los datos estadísticos y especialmente para facilitar el estudio de la variación de las características, los fenómenos y procesos en estudio generalmente se combinan en grupos, y los resultados de la agrupación se presentan en forma de tablas de grupo.

    Si una tabla de grupos tiene solo dos columnas: grupos según una característica seleccionada (opciones) y el número de grupos (frecuencia o frecuencia), se llama distribución cercana.

    Rango de distribución - el tipo más simple de agrupación estructural basado en una característica, mostrado en una tabla de grupo con dos columnas que contienen variantes y frecuencias de la característica. En muchos casos, con tal agrupación estructural, es decir, Con la recopilación de series de distribución se inicia el estudio del material estadístico inicial.

    Una agrupación estructural en forma de serie de distribución puede convertirse en una auténtica agrupación estructural si los grupos seleccionados se caracterizan no sólo por las frecuencias, sino también por otros indicadores estadísticos. El objetivo principal de las series de distribución es estudiar la variación de las características. La teoría de las series de distribución se desarrolla en detalle mediante la estadística matemática.

    Las series de distribución se dividen en atributivo(agrupar según características atributivas, por ejemplo, dividir la población por género, nacionalidad, estado civil, etc.) y variacional(agrupación por características cuantitativas).

    Serie de variación Es una tabla de grupos que contiene dos columnas: agrupación de unidades según una característica cuantitativa y el número de unidades en cada grupo. Los intervalos de una serie de variación suelen ser iguales y cerrados. La serie de variación es la siguiente agrupación de la población rusa según el promedio per cápita ingresos en efectivo(Tabla 3.10).

    Tabla 3.10

    Distribución de la población de Rusia por renta media per cápita en 2004-2009.

    Grupos de población por ingreso monetario promedio per cápita, rublos/mes

    Población del grupo, % del total

    8 000,1-10 000,0

    10 000,1-15 000,0

    15 000,1-25 000,0

    Más de 25.000,0

    Toda la población

    Las series de variación, a su vez, se dividen en discretas y de intervalo. Discreto Las series de variación combinan variantes de características discretas que varían dentro de límites estrechos. Un ejemplo de serie de variación discreta es la distribución de las familias rusas según el número de hijos que tienen.

    Intervalo Las series de variación combinan variantes de características continuas o características discretas que varían en un amplio rango. El intervalo es la serie de variación de la distribución de la población rusa según el ingreso monetario promedio per cápita.

    Las series de variación discreta no se utilizan con mucha frecuencia en la práctica. Mientras tanto, compilarlos no es difícil, ya que la composición de los grupos está determinada por las variantes específicas que realmente poseen las características de agrupación estudiadas.

    Las series de variación de intervalos están más extendidas. Al compilarlos surge una pregunta difícil sobre el número de grupos, así como el tamaño de los intervalos que deben establecerse.

    Los principios para resolver este problema se establecen en el capítulo sobre la metodología para la construcción de agrupaciones estadísticas (ver párrafo 3.3).

    Las series de variación son un medio para colapsar o comprimir información diversa en una forma compacta; a partir de ellas se puede hacer un juicio bastante claro sobre la naturaleza de la variación y estudiar las diferencias en las características de los fenómenos incluidos en el conjunto en estudio. Pero el significado más importante de las series de variación es que a partir de ellas se calculan las características generales generalizadoras especiales de la variación (ver Capítulo 7).