Group Statistics

La etapa Group Statistics (Estadística de grupos) permite realizar operaciones estadísticas en múltiples filas de datos divididas en grupos que desee analizar. Si no se definen grupos, se considerará que todas las filas pertenecen a un mismo grupo.

Los grupos se definen según uno o más campos que contengan el mismo valor a lo largo de múltiples filas de datos.

Por ejemplo, los datos en esta tabla podrían agruparse por región, estado o ambos.

Región Estado
Este MD
Este MD
Este CT
Oeste CA
Oeste CA

Si se agrupa por Región, el resultado de la operación sería Este y Oeste. Si se agrupa por Estado, el resultado sería California, Connecticut y Maryland. Si se agrupa por Región y Estado, el resultado sería Este/Maryland, Este/Connecticut y Oeste/California.

Input

La etapa Group Statistics toma cualquier campo como entrada. El agrupamiento puede realizarse en datos numéricos o en datos de tipo string.

Opciones

Tabla 1. Ficha Operaciones
Opción Descripción

Campos de entrada

Ofrece una lista de los campos del flujo de datos que puede utilizar para agrupar registros y realizar cálculos.

Fila

Especifica el campo o los campos que desea utilizar como categorías en sus cálculos. Por ejemplo, si tuviera datos que incluyeran un campo Región y deseara calcular la población total por región, podría agrupar por dicho campo.

Para agregar un campo, selecciónelo en la lista Campos de entrada y luego haga clic en >>.

Columna

Opcional. A fin de crear una tabla dinámica, especifica el campo o los campos cuyos valores desea organizar en columnas para realizar una tabulación cruzada.

Para agregar un campo, selecciónelo en la lista Campos de entrada y luego haga clic en >>.

Por ejemplo, si tuviera datos que incluyeran regiones y fechas de envío, y deseara calcular el número de envíos por día en cada estado, debe especificar el campo Estado como fila y el campo Fecha de envío como columna.

Las filas y columnas están preorganizadas en el orden configurado

Indica que los datos de entrada ya se ordenaron.

Si la casilla de verificación está marcada, la etapa no ordena los datos y realiza la operación específica directamente en los datos de entrada.

Operación

Especifica el cálculo que se realizará en cada grupo. Para agregar una operación, seleccione el campo en la lista Campos de entrada que desee utilizar para la operación y haga clic en >>.

Para obtener más información acerca de las operaciones de Group Statistics, consulte Operaciones.

Tipo

Para los campos de entrada o salida, especifica el tipo de datos.

Integer
Tipo de dato numérico que contiene números enteros tanto negativos como positivos entre -231 (-2,147,483,648) y 231-1 (2,147,483,647)
Long Entero largo
Tipo de dato numérico que contiene números enteros tanto negativos como positivos entre -263 (-9,223,372,036,854,775,808) y 263-1 (9,223,372,036,854,775,807)
Float
Tipo de dato numérico que contiene números de precisión simple tanto negativos como positivos entre 2-149 (1.4E-45) y (2-223)×2127 (3.4028235E38)
Doble
Tipo de dato numérico que contiene números de precisión doble tanto negativos como positivos entre 2-1074 (4.9E-324) and (2-2-52)×21023 (1.7976931348623157E308)
Nota: Cuando utiliza los tipos integer y long, pueden perderse datos si el número de entrada o el número calculado proveniente de una operación contiene datos decimales.
Obtenga el recuento de los registros que estén calculados Devuelve la cantidad de registros real de un grupo en el cual se realiza la operación seleccionada.

El recuento de cálculo de esta columna excluye los registros de entrada cuando la columna en la que se realiza la operación contiene valores null.

Ficha Campos

La ficha Campos se utiliza cuando se crea una tabla dinámica. Para obtener más información, consulte Creación de una tabla dinámica.

Ficha Salida

Opción Descripción

Generar una fila por grupo

Para cada grupo de filas, se devuelve una sola fila que contiene los datos agregados de todas las filas del grupo. Se descartarán las filas individuales. Si no se selecciona esta opción, se devolverán todas las filas. No se descartarán datos.

Esta opción no está disponible si utiliza las operaciones Rango de percentil o ZScore.

Arrojar un recuento de filas en cada grupo

Devuelve el número de filas en cada grupo. El nombre predeterminado del campo de salida que contendrá el recuento es GroupCount.

Generar una ID única para cada grupo

Genera una ID única para cada grupo de filas. La ID empieza en 1 y aumenta de a 1 por cada grupo adicional encontrado. El nombre de campo predeterminado es GroupID.