Group Statistics
La etapa Group Statistics (Estadística de grupos) permite realizar operaciones estadísticas en múltiples filas de datos divididas en grupos que desee analizar. Si no se definen grupos, se considerará que todas las filas pertenecen a un mismo grupo.
Los grupos se definen según uno o más campos que contengan el mismo valor a lo largo de múltiples filas de datos.
Por ejemplo, los datos en esta tabla podrían agruparse por región, estado o ambos.
Región | Estado |
---|---|
Este | MD |
Este | MD |
Este | CT |
Oeste | CA |
Oeste | CA |
Si se agrupa por Región, el resultado de la operación sería Este y Oeste. Si se agrupa por Estado, el resultado sería California, Connecticut y Maryland. Si se agrupa por Región y Estado, el resultado sería Este/Maryland, Este/Connecticut y Oeste/California.
Input
La etapa Group Statistics toma cualquier campo como entrada. El agrupamiento puede realizarse en datos numéricos o en datos de tipo string.
Opciones
Opción | Descripción |
---|---|
Campos de entrada |
Ofrece una lista de los campos del flujo de datos que puede utilizar para agrupar registros y realizar cálculos. |
Fila |
Especifica el campo o los campos que desea utilizar como categorías en sus cálculos. Por ejemplo, si tuviera datos que incluyeran un campo Región y deseara calcular la población total por región, podría agrupar por dicho campo. Para agregar un campo, selecciónelo en la lista Campos de entrada y luego haga clic en >>. |
Columna |
Opcional. A fin de crear una tabla dinámica, especifica el campo o los campos cuyos valores desea organizar en columnas para realizar una tabulación cruzada. Para agregar un campo, selecciónelo en la lista Campos de entrada y luego haga clic en >>. Por ejemplo, si tuviera datos que incluyeran regiones y fechas de envío, y deseara calcular el número de envíos por día en cada estado, debe especificar el campo Estado como fila y el campo Fecha de envío como columna. |
Las filas y columnas están preorganizadas en el orden configurado |
Indica que los datos de entrada ya se ordenaron. Si la casilla de verificación está marcada, la etapa no ordena los datos y realiza la operación específica directamente en los datos de entrada. |
Operación |
Especifica el cálculo que se realizará en cada grupo. Para agregar una operación, seleccione el campo en la lista Campos de entrada que desee utilizar para la operación y haga clic en >>. Para obtener más información acerca de las operaciones de Group Statistics, consulte Operaciones. |
Tipo |
Para los campos de entrada o salida, especifica el tipo de datos.
Nota: Cuando utiliza los tipos integer y long, pueden perderse datos si el número de entrada o el número calculado proveniente de una operación contiene datos decimales.
|
Obtenga el recuento de los registros que estén calculados | Devuelve la cantidad de registros real de un grupo en el cual se realiza la operación seleccionada. El recuento de cálculo de esta columna excluye los registros de entrada cuando la columna en la que se realiza la operación contiene valores |
Ficha Campos
La ficha Campos se utiliza cuando se crea una tabla dinámica. Para obtener más información, consulte Creación de una tabla dinámica.Ficha Salida
Opción | Descripción |
---|---|
Generar una fila por grupo |
Para cada grupo de filas, se devuelve una sola fila que contiene los datos agregados de todas las filas del grupo. Se descartarán las filas individuales. Si no se selecciona esta opción, se devolverán todas las filas. No se descartarán datos. Esta opción no está disponible si utiliza las operaciones Rango de percentil o ZScore. |
Arrojar un recuento de filas en cada grupo |
Devuelve el número de filas en cada grupo. El nombre predeterminado del campo de salida que contendrá el recuento es GroupCount. |
Generar una ID única para cada grupo |
Genera una ID única para cada grupo de filas. La ID empieza en 1 y aumenta de a 1 por cada grupo adicional encontrado. El nombre de campo predeterminado es GroupID. |