03
May

Visualización de datos: Tipos de gráficos

Hay tres tipos de gráficos que verás muy seguido: gráficos de barra, gráficos de línea y gráficos de dispersión. Veamos cómo interpretarlos correctamente para que obtengas grandes conocimientos de ellos.

Gráfico de Barras

Un gráfico de barras se compone de una fila de rectángulos puestos uno al lado del otro. Los rectángulos tendrán generalmente de distintas longitudes. En un eje estarán las categorías y en el otro estará el valor que está siendo medido.

Los gráficos de barras son útiles para mostrar como diferentes categorías de artículos se comparan en una medida común, como por ejemplo las ventas de alcohol de 2017 según el tipo de bebida. Tienes una categoría para cerveza, vino y licor en el eje horizontal, o eje-x. La altura de la barra corresponde a la cantidad de ventas en el eje vertical, o eje-y.

Para encontrar el valor de una barra en un gráfico de barras mira una barra y dibuja una línea imaginaria desde el tope de la misma hasta el eje vertical (puedes dibujar una línea con lápiz si te ayuda). Este será el valor correspondiente a esa categoría.

Si miras la columna de Cerveza, cruza al eje vertical en 10, por lo que sabemos que el valor de esta barra es de $10 millones.

Ahora veamos la columna de Vino. Mira el tope de la barra y dibuja una línea imaginaria desde su punta hasta el eje vertical. Parece que la línea cruza el eje vertical en el medio de los valores 14 y 16, por lo que podemos concluir que el valor correspondiente a las ventas del producto B es de $15 millones.

Con esta información tú puedes sacar conclusiones como “el vino fue nuestro producto mejor vendido el año pasado”. Ahora que sabemos eso podemos preguntarnos “¿por qué fue así?”. Una pregunta como esta puede ser el punto de inicio de un análisis más profundo sobre las causas de por qué un producto se ha vendido tanto.

 

 

Gráfico de Líneas

Los gráficos de línea son los gráficos que muestran una o más líneas cruzando un gráfico.

Los gráficos de línea son buenos para representar cómo una variable cambia en relación a otra variable continua. Esa variable continua es generalmente un período de tiempo.

Un gran ejemplo de un gráfico de línea es un gráfico que representa la tasa de desempleo de un país, el porcentaje de gente que quiere trabajar, pero no puede conseguir ningún puesto. Aquí está la tasa de desempleo de Estados Unidos desde el 2008 hasta el 2011:

Link to chart code: https://github.com/SmartPoll/explainingdata/blob/master/United%20States%20Unemployment%20Rate%20Line%20Chart.Rmd

Para averiguar el valor de un punto en particular, busca en el eje-x la fecha que deseas examinar, y luego desplázate hacia arriba hasta que cruces la línea. Luego desplázate hacia la izquierda hasta que llegues al eje-y. Ese es el valor. Entonces, en el 1ro de enero de 2011 la tasa de desempleo era un poco más que 9%.

Es útil medir valores individuales en un gráfico de línea, pero lo increíble de un gráfico es la historia que cuentan sobre los datos. En este caso, esa historia es el cambio en la tasa de desempleo. El drama, mes a mes, de la crisis económica desplegándose se muestra aquí mismo. ¿Qué ves que sucede con la tasa de desempleo que muestra el gráfico?

 

 

Gráfico de Dispersión

Un gráfico de dispersión es el diagrama que parece como un montón de puntos. Un gráfico de dispersión muestra la relación entre dos variables.

El ejemplo que se muestra debajo muestra los caballos de fuerza (qué tan poderoso es el motor de un automóvil) y las millas por galón (qué tan lejos el automóvil puede ir utilizando un galón de gasolina) para treinta y dos automóviles.

Link to chart code: https://github.com/SmartPoll/explainingdata/blob/master/mtcars%20Scatterplot.Rmd

El proceso para identificar los valores de un punto en particular es el siguiente: desde un punto cualquiera dibuja dos líneas, una que se extiende hacia el eje horizontal y otra que se extiende hacia el eje vertical. Estos son los valores respectivos de x e y para ese punto específico.

Mirando el punto más a la derecha en el gráfico, podemos que ver que el automóvil tiene aproximadamente 335 caballos de fuerza y recorre 15 millas por galón.

Los gráficos de dispersión son generalmente utilizados para describir la relación entre dos variables. En otras palabras, cuando X se correlaciona (tiene un efecto sobre) con Y. Si, cuando examinas todos los puntos de izquierda a derecha, observas que los estos se elevan en el gráfico mientras más te mueves hacia la derecha, existe una correlación positiva. En tanto X incrementa, también lo hace Y. Un ejemplo de dos variables con una correlación positiva son los ingresos y la expectativa de vida. La gente rica tiende a vivir más que la gente pobre.

Si observas que los puntos descienden en el gráfico mientras más te mueves hacia la derecha, existe una correlación negativa. Podemos ver que los automóviles con más caballos de fuerza tienen menos millas por galón.

Si no hay un patrón para los puntos, no existe correlación entre las variables.

 

 

Gráfico de Torta

Tomémonos un momento para hablar de los gráficos de torta.

Los gráficos de torta muestran las partes de un todo (por ejemplo, las categorías del presupuesto de tu compañía). El tamaño de la porción de la torta representa la proporción que la medida de una categoría hace a un todo (por ejemplo, el presupuesto de marketing es el 10% del presupuesto de la organización).

El problema con los gráficos de torta es el siguiente: nuestros cerebros no son del todo buenos para representar las áreas de las partes de un círculo. Por ejemplo, mirando el gráfico de torta debajo, ¿cuánta más gente dirías que tiene Quebec que British Columbia?

The problem with pie charts is this: our brains just aren’t very good at figuring out the areas of parts of a circle. For example, in the bar chart below, how much more people does Quebec have than British Columbia?

Si… es difícil de decir, ¿verdad?

Ahora miremos los mismos datos en un gráfico de barras.

Está mucho más claro aquí que Quebec tiene considerablemente más población que British Columbia. Además, en el gráfico de torta parecía como si British Columbia y Alberta tuvieran la misma cantidad de gente, pero en el gráfico de barras podemos ver que British Columbia tiene mayor población. Esto se debe a que nuestros cerebros pueden interpretar más fácilmente información almacenada en la longitud de una barra que en el área de un círculo.

Por otro lado, lleva más tiempo interpretar un gráfico de torta que un gráfico de barras. Para hacerlo, tiene que mirar la table de referencias para identificar el color de una categoría, luego mirar de vuelta el gráfico de torta para encontrar el color, y luego encontrar el valor del porcentaje para ese color (o estimarlo si no se encuentra ahí mismo).

A pesar de su ubiquidad, los gráficos de torta son una manera pobre de visualizar datos. En vez de recaer en ellos, utilice gráficos de barra o una tabla de datos

Conclusión

Estos cuatro gráficos son el pan y la mantequilla de la visualización de datos. La mayoría de las visualizaciones que ves serán variantes de gráficos de barra, de líneas, de torta, o de dispersión. Con el conocimiento que tienes aquí serás capaz de interpretar los datos de negocios con los que te encuentres. Hasta, quizás, ¡comenzarás a impresionar al analista de datos de tu compañía!

Comments ( 0 )

    Leave A Comment

    Your email address will not be published. Required fields are marked *