Table of Contents
Diagramas de barras y datos discretos
Los ordenadores son excelentes en procesar grandes cantidades de datos, algo que a los humanos nos cuesta mucho trabajo. Sin embargo, hay algo en lo que seguimos siendo mejores que las máquinas, al menos por ahora. Somos imbatibles en el análisis de imágenes. Es por eso que nos encantan las representaciones gráficas de datos. Son formas sencillas y visuales que nos permiten tener una primera impresión de un conjunto de datos con solo un vistazo. Existen innumerables formas de representar datos, cada una con sus pros y contras, pero sin duda una de las más populares es el diagrama de barras. En estadística, son una herramienta crucial para mostrar la frecuencia con la que se repiten ciertos valores en una muestra de datos.
Ejemplo Champions League
Vamos a verlo con un ejemplo. Si te gusta el fútbol, seguro que conoces la Champions League, la mayor competición de clubes de Europa. En esta tabla puedes ver cuántos goles se marcaron en cada una de las finales de la Champions. Como verás, es muy difícil extraer información de una lista tan larga de datos, ¿verdad? Vamos a hacer un diagrama de barras con ellos. Pero antes de hacerlo, explicaremos un concepto estadístico muy importante, la frecuencia.
La frecuencia de un valor o suceso, es el número de veces que aparece en una muestra de datos, es decir, cuántas veces se repite un cierto valor en la tabla.
En nuestro ejemplo, observamos que cuatro finales acabaron sin goles. Por tanto, la frecuencia del suceso cero goles es cuatro.
Otras diecisiete finales acabaron con un solo gol, luego la frecuencia del suceso un gol es diecisiete. Así, vamos contando las veces que ocurre cada suceso y anotándolo, hasta llegar a los diez goles del mítico Real Madrid en 1960.
Lo que acabamos de construir recibe el nombre de tabla de frecuencias, y a partir de ella ya podemos hacer nuestro diagrama de barras.
En el eje horizontal, debemos poner todos los valores posibles que puede tomar la variable analizada, en nuestro caso, los goles marcados en finales de la Champions, de cero a diez. Ahora debemos dibujar las barras, de tal forma que su longitud sea proporcional a la frecuencia de cada suceso, cuatro para cero goles, diecisiete para un gol, y así sucesivamente con el resto.
Resumiendo, en el eje horizontal de un diagrama de barras, ponemos los valores posibles de la variable analizada, y la longitud de las barras nos indica la frecuencia con la que ocurren. Ahora sí, podemos sacar información de un solo vistazo, ¿no te parece? Por ejemplo, parece que la mayoría de finales acabaron con dos goles o menos, que el caso más frecuente es terminar con un solo gol, y que muy rara vez se han anotado seis o más goles.
¿Quieres más información? Muy bien, pues para mostrarla puedes usar el llamado diagrama de barras apiladas. Aquí las barras están segmentadas por categorías, cada una con un color diferente. Por ejemplo, en los años 90, la competición cambió de formato y número de participantes. En este diagrama he diferenciado en un color los goles de la primera etapa, cuando aún se llamaba Copa de Europa, y en otro los goles de la etapa actual, la Champions League.
Como ves, esta técnica de segmentar las barras es muy interesante porque nos permite comparar diferentes categorías dentro de un mismo gráfico, como franjas de edad, sexo, nacionalidad o lo que nos interese.
Los diagramas de barras son excelentes para representar lo que en matemáticas llamamos variables discretas.
Las variables discretas son aquellas que solo pueden tomar ciertos valores en un rango, habitualmente números enteros.
Por ejemplo, los goles marcados en un partido, que podrían ser 0, 1, 2, 3, pero en ningún caso podrían ser dos goles y medio.
Otros ejemplos de variables discretas podrían ser el número de hijos de una familia o la cantidad de nuevos clientes de una empresa cada mes.
En conclusión, el diagrama de barras es una herramienta gráfica esencial en estadística, ya que permite expresar gráficamente la relación entre los valores que toma una variable y la frecuencia con la que aparecen. Además, es un primer paso importante para entender conceptos estadísticos más complicados, como los histogramas o las distribuciones de frecuencia.
Conclusiones
- La frecuencia es el número de veces que aparece un hecho, suceso o característica en una muestra de datos.
- Los diagramas de barras son ideales para representar variables discretas.
- El diagrama de barras nos permite expresar gráficamente la relación que existe entre los valores que toma una variable y la frecuencia en la que aparecen.
- Las variables discretas son aquellas que pueden tomar ciertos valores en un rango.