lunes, 5 de abril de 2010

Estadística Descriptiva e Histogramas con Excel

Existen herramientas de software específicas para el tratamiento de datos (como por ejemplo R-project, SPSS, otros), pero lo cierto es que para el día a día lo que tendremos a mano es alguna planilla de cálculo, como por ejemplo Excel.

Ademas de poder utilizar las funciones estadísticas de Excel para el cálculo de medidas resumen descriptivas, y de conteo y gráficas para el armado de una tabla por intervalo de clases y su correspondiente Histograma, este software incluye un complemento para Análisis de Datos, que ofrece herramientas para análisis de Estadística Descriptiva e Histograma, además de muestreo, Varianza, Jerarquía y pecentil, Correlación, Covarianza, Regresión, entre otras.

EXCEL 2007
Para poder acceder a estas herramientas debemos ir a:
Solapa Datos, grupo Análisis y hacer clic en Análisis de Datos.

Si la opción Análisis de datos no está disponible, se debe cargar el programa de complemento Herramientas para análisis (las instrucciones que siguen están tomadas de la Ayuda de Excel 2007)


1. Haga clic en el botón de Microsoft Office (el redondo con la ventanita de colores en la esq sup izquierda) y, a continuación, haga clic en Opciones de Excel.
2. Haga clic en Complementos y, en el cuadro Administrar, seleccione Complementos de Excel.
3. Haga clic en Ir.
4. En el cuadro Complementos disponibles, active la casilla de verificación Herramientas para análisis y, a continuación, haga clic en Aceptar.

Sugerencia Si Herramientas para análisis no aparece en la lista del cuadro Complementos disponibles, haga clic en Examinar para buscarlo.

Si se le indica que Herramientas para análisis no está instalado actualmente en el equipo, haga clic en Sí para instalarlo.

Veamos las dos herramientas que nos interesan aquí:

ESTADISTICA DESCRIPTIVA

La herramienta de análisis Estadística descriptiva genera un informe estadístico de una sola variable para los datos del rango de entrada, y proporciona información acerca de la tendencia central y dispersión de los datos.
Brinda un resumen en el cual las medidas que calcula son: Cuenta, Suma, Mínimo, Máximo, Rango, Media, Mediana, Moda, Desviación estándar, Varianza, Curtosis, Error Típico y Coeficiente de asimetría.

HISTOGRAMA

A partir de definir los intervalos a utilizar, genera la tabla por intervalo de clases, con el conteo de frecuencias de clase y el Histograma (gráfica).

Para tener en cuenta: al definir los intervalos en la planilla, lo que debemos especificar es el límite superior de cada intervalo, y la herramienta los toma como intervalos semiabiertos (abierto-cerrado] ( al revés de como lo hacemos habitualmente en clase en forma manual donde solemos tomarlos como semiabiertos pero [cerrado-abierto), teniendo esto presente solo es cuestión de acomodar los cálculos para los límites de los intervalos, y listo).

A continuación un video explicativo muy claro (de
juansandoval02) sobre como utilizar ambas herramientas.




Con EXCEL 2003 o anterior

Para poder acceder a esta herramienta debemos Ir al Menú Herramientas, opción Análisis de Datos.

En caso de no encontrar dicha opción en el menú entonces habilitarla desde:
Herramientas opción Complementos…, y allí tildar Herramientas para análisis y Herramientas para análisis-VBA , luego dar Aceptar.

Cuando accedemos a Análisis de Datos nos abrirá una ventana donde podemos seleccionar que herramienta utilizar, y en la misma encontramos tanto Estadística Descriptiva como Histograma.

A partir de allí el procedimiento es como el descripto para 2007.
Nos queda pendiente estudiar si podemos lograr algo similar con Calc de Open Office, si alguno conoce y quiere contarnos será bienvenido el aporte para incluirlo aquí.

Esperamos les sea útil, y escuchamos sus comentarios!

jueves, 11 de marzo de 2010

Otra forma de ver los datos del mundo II...Show.Mappingworlds...

Continuando en la línea del post anterior, hoy (en búsqueda de material para el próximo inicio de clases) nos topamos con este recurso online: Show Mappingworlds

Nuevamente los datos del mundo se reflejan en el redimensionamiento del tamaño de los países. De la ayuda del propio sitio:

SELECCIONE un tema del menú superior y visualice como los países cambian su
tamaño en el mapa. En lugar de representar la superficie de tierra, el tamaño de los paíse representan el dato para la variable seleccionada.

Aquí una animación de la aplicación que mapea la variable reserva de petróleo (hacemos clic en el ícono central de Resize y veamos el resultado)


















Algunos resultados...

PLANET >> ENVIRONMENT >> WATER RESOURCES (Recursoso Hídricos)

(con razón miran con cariño a latinoamérica...)

PEOPLE >> DEMOGRAPHIC >> RURAL POPULATION (Población Rural)

Y hay muchas variables mas para seguir probando...

Sumamente ilustrativo!




viernes, 22 de enero de 2010

Otra forma de ver los datos del mundo...Worldmapper

Saliéndonos de las gráficas de datos tradicionales, nos topamos con el Worldmapper, un sitio web que presenta mas de 600 mapas, asociados a diferentes variables medidas a nivel mundial. Pero utiliza "un mapeo muy particular" de los datos.

Para la presentación gráfica utiliza cartogramas de áreas equivalentes conocidos como density-equalising maps. Para entender vale el ejemplo que presenta el sitio en About Worldmapper:

Worldmapper es una colección de mapas del mundo que utilizan cartogramas de áreas equivalentes donde los territorios son redimensionados en cada mapa de acuerdo a una variable en particular.


Mapa territorial

Mapa Poblacional


En el primer mapa los territorios son proporcionales a la superficie de tierra (el mapa tradicional que conocemos todos), mientras que en el segundo los territorios están en propoción a la variable población. Se puede ver en este caso que el mayor es China, en verde brillante (comparando con el mapa tradicional), el siguiente es India en Naranja, y vean como crece la pequeña isla púrpura de Japón!

Este ejemplo toma una variable (población) para la cual, mas o menos, tenemos idea de lo que encontraremos, pero que pasa con otras? nos puede "iluminar" bastante navegar los distintos mapas...

Los que siguen resultan muy ilustrativos,

Inversión en Salúd Pública



Niños Desnutridos (menores de 5 años)

Usuarios de Internet (datos del 2002)

Otro recurso más para darnos gráficas que hablan por sí solas y explican muchos de los problemas del mundo.

viernes, 21 de agosto de 2009

Citas...


Sólo me fío de las estadísticas que he manipulado.
Winston Churchill

domingo, 31 de mayo de 2009

Probabilidades por aquí, por allá...y hasta en las siliconas


No se si uno se irá poniendo monotemático pero llega un momento que vemos las probabilidades y estadísticas por todos lados. Es así que hace un tiempo me encontré leyendo un artículo en el diario La Nación titulado "Lolas" ,y terminé haciendo cálculos de probabilidades...cómo llegué a ese punto? comparto con ustedes algunos extractos como para que puedan reflexionar y ayudarme a analizar que principio de probabilidades deberíamos aplicar para encontrar la probabilidad real de que .... ¡a alguien se le encapsulen las lolas de siliconas! Aquí les va...

Nunca me molestó tener senos pequeños. Al contrario. Como de jovencita me gustaba hacer ballet, sentía que mi cuerpo se parecía al de la mayoría de las bailarinas famosas: menudas, bajitas y de pechos muy chicos. Después no fui bailarina, pero igual siguió sin importarme. Vivía en Venezuela, iba a la playa todos los fines de semana y me ponía bikini sin problema. El problema empezó después de que llegué a Argentina. En un momento dado me di cuenta de que yo, que nunca me pinto, que tomo vino pero tiendo a comer sano, y que jamás me hago las uñas, estaba pensando en hacerme las lolas. Algo que no tiene nada que ver conmigo. ¿Por qué? Porque mis senos pequeños empezaron a avergonzarme. Y eso que no veo televisión. Pero bastaba con que saliera de casa para ver por todas partes carteles publicitarios, tapas de revistas y vidrieras de negocios mostrando mujeres con unos pechos de tamaño y turgencia descomunales. En el gimnasio al que iba, todas menos yo las tenían hechas. Al principio me parecía raro ver tantos senos perfectos. Después, la rara era yo.

Fui a un cirujano. Me dijo que lo primero que hacía era hablarles a sus pacientes del riesgo de la cirugía. Explicó de qué manera reacciona el cuerpo ante la presencia de un elemento extraño. Dijo que es erróneo decir, como dicen muchos, que la prótesis se "encapsuló" porque en realidad alrededor de todas las prótesis se hace una cápsula. Recordé una amiga a la que una bala le había pegado por error y se le quedó incrustada en la frente sin causarle ningún daño; ni siquiera una mínima infección. Encapsular la bala o la silicona es la manera del cuerpo de protegerse de un invasor.

-¿Entiende lo que le estoy diciendo? -dijo.

-Sí -contesté. -El cuerpo encapsula al enemigo para neutralizarlo y seguir adelante con la vida. Haciendo dibujos sobre un papel para ilustrar sus palabras, el cirujano siguió diciendo que el problema surge tan sólo en aquellas ocasiones en que la cápsula empieza a contraerse. Cosa que ocurre en cerca del diez por ciento de los casos. Entonces aprieta la silicona, el seno se endurece, cambia de forma, se arruga y produce dolor. El hablaba y yo no podía dejar de calcular.

-¿Diez por ciento para las dos, o diez por ciento para cada una? -pregunté.

El levantó la vista del papel. Me miró como a un animal extraño.
-Nunca me habían hecho esa pregunta -dijo. Se acomodó los anteojos.

Agregó: -Diez para cada una.

-Entonces la probabilidad es del veinte -contesté.

El médico puso cara de asombro. Apoyó sobre el escritorio el bolígrafo con el que
había estado escribiendo, y dijo: -Usted no se va a operar nada.

Salí de ahí orgullosa de mis dos pequeños senos. Sólo si alguna vez pierdo uno volveré a ver a ese doctor.

Ahora bien, cómo será que quien narra la historia concluye que en realidad en un 20% de los casos la cosa se complica (o se encapsula). No lo veamos como una mera suma, analicémoslo desde la perspectiva de las probabilidades.Y si el dato del doc era 10% de pacientes y no 10% de lolas? a una pobre muy desgraciada se le podrían encapsular las dos, no? podríamos pensar que se encapsule la derecha o la izquierda son eventos mutuamente excluyentes?...mmm me quedo pensando...y calculando...uds que opinan?

lunes, 4 de mayo de 2009

El grosero error de calculo

¡¡Hola!!

Leyendo el diario Pagina 12, encontramos una nota del Dr. Adrián Paenza -¿lo conocen?- donde plantea un problema que surgió cuando se hicieron las patentes de los autos en la Argentina.


La nota lleva el titulo “El grosero error de calculo”, y viene muy bien justo ahora que estamos transitando por la Unidad 3 !!!

Bueno, les dejamos la nota para que lo lean, al final de este post dejamos unas preguntas para reflexionar…

" En la Argentina, hasta hace algunos años, los autos tenían en las “chapas patentes” que los identificaban una combinación de una letra y luego seis o siete números.
La letra se utilizaba para distinguir la provincia. El número que seguía identificaba el auto.


Por ejemplo, una “chapa patente” de un auto radicado en la provincia de Córdoba era así:


X357892


Y uno de la provincia de San Juan,


J243781

Los de la provincia de Buenos Aires y los de la Capital Federal comenzaron a presentar un problema. Como el parque automotor superaba el millón de vehículos, se utilizaba –aparte de la letra B para Buenos Aires y C para la Capital– un número que ahora consistía de siete dígitos.

Por ejemplo, se podían ver por la calle autos con patentes como éstas:

B1793852


O bien:


C1007253

Es decir, se necesitaba “empequeñecer” al número después de la letra (que indicaba a “qué millón” pertenecía el auto) porque ya no había más espacio disponible.


Toda esta introducción es para presentar la “solución” (?) que se encontró... y el ERROR GROSERO que se cometió.

La idea fue cambiar todo el sistema de patentamiento de vehículos del país y utilizar tres letras y tres dígitos.


La idea era conservar la primera letra como identificatoria de la provincia y aprovechar que, como el número de letras en el alfabeto es mayor que el número de dígitos, se tendría la cantidad deseada de “patentes” para resolver el problema.


Por ejemplo patentes posibles serían:


NDC 378


O bien:


XEE 599


Ahora bien. Estaba todo listo para empezar el “re-patentamiento”, cuando apareció un problema. Pero antes de exhibir cuál fue, quiero invitarlo a pensar (conmigo) cuántas patentes se pueden escribir de esa forma.

Piense en la información que viene en una “chapa patente”: se tienen tres letras y tres números.

Pero como se pretendía que la primera letra estuviera fija para cada provincia, en realidad, hay SOLAMENTE dos letras y tres números con los que “jugar”.


El alfabeto castellano, excluyendo la letra “ñ”, tiene veintiséis letras. ¿Cómo hacer para contar los pares diferentes que se pueden formar? En lugar de mirar la respuesta que yo voy a escribir más abajo, piense (un poco) sola/o.


Una ayuda: los pares podrían ser


AA, AB, AC, AD, AE, AF, ...., AX, AY, AZ (o sea, hay 26 que empiezan con la letra A).
Luego, seguirían (si los pensamos ordenadamente)BA, BB, BC, BD, BE, .... , BX, BY, BZ (otra vez veintiséis, que son los que empiezan con la letra B).

Podríamos ahora escribir los que empiezan con la letra C y tendríamos otros veintiséis. Y así siguiendo. Entonces, por cada letra para empezar, tenemos 26 posibilidades para aparear. O sea, hay en total, 26 x 26 = 676 pares de letras.


Ahora bien. Ya hemos contabilizado todas las combinaciones posibles de tres letras. La primera identifica la provincia, y para las dos siguientes tenemos 676 posibilidades.


Ahora, nos falta “contar” cuántas posibilidades tenemos para los tres números. Pero esto es más fácil. ¿Cuántas ternas se pueden formar con tres números? Si uno empieza con la terna 000


y sigue, 001, 002, 003,... hasta llegar a 997, 998, 999... el total es entonces 1000 (mil) (¿entiende por qué es mil y no 999?) (si quiere pensar sola/o, mejor. Si no, piense que las ternas comienzan en el “triple cero”).


Bien. Ya tenemos todas las herramientas que necesitamos.Cada provincia (luego, eso fija la primera letra) tiene 676 posibilidades para las letras y 1000 posibilidades para las ternas de números. En total, entonces, hay ¡¡676.000!! combinaciones.

Como usted advierte, este número hubiera sido suficiente para algunas provincias de la Argentina, pero no para las más pobladas, y mucho menos con la idea de resolver el problema que había originado todo el cambio.


¿Qué solución encontraron entonces, luego de haber hecho la campaña para “modernizar” el patentamiento y “actualizar” la base de datos del parque automotor?


Tuvieron que “liberar” la primera letra. En ese caso, cuando ya no hay restricción para la primera letra (que no necesita estar asociada a una provincia) hay entonces 26 posibilidades más para cada una de las 676.000 combinaciones de los “cinco” lugares restantes (las dos letras y los tres dígitos).


(Para entender esto: tome una de las 676.000 combinaciones posibles. Agrégueles la letra A al principio. Ahora, tome las mismas 676.000 y agrégueles la letra B al principio. Como se ve, ahora uno ha duplicado el número de “patentes”. Si uno ahora agrega la letra C al principio, triplica el número. Si sigue con este proceso y va utilizando cada una de las 26 letras del alfabeto, encuentra que ha multiplicado por 26 las posibilidades que tenía antes.)


Luego, el número total es


26 x 676.000 = 17.576.000


Ahora sí, con más de 17 millones de “chapas patentes” disponibles, no hay más conflictos..., al menos, en el futuro inmediato (dentro de cinco años, hablamos nuevamente). Pero lo peor es que ya no se sabe a qué provincia pertenece cada auto (como se pretendía en un principio). Por último: ¿hubo algún responsable de un error tan grosero? ¿Quiénes fueron los que hicieron las cálculos iniciales que ocasionaron semejante aberración? "


¿Que les pareció? ¿con qué temas de la Unidad Nº3 podríamos relacionar? ¿Qué conceptos podríamos aplicar con este tipo de problema? ¿notaron que no utilizo ninguna formula?

fuente: http://www.pagina12.com.ar/diario/contratapa/index-2007-07-05.html

martes, 7 de abril de 2009

Cuidado con los Graficos de Torta en tres dimensiones¡¡¡

Hola¡¡ hoy en dia los distintos soft que producen gráficos estadísticos, poseen una variedad de graficos impresionantes, mezclando colores, dimensiones, perspectivas, diseños, etc, que hacen de los mismos un medio visual esteticamente deslumbrantes, pero no podemos olvidar que detras de esa imagen linda, hay datos, y que la idea inicial al utilizar graficos es presentar la información resumida, resaltando los resultados mas significativos, y si al mirar el grafico, la información es confusa, no logramos lo que queríamos.
A continuación mostramos un ejemplo encontrado en la siguiente dirección: http://www.seh-lelha.org/graficos.htm.
*******************************************************************
En la tabla siguiente se presentan los datos procedentes de un estudio real, correspondientes al nivel cultural de 881 pacientes diabéticos, atendidos en régimen ambulatorio.
En la torta que vemos más abajo se han representado los datos de esa tabla utilizando como lamentablemente es habitual tres dimensiones. No sé qué le parecerá a ud lector, pero a mí, si me fijo en el sector verde (Estudios primarios incompletos) y marron (Sin estudios), me parece que el sector marron es algo más grande que el verde, lo que está en clara contradicción con los datos de la tabla. Les aseguro que el gráfico no está "amañado", me he limitado a capturar la pantalla del excel. Prueben con su programa favorito. El problema óptico radica en dónde coloquemos cada sector.

Fíjense en cambio en el diagrama de barras de la siguiente figura. Ahora sí se está reflejando adecuadamente los datos en el gráfico y nos permite establecer relaciones visuales fiables entre ellos.