domingo, 31 de agosto de 2008

Gracias!!

Las mesas de exámenes, el receso invernal y el reinicio de clases nos tuvieron ausentes de nuestro espacio virtual, pero grata es nuestra sorpresa al volver y encontrar que las visitas continuaron, desde distintos puntos del mundo, y hemos superado las 10.000!!!
Estamos mas que felices y esperamos este rincón aporte un granito a todo aquel que este queriendo zambullirse en el mundo de las Probabilidades y Estadísticas.
Nuevamente Gracias!!

sábado, 23 de agosto de 2008

Relación entre Variables - la herramienta GapMinder

Cuando trabajamos el análisis de relación entre dos variables cuantitativas planteamos hacer una evaluación gráfica inicial ploteando los pares de datos en una gráfica de dispersión (la gráfica de puntos). Esto nos permite hacernos una idea inicial de la posible relación existente entre dos variables y su forma.

Recorriendo el excelente espacio de Anibal de La Torre, descubrimos una referencia a una herramienta con tremendo potencial pedagógico: Gapminder World, que saca al máximo el jugo de lo que podriamos llamar una grafica de dispersión enriquecida. Como ocurre muchas veces, nos encontramos con la desventaja (para los que no manejan el idioma) que la misma esta en ingles, pero con solo jugar un rato podemos llegar a maravillarnos de las posibilidades que nos ofrece. Y para el que no se amaña con el ingles, siempre puede recurrir a algun traductor en línea para al menos salir del paso con los terminos principales.

Con Gapminder Chart, podemos seleccionar en ambos ejes dos variables a plotear, y las mismas serán representadas graficamente para cada país. Si ademas oprimimos play vemos la evolución año a año (imperdible! pruebenlo!)
En la imagen que sigue está capturada la relación Ingreso per Capita (U$ internacionales) vs Espectativa de Vida, el área de los círculos represena la cantidad de habitantes de cada país, mientras que el color nos indica el continente al que pertenece.


Dejamos resaltado en la captura la representación de Argentina entre el resto de los países. Y como puede observarse la nube de puntos en peores condiciones está en azul, color que representa a paises del continente Africano.

Y cambiamos luego la variable del eje vertical por Tasa de Mortalidad Infantil (cada 1000 nacimientos), y obtuvimos esto...


Con una clara relación inversa entre ambas variables. Estando Singapur e Islandia como los países con menor tasa de mortalidad y dentro de los de mayor ingreso per capita, mientras que nuevamente los paises africanos lideran las tasas de mortalidad infantil y son los que se encuentran en peores condiciones de ingreso per capita.

Pues señores digan si acaso no hay relación entre estas variables???

El que no ve es porque no quiere... y hay que ver para actuar!!!

miércoles, 18 de junio de 2008

Una gráfica dice mas que mil palabras...

17 de junio - Día Mundial de Lucha contra la Desertificación y la sequía

Estadística de la deforestación:


Fue proclamado por la Asamblea General de las Naciones Unidas (ONU) en 1994. El 17 de junio de ese mismo año se había aprobado la Convención Internacional para combatir la desertificación. Una de las causas de este problema, que amenaza a la cuarta parte de las tierras del planeta, es la sequía pero también las actividades humanas: el cultivo, el pastoreo excesivo, la deforestación y la falta de irrigación.
Fuente: Olimpiadas Nacionales de Contenido Educativo en Internet

martes, 27 de mayo de 2008

"Respuesta al juego MONTY HALL"

Chicos en el siguiente video veremos que es lo que nos conviene hacer¡¡¡
Seguimos participando¡¡¡¡

miércoles, 21 de mayo de 2008

Practicando conceptos en línea

En la inagotable fuente de material, contenidos y conocimientos que es la Internet, encontramos a través del sitio web del Congreso Nacional Internet en el Aula (España) algunas actividades para repasar los conceptos de estadística que estuvimos trabajando hasta ahora. Entre los temas están los conceptos básicos, graficas y tablas, medidas de tendencia central, de posición y de dispersión.
Es fruto de un grupo de trabajo del IES Manuel Losada Villasante de Carmona (Sevilla)

Pueden acceder haciendo clic aqui, y luego nos cuentan como les fue con los puntajes!!!

lunes, 19 de mayo de 2008

El juego SuperNueve

En clase estuvimos hablando del juego de apuesta SuperNueve del IPLYC.
En el mismo uno apuesta a 9 números del 0 al 99, y se sortean 20. El que acierta sus nueve números dentro de los 20 gana, y si hay mas de un ganador el pozo se divide.

Preguntamos entonces, cuál es la probabilidad de ganar apostando a una boleta determinada.


Por un lado planteamos que la cantidad de resultados de sorteo que pueden obtenerse cada noche será:


100C20 = 100! / ((100-80)! . 20!) = 5,3598337040381 E+20


Y la cantidad de boletas distintas que podríamos armar con 9 números en 100 es:


100C9= 100! / ((100-9)! . 9!) = 1,9022318084 E+12

Pero habiamos mencionado que con una misma boleta, podríamos ganar con resultados de mas de un sorteo (esos nueve numeros pueden "calzar" en varios resultados de 20 números), pero nos había quedado pendiente cuantificar esto último.

Ahora bien...pensemos...a cuántos sorteos "embocaría" con mi boleta de 9 números?

La solución es:
91C11= 91! / ((91-11)! . 11!) = 4,7325339895743 E+13

Por qué?


En base a estos números podriamos calcular que la probabilidad de ganar con una sola boleta es de:

P= 91C11/100C20= 8,83 E-8=0,0000000883

Y si...digamos que el cálculo de probabilidades no nos da mucho sustento para confiar que ganaremos, pero el azar es así...no nos queda mas que jugar, y ...cruzar los dedos!!!
Para cerrar, porque usamos combinaciones y no permutaciones para los cálculos??
Y cuantas boletas distintas tendríamos que jugar para cubrir todas las opciones posibles, y tener una certeza del 100% de ganar (o una probabilidad=1, aprovechando que estuvimos hablando de probabilidades)?
Seguimos pensando...y aplicando lo aprendido!

jueves, 15 de mayo de 2008

Estadística Aplicada a los Negocios


A traves de esta wiki llegamos al interesante post Estadística Aplicada a los Negocios del Dr Lefcovich, del cual destacamos los siguientes extractos:

"No se puede gestionar lo que no se mide. Las mediciones son la clave. Si usted no puede medirlo, no puede controlarlo. Si no puede controlarlo, no puede gestionarlo.Si no puede gestionarlo, no puede mejorarlo. La falta sistemática o ausencia estructural de estadísticas en las organizaciones impide una administración científica de las mismas.
Dirigir sólo en base a datos financieros del pasado, realizar predicciones basadas más en la intuición o en simples extrapolaciones, y tomar decisiones desconociendo las probabilidades de éxito u ocurrencia, son sólo algunos de los problemas o inconvenientes más comunes hallados en las empresas."

En base a que información usted podría responder por ejemplo a las siguientes preguntas:

· ¿qué clientes les generan los mayores beneficios?
· ¿qué zonas o regiones son las que generan mayores ventas en unidades monetarias y volúmenes? (en total y por producto)
· ¿cuáles son las reparaciones que más se han producido en el último trimestre?
· ¿en que día de trabajo de cada mes logra llegar al punto de equilibrio?
· ¿qué tipo de reparaciones han generado mayores egresos?
· ¿puede decirme cuales son la capacidad de los diferentes procesos en materia de costos, productividad y calidad?
· ¿cuál es su nivel en sigma de cada una de las actividades?
· ¿cuál es el nivel de rotación o permanencia de clientes?
· ¿sabe en que etapa del ciclo de vida se encuentra cada uno de sus productos o servicios?
· ¿cuál es el nivel de satisfacción de sus clientes?
· si tiene dirige un sanatorio ¿cuáles son las enfermedades que más clientes reportan? ¿cuáles son los problemas que más consultas originan?
· si posee un restaurante
¿cuáles son los platos más pedidos durante el año y por temporada? ¿cuáles son los vinos más pedidos y cuáles los más vendidos?
· si dirige una librería
¿cuáles son los temas más vendidos? ¿cuál es la rentabilidad que le aporta cada tema? ¿cómo contribuye cada tema a lograr el punto de equilibrio?
· si dirige un hotel
¿cuál es el tiempo promedio de estadía? ¿la cantidad de clientes por zona o región? ¿la cantidad de tiempo por región y su relación con la cantidad de tiempo de estadía?
¿la facturación por profesión, zona, motivo de su visita (turismo, negocios, salud, profesionales, capacitación, otros)?

Para que sirven entonces las estadísticas en relación con los negocios?

Pues son fundamentales a los efectos de gestionar y mejorar temas o actividades tales como:

1. El control de calidad.
2. El nivel de averías y sus frecuencias.
3. Los tiempos para cambios o preparación de herramientas.
4. Los niveles de productividad de distintos procesos, actividades y productos.
5. Los costos correspondientes a distintos tipos de conceptos y actividades.
6. La gestión de créditos y cobranzas.
7. El seguimiento del flujo de fondos.
8. Los niveles de satisfacción de los clientes y usuarios.
9. Los tipos de accidentes y sus frecuencias.
10. El análisis paretiano de defectos, costes, rentabilidades, ventas.
11. Ventas por clientes, vendedores, zonas y productos.
12. Predicciones de ventas por zonas, productos, servicios o sucursales.
13. Capacidad de los procesos en cuanto a generación de niveles de costes, calidad y productividad.
14. Tiempos totales de ciclos productivos.
15. Tiempos de respuestas.
16. Gestión de inventarios.
17. Cumplimiento de aprovisionamiento por parte de los proveedores.
18. Predicción de ventas por canales de comercialización.
19. Proyectos de inversión.
20. Probabilidades para la construcción del “Árbol para la Toma de Decisiones”.
21. Evolución de los distintos ratios económicos – financieros y patrimoniales a lo largo del tiempo.
22. Estudios e investigación de mercado.
23. Tiempos de máquinas y personas por actividad.
24. Cantidad y representación porcentual de distintos problemas y sus efectos económicos en la organización.
25. Tasa de polivalencia del personal.
26. Productos más demandados, a nivel global, por zona y por canal de comercialización.
27. Porcentajes de actividades generadoras de valor agregado para los clientes finales, de valor agregado para la empresa y carentes de valor agregado.
28. Tiempos promedios, máximos y mínimos de reparaciones por tipo de averías.
29. Cálculos de costes y en especial para el Costeo Basado en Actividades.
30. Para los cálculos de productividades.
31. Coeficientes de correlación.
32. Estadística del personal (directivos y empleados).

Entre otros...

Ahora se entiende porque es necesario no solo que aprendan sino que las dominen???!!!

domingo, 11 de mayo de 2008

Un ' whisky' para la foto...

En la última Cumbre del Mercosur llevada a cabo en Diciembre del 2007, como no puede faltar, se tomó la rigurosa foto grupal de los mandatarios.

Los persidentes miembros del Mercosur,de izquierda a derecha, Michelle Bachelet de Chile, Nicanor Duarte Frutosde Paraguay, Tabare Vazquez de Uruguay, Cristina Fernandez de Argentina, Luiz Inacio Lula da Silva de Brasil, Hugo Chavez de Venezuela y Evo Morales de Bolivia. (fte: Nacion.com)

Pero dicen que al fotógrafo le complicaron un poco la situación, dandole algunas restricciones para armar la estampa final, que limitaron las distribuciones posibles para la foto.

De entrada, y sin condiciones, cuántas fotos diferentes (respecto de la ubicación de los mandatoarios) podrian haberse tomado?

Pero luego alguien dijo, "por favor que las mujeres no queden juntas, asi se lucen..." ahora cuantas posiblidades quedaron?

Y Hugo dijo, "yo quiero salir al lado de mi amigo Evo!"...cuantas quedan ahora?

Por último Cristina acotó: "para limar viejas asperezas quiero estar junto a Lula y Tabaré..."

y el fotógrafo, agotado, dijo: "ubíquense como quieran y despues me avisan..." y finalmente obtuvo la instantánea.

De acuerdo a todas las condiciones, cuantas fotos distintas podría haber sacado?

(en realidad es ficción pero lo aprovechamos para practicar nuestras tecnicas de conteo)

sábado, 19 de abril de 2008

Alumnos de Turismo Trabajando...

Esta semana les tocó trabajar a los alumnos de la comisión de Turismo. Investigaron y expusieron sobre gráficas en diferentes temáticas. Aqui las instantaneas...

Click to play

Create your own scrapbook - Powered by Smilebox
Make a scrapbook - it's easy!

miércoles, 16 de abril de 2008

De Posibilidades y Probabilidades (para entrar al baño!)

En ciertos cafés de Madrid, para permitir el uso del toilete únicamente a los clientes, implementaron un sistema de acceso con una clave de tres dígitos a marcar en un teclado numérico del 0 al 9. Dicho código (variable) se genera en el ticket de quienes consumen en el lugar.

Para prueba aqui la foto.

Ahora bien, cuántos códigos distintos son posibles generar con este sistema? y cual es la probabilidad entonces de que un "colado" entre el baño?

Miremos un poquito mas a detalle....


Se quedarían con los cálculos anteriores o tienen algún justificativo para recalcular?

En cualquiera de los casos, qué técnica de conteo utilizaron para hacer las cuentas?

Esperamos a los ganadores del juego!! que podrán entrar al baño gratis!! y mas rápido!! (lástima que hay que ir hasta Madrid!)

lunes, 14 de abril de 2008

Los números y las estadísticas SI importan!!

Muchas veces nos preguntamos hasta que punto los números y datos estadísticos importan. Pues esa información, entanto este adecuadamente relevada y reelaborada, nos sirve y mucho, entre otras cosas, para tener una idea de donde estamos parados, con que podemos llegar a enfrentarnos, tener un apoyo para tomar decisiones fundadas, etc.

La incapacidad para aprehender y manejar los grandes números, y todas las probabilidades que conllevan, confunden decisiones desde personales hasta de gobierno.
Quien teme viajar en avión, por ejemplo, debería plantearse la relación de muertes por accidentes aereos respecto de los decesos por accidentes viales.
En cualquier analisis fundamentado en números y datos fidenignos, el hombre anumérico, corre el riesgo de no ser capaz de hacer una mínima estimación probabilistica (aunque mas no sea intuitiva) antes de tomar una decisión.

Rescato aqui una cita del excelente libro "El Hombre Anumérico" de J. A. Paulos:

"Usted puede elegir entre tener unas ciertas nociones claras de matemática o no tenerlas, pero debe saber que si no las tiene, es usted una persona mucho más manipulable que en el caso contrario"

En esta línea los invito a ver el siguiente video (el último tercio dedicado especialmente a nuestros alumnos de Informática) respecto de datos y números de la realidad actual y futura del mundo en el que vivimos.



Son bienvenidas sus opiniones y comentarios...

¿Mas o Menos probabilidad?

Tenemos un juego de Generala: 5 dados y un cubilete, pero uno de los dados tiene un defecto, en la cara donde debio aparecer 6 puntitos, hay 5 puntitos, es decir, tenemos un dado con doble cara para el cinco, la pregunta es:
La probabilidad de hacer una generala servida es Mayor, Menor o Igual que en un juego con dados sin defecto??
Utilizá tus conocimientos de probabilidad y demostra tu respuesta¡¡¡¡¡¡

¿Que hago? Un juego¡¡¡¡

Este interesante juego, que en realidad es un problema básico de probabilidades parece ser que se llama Monty Hall
El juego es el siguiente:
Estas en un concurso, hay tres cajas: dos de ellas contienen premios malos (1 peso y 10 pesos), y la otra un buen premio (500.000 pesos). Tenes que elegir una caja de las tres, acto seguido te muestran el contenido de una de las cajas que no elegiste, dentro de dicha caja hay un peso y ahora te preguntan:
¿Quieres cambiar tu caja?
¿Qué harías vos?
Contesta sin miedo SI o NO, no pongas explicaciones todavia, deja que el resto tambien piense¡¡¡¡¡

Nota: En el siguiente post el video puede orientarlos

sábado, 12 de abril de 2008

Mas sobre Gráficas Estadísticas


Continuando con la cuestión de la manipulación de estadísticas, vean si será tan habitual que hasta hay un libro que trata el tema "How to Lie with Statistics" (Cómo mentir con Estadísticas) de Darrell Huff, y todo un blog, Malaprensa, dedicado a denunciar estos casos. (fte: pjorge.com). Y navegando por sus posts encontramos algunos ejemplos para compartir...


En el último y apasionante (nótese la ironía) debate televisivo entre los dos principales candidatos a la presidencia de España, los gráficos fueron el juguetito del que los contendientes tuvieron el gusto de echar mano. Los de Rajoy, totalmente falseados, como puede verse en la escala que utilizó. De ese modo, podía haber puesto la barra del tamaño que le diera la gana. Si Zapatero mintió con los gráficos, es más difícil de saber. Su 'Libro Blanco' era tan blanco que resultaba muy difícil apreciar los gráficos que mostraba.


de Malaprensa: Estudiad, niños, o nunca entenderéis este gráfico

Yo debo de ser del pelotón de los torpes, porque este gráfico publicado por Abc el miércoles pasado en una noticia sobre el informe PISA no consigo entenderlo. Creo que las etiquetas están mal puestas y las barras representan el porcentaje de los hogares con menos de 10 libros, 11 a 25, etc... Pero la línea roja representa un misterio insondable. ¿Alguien puede ayudarme? (Ya saben, click para ampliar).
Estudiad aún más
En vista del éxito del primer gráfico de Abc, les propongo este otro que aparecía justamente debajo del anterior, en la misma página del periódico del 5 de diciembre. No tenía más rótulos ni explicaciones que las que ven. Endevé qué vergüenza que en España sólo tenemos 5 de lo que en Finlandia tienen 21 (sea lo que sea eso, claro).

Cuántos ejemplos mas podremos encontrar en nuestros medios? Esperamos sus "descubrimientos" a la luz de sus nuevos conocimientos estadísticos....

lunes, 7 de abril de 2008

"Las cifras no mienten, pero el hombre las manipula"

La estadística puede ser efectivamente, mal usadas. Podemos nombrar numerosos ejemplos del mal uso intencionado de la estadística, sobre todo por aquellos que emplean sus habilidades en el campo para servir intereses particulares, distorsionando y falsificando los datos.

Ejemplo: La ciudad XX realizará sus elecciones para elegir al intendente, una agencia realizó encuestas a una muestra representativa de electores y los resultados fueron, 98 electores dijeron estar a favor del candidato A y 100 del candidato B, como no había casi diferencias en la cantidad de votos de uno y otro, el partido PLK que representa el candidato B, pidió no mostrar los resultados, pero el editor del diario local le dijo:
- si me permiten Srs, creo que pudiéramos presentar los resultados de esta manera:

Gráfico 1
“Comportamiento de la intención de votos 198 electores de la ciudad XX”




-A lo que contestó el el partido PKL, me gusta¡¡¡

Si el gráfico que representa la intención de votos hubiera sido el Gráfico 2, ¿El partido PLK hubiera aceptado la publicación? ¿Por qué?, Uno de los gráficos esta mal confeccionado?, que diferencia hay? ¿Qué aspectos faltarían indicar en el gráfico?

Gráfico 2
“Comportamiento de la intención de votos 198 electores de la ciudad XX”


En esta ocasión te dejo a vos que escribas la MORALEJA¡¡¡¡¡¡¡

domingo, 30 de marzo de 2008

Gráficas que Hablan - Ejemplo 2

A continuación encontrarán gráficas publicadas en el diario La Nación del día domingo 30 de Marzo del 2008, en el suplemento Empleos, referidas al Empleo en la Cadena Agroindustrial.

(para ver la gráfica en mayor tamaño o descargarla para una mejor visualización hacer clic aqui )

Ahora trabajemos interpretando:

- Qué quiere decir el 36% de la gráfica de "Trabajadores del Sector"?

- Qué nos dicen los hombrecitos de la gráfica "Empleados Directos e Indirectos"? Qué tipo de gráfica es? de que manera se codifica la información?

- De la gráfica "Crecimiento de Puestos de Trabajo", que sector tendrá un mayor crecimiento ? respaldar con algunos números las conclusiones (sacar "a ojo" de la gráfica las cantidades)

- A parte de la distribución de los datos por provincias del mapa "..personas que residen o trabajan en establecimientos agropecuarios" en que otros elementos de la figura está volcada gráficamente la información numérica?

Luego de lectura y relectuar de gráficas y datos, es importante la actividad agropecuaria en cuanto a empleo para los habitante de nuestro país? que dato respalda su conclusión?

Esperamos sus comentarios para cerrar el análisis todos juntos. A trabajar!


Graficas que Hablan - Ejemplo 1

Trabajamos en clase la interpretación de resultados en Tablas y Gráficas, todas sobre ejercicios hipotéticos, sencillos. Ahora vayamos a datos de la realidad.

A continuación encontrarán gráficas publicadas en el diario La Nación del día domingo 23 de Marzo del 2008, referidas a la política vial en nuestro país.

(para poder leer mejor los datos pueden descargar la gráfica en mayor tamaño y con mejor resolución haciendo clic aquí )

- Del gráfico "Rutas Argentinas", el cual es muy ilustrativo geográficamente pero difícil de analizar comparativamente, nos gustaría que vuelquen, en el espacio comentarios de este post, su interpretación de la misma.

- Del gráfico "Gasto total de la Dir Nacional de Vialidad año 2007", qué cálculos nos serían mas ilustrativos de la distribución de gastos? pueden "remixar" esos datos para hacer su interpretación de la gráfica y los datos volcados en la misma.

Estas gráficas tienen mucho para decir... "si solo si" sabemos interpretarlas adecuadamente.

domingo, 23 de marzo de 2008

La media, siempre es representativa?

Cuando estudiamos las medidas de tendencia central, como la media, la moda y la mediana, nos preguntamos, tantas medidas y al fin cuál es la mas representativa? siempre la media como centro físico de los datos, es la ideal? es suficiente con las medidas de tendencia central para caracterizar a un conjunto de datos?


Aclaremos esto con un ejemplo (tomado de "Probabilidades y Estadística. Su Enseñanza" de J. Foncuberta, Red Federal de Formación Docente Contínua, MECyT, 1996).

El Sr J., gobernante de un remoto país, se jactaba de que el salario medio en su país era de $3.000. El señor Modulador, de visita por esos lugares observó las extrañas costumbres de sus habitantes: vestían muy mal, comían peor, se guarecían donde podían y padecían graves enfermedades. Como el señor Modulador es sumamente ingenuo creyó que en ese país el ahorro más que una virtud era una obsesión pero por más que preguntó nadie supo sacarlo de su perplejidad. Hasta que cierto día encontró a un colega Modulador de aquellas regiones que le aclaró el misterio: sucedía que entre 1 millón de habitantes, la renta se distribuía así:

(cualquier parecido con la realidad es mera coincidencia)


Efectivamente el salario promedio era de $ 3.000! , ahora bien esto no es para nada representativo de la realidad del salario en dicho país!!! o si?

Desde entonces el Sr. Modulador desconfía mucho del valor medio.

No es lo mismo un país donde el salario medio es de $3.000 con valores máximo y mínimo 3.500
y 2.000 que otro como el del ejemplo con igual valor medio pero con valores extremos $1.800.000.000 y $200.

Sin duda en el primer caso los datos están menos dispersos que en el segundo, de hecho en el ejemplo podemos hablar de valores extremos (lo que gana Don J. !). Una de las desventajas del valor medio es justamente la sensibilidad a valores extremos y en este ejemplo vemos claramente como la media es "tironeada" hacia arriba por estos valores extremos.

Y que pasaría si para el mismo ejemplo, simplificando la situación y pensando que los salarios son exactamente los que figuran en la columna promedio per cápita, calculáramos la Mediana? Como la hallamos? ordenando todos los datos de menor a mayor y encontrando el valor central. Tenemos un millón de datos, donde una vez ordenados el valor central sería el promedio del dato en la posición 500.000 y la 500.001. Si ordenamos y los primeros 999.000 ganan $200, entonces

Mediana=($200+$200)/2=$200.

En este caso y en este ejemplo cuál de las dos medidas es mas representativa? la media o la mediana? sin duda que la MEDIANA!

Ahora como podemos cuantificar esta variabilidad del conjunto de datos? Necesitamos una medida para la desviación o dispersión de los datos, y es allí donde aparecen las medida de variabilidad. Las dejamos para un próximo post.

sábado, 22 de marzo de 2008

Promedio?_Media aritmetica?

Todos en algún momento de nuestras vidas calculamos un promedio, ya sea de las notas al terminar el secundario, del gasto mensual de luz durante un año, del gasto en el supermercado por semana, de las ventas anuales en nuestra empresa, etc. Ese número que resulta de sumar todos los valores de una variable en análisis y dividirlos entre la cantidad de valores sumados, ¿que me dice?, Intuitivamente creo que para todos es bastante claro.
Ejemplo 1) Si el salario promedio de los obreros en una empresa es de 556, 67 pesos, ¿que quiere decir?
- qué todos tienen ese salario?
- qué la mayoría de los obreros ganan ese salario?
- Si mi primo trabaja ahí y gana 378 pesos?
Si observo la lista de salarios y ese valor no está,
- - me pregunto, siempre pasa esto?
- - el promedio puede no coincidir con los valores que le dieron origen?

Ejemplo 2) El promedio de personas por día que acuden a un cajero es de 45,3 personas
- como 45,3 personas?
- debe estar mal, será 45 o 46 personas por día

Ya no lo tengo tan claro!!!

Este valor que resulta de aplicar una sencilla fórmula matemática, no siempre es intuitivamente claro, el promedio puede o no coincidir con uno de los valores utilizados en su cálculo, pues el mismo actúa como un punto de equilibrio o balanceo, de modo que las observaciones que son mayores equilibren a las que son menores. Se dice que es el centro físico de los datos. Y lo que me dice simplemente es eso, un promedio, un valor medio entre todos los analizados, nos da una idea del comportamiento promedio de los datos.

MORALEJA: No todo lo intuitivo es siempre tan claro, es intuitivo nada más, sobre todo para los que recien comienzan a estudiar estadística

miércoles, 19 de marzo de 2008

Representatividad de una muestra

Cuando hablamos de Representatividad de una muestra, a que nos referimos?
- tendrá que ver con un porcentaje determinado del tamaño de la población?
- un 20% es suficiente?
- con un 50% alcanzará?,
- o tendrá que ver con la variabilidad de la característica a analizar en la población?
Veamos el siguiente ejemplo que nos ayudará a no olvidar de que trata la Representatividad de una muestra.

"Si tenemos dos cortes de telas de unos 8 metros cada uno para hacer unas cortinas, una es lisa de color amarillo y la otra estampada con flores de diversos colores y tipos, y necesitamos elegir unos botones adecuados para adornarlas, el color del barral para colgarlas y el hilo para coserlas, al salir de casa para ir a buscar todo lo que necesitamos no cargaríamos con los cortes de telas; tan solo con llevar una muestrita de cada una tendríamos idea exacta de la tela, la pregunta es:
- la muestra a cortar de tela amarilla será del mismo tamaño que de la estampada?
Claro que NO, con un cortecito pequeño que hagamos en la punta del corte de tela amarillo tenemos idea clara del color, sin embargo de la estampada necesitamos obtener un pedazo de tela mas grande y asi tener idea de todos los colores que tiene y que me pudieran servir a la hora de elegir los accesorios.

MORALEJA: la representatividad de una muestra no tiene que ver con el tamaño de esta, sino con la capacidad de reproducir a pequeña escala las características de la población.

domingo, 16 de marzo de 2008

Probabilidades y hechos

Hace un tiempo se emitía una publicidad de Cinzano que tuvo mucho éxito, y la incluímos aqui, la vemos?

Fuera de lo anecdótico podemos aprovecharla para revisar algunos conceptos:

- De acuerdo a la relación que lee uno de los chicos (1 de cada 10 argentinos...), efectivamente en el grupo habrá uno gay?

Sin duda el estudio que se debió haber hecho para afirmar esto se ha basado en un muestreo sobre n individuos, donde x se reconocieron gays, y en base a estos datos se encontró la relación 1 en 10. Ahora pensemoslo de esta manera:

- al consultar a un argentino cualquiera su preferencia sexual, cuál es la probabilidad que sea gay? y de que no lo sea?

- Qué enfoque del concepto de probabilidad estaría utilizandose en la anterior? (clasica a priori, por frecuencia relativa o subjetiva) y por qué?

- si ahora volvemos al grupo en cuestión, cuál es la probabilidad de que uno de los diez sea gay? y que ninguno? es mas probable cual de las dos situaciones?

- Qué modelo de distribución de probabilidad puedo utilizar para calcular lo anterior? discreta o continua? Y entonces, cual es el valor esperado de gays que habrá en grupos de 10 individuos?

Bastante para trabajar, no?

Lo revisamos mas adelante así queda tiempo para masticarlo...A trabajar!

Interpretación de datos estadísticos - Ejemplo 1

Estamos siendo bombardeados permanentemente por datos estadísticos, de las temáticas mas diversas. La información nos llega en gráficas, porcentajes, tablas, números, y en muchas ocasiones ya interpretada.

Debemos tener el ojo atento para ser capaces de evaluar que tan bien "interpretados" están esos datos o resultados.

A continuación va un ejemplo. Es un artículo respecto del perfil de lectores, tomado del portal educ.ar (se cita el link fuente).

Vamos a leer el artículo y luego responder algunas preguntas.

¿Cómo leemos los argentinos?

Según un estudio elaborado por la Fundación El Libro y la Universidad de San Andrés la mayoría de los encuestados lee habitualmente libros, diarios y revistas, y uno de cada tres lo hace por placer.
La encuesta fue realizada sobre una base total de mil personas, divididas en dos muestras. La primera fue tomada a más de quinientas personas de todas las edades en diversos puntos de la Ciudad de Buenos Aires y Gran Buenos Aires. A su vez, el sondeo fue completado con quinientos asistentes a la última edición de la Feria Internacional del Libro de Buenos Aires.
Según el informe, uno de cada tres lee por placer, lo que representa el 38 por ciento de las personas entrevistadas. En tanto, el 33 por ciento de los encuestados señaló que desarrolla el hábito de la lectura por motivos de estudio y formación, y el resto sostuvo que lo hace por "ganas de informarse".
Asimismo, el 86 por ciento aseguró leer libros y el 80 por ciento lee también diarios. Y tres de cada cuatro personas consumen revistas. Las novelas (19%), los libros de estudio (17%) y los clásicos de la literatura (12%) encabezan el ranking de los textos más leídos. El listado continúa con lecturas para profesionales, poesía, ensayos y cuentos, entre otros géneros.
Según el trabajo, además, la presencia de internet modificó los hábitos de lectura. Así, uno de cada tres entrevistados lee las versiones digitales de los diarios. Otro dato interesante: el 21% de los que cursan un posgrado descarga los libros que lee a través de internet, mientras que en el caso de los que cursan algún terciario ese porcentaje asciende a 27 por ciento. Los niveles de descarga de libros descienden considerablemente en el caso de los que completaron su formación universitaria (13%) y de los que poseen primaria completa (14%).
Por último, considerando el nivel de estudios de los consultados, el informe indica que quienes menos leen son aquellos que tienen solo el primario completo, con un 55% del total de la muestra. Entre los que más tiempo dedican a la lectura, se destacan los que tienen un título de grado, quienes cursan un posgrado o ya lo han terminado y aquellos que están cursando la educación primaria y secundaria.

De acuerdo al estudio realizado
1) los datos y porcentajes representan lo que el título del artículo anuncia?

2) la muestra descripta es representativa de que población?

3) qué variables se pueden identificar del relevamiento? y de que tipo?

lo revisamos en un proximo post!

Probabilidades y Estadística

Va una imagen (aquí traducida), que representa muy bien la diferencia entre Estadística y Probabilidad.


Diagrama mostrando la diferencia entre estadísticas y probabilidad. (Imagen del MIT OpenCourseWare. Basada en Gilbert, Norma. Statistics. W.B.Saunders Co.,1976.)

ESTADISTICA PARA TODOS

Este espacio surge para demostrar dos cosas:

1.- La ESTADISTICA se puede entender y aprender facilmente
2.- La ESTADISTICA está en todas partes

del Instituto de Estadísticas de las Islas Baleares (IBESTAT)


El título de este blog (parafraseando a Adrian Paenza, en su excelente saga de libros Matemática... estas ahi?), busca plasmar esta idea.

He transitado varios años acompañando a estudiantes en la práctica de la Estadística. En la Facultad de Ingeniería de la Universidad Nacional de La Plata (como Ayudante Alumna), del 94' al 98', y desde el añp 2005 como JTP de la asignatura, en el IUGD de Posadas (Misiones) para las carreras de Ingeniería y relacionadas con Cs de la Administración. También como profesora particular para alumnos de la UNAM.

A lo largo de este caminar he notado que la mayoría de los fracasos por parte de los alumnos en esta asignatura tiene que ver principalmente con la dificultad de relacionar los contenidos y herramientas con su aplicación en la realidad, obstaculizando la apropiación y recuperación de conocimientos, en los contextos adecuados.

Aun cuando trabajamos intensamente en la asignatura para encontrar los mejores ejemplos y ejercicios, no siempre están tan accesibles, y para todas las disciplinas.

Es así que este espacio buscará aglutinar ejemplos y propuestas que puedan estar disponibles para todos, y de alguna manera faciliten el acceso en general a esta ciencia tan importante y abarcativa como es la Estadística.

No encontrarán grandes descripciones teóricas ni desarrollos académicos, únicamente notas, propuestas y ejemplos para acercar, de la forma mas sencilla posible, los principales conceptos. Asimismo, como se tratará de ir aprovechando material existente en la web y e ir desarrollando otros, el orden de los post seguramente no seguirá una secuencia de temas preestablecida. Para facilitar la lectura y búsqueda específica de temas, se recomienda entonces aprovechar las ETIQUETAS de los posts.

Se aceptan comentarios y sugerencias que sin duda enriquecerán este espacio. Y por sobre todo espero sea de utilidad para todo aquel que lo visite.