viernes, 21 de agosto de 2009

Citas...


Sólo me fío de las estadísticas que he manipulado.
Winston Churchill

domingo, 31 de mayo de 2009

Probabilidades por aquí, por allá...y hasta en las siliconas


No se si uno se irá poniendo monotemático pero llega un momento que vemos las probabilidades y estadísticas por todos lados. Es así que hace un tiempo me encontré leyendo un artículo en el diario La Nación titulado "Lolas" ,y terminé haciendo cálculos de probabilidades...cómo llegué a ese punto? comparto con ustedes algunos extractos como para que puedan reflexionar y ayudarme a analizar que principio de probabilidades deberíamos aplicar para encontrar la probabilidad real de que .... ¡a alguien se le encapsulen las lolas de siliconas! Aquí les va...

Nunca me molestó tener senos pequeños. Al contrario. Como de jovencita me gustaba hacer ballet, sentía que mi cuerpo se parecía al de la mayoría de las bailarinas famosas: menudas, bajitas y de pechos muy chicos. Después no fui bailarina, pero igual siguió sin importarme. Vivía en Venezuela, iba a la playa todos los fines de semana y me ponía bikini sin problema. El problema empezó después de que llegué a Argentina. En un momento dado me di cuenta de que yo, que nunca me pinto, que tomo vino pero tiendo a comer sano, y que jamás me hago las uñas, estaba pensando en hacerme las lolas. Algo que no tiene nada que ver conmigo. ¿Por qué? Porque mis senos pequeños empezaron a avergonzarme. Y eso que no veo televisión. Pero bastaba con que saliera de casa para ver por todas partes carteles publicitarios, tapas de revistas y vidrieras de negocios mostrando mujeres con unos pechos de tamaño y turgencia descomunales. En el gimnasio al que iba, todas menos yo las tenían hechas. Al principio me parecía raro ver tantos senos perfectos. Después, la rara era yo.

Fui a un cirujano. Me dijo que lo primero que hacía era hablarles a sus pacientes del riesgo de la cirugía. Explicó de qué manera reacciona el cuerpo ante la presencia de un elemento extraño. Dijo que es erróneo decir, como dicen muchos, que la prótesis se "encapsuló" porque en realidad alrededor de todas las prótesis se hace una cápsula. Recordé una amiga a la que una bala le había pegado por error y se le quedó incrustada en la frente sin causarle ningún daño; ni siquiera una mínima infección. Encapsular la bala o la silicona es la manera del cuerpo de protegerse de un invasor.

-¿Entiende lo que le estoy diciendo? -dijo.

-Sí -contesté. -El cuerpo encapsula al enemigo para neutralizarlo y seguir adelante con la vida. Haciendo dibujos sobre un papel para ilustrar sus palabras, el cirujano siguió diciendo que el problema surge tan sólo en aquellas ocasiones en que la cápsula empieza a contraerse. Cosa que ocurre en cerca del diez por ciento de los casos. Entonces aprieta la silicona, el seno se endurece, cambia de forma, se arruga y produce dolor. El hablaba y yo no podía dejar de calcular.

-¿Diez por ciento para las dos, o diez por ciento para cada una? -pregunté.

El levantó la vista del papel. Me miró como a un animal extraño.
-Nunca me habían hecho esa pregunta -dijo. Se acomodó los anteojos.

Agregó: -Diez para cada una.

-Entonces la probabilidad es del veinte -contesté.

El médico puso cara de asombro. Apoyó sobre el escritorio el bolígrafo con el que
había estado escribiendo, y dijo: -Usted no se va a operar nada.

Salí de ahí orgullosa de mis dos pequeños senos. Sólo si alguna vez pierdo uno volveré a ver a ese doctor.

Ahora bien, cómo será que quien narra la historia concluye que en realidad en un 20% de los casos la cosa se complica (o se encapsula). No lo veamos como una mera suma, analicémoslo desde la perspectiva de las probabilidades.Y si el dato del doc era 10% de pacientes y no 10% de lolas? a una pobre muy desgraciada se le podrían encapsular las dos, no? podríamos pensar que se encapsule la derecha o la izquierda son eventos mutuamente excluyentes?...mmm me quedo pensando...y calculando...uds que opinan?

lunes, 4 de mayo de 2009

El grosero error de calculo

¡¡Hola!!

Leyendo el diario Pagina 12, encontramos una nota del Dr. Adrián Paenza -¿lo conocen?- donde plantea un problema que surgió cuando se hicieron las patentes de los autos en la Argentina.


La nota lleva el titulo “El grosero error de calculo”, y viene muy bien justo ahora que estamos transitando por la Unidad 3 !!!

Bueno, les dejamos la nota para que lo lean, al final de este post dejamos unas preguntas para reflexionar…

" En la Argentina, hasta hace algunos años, los autos tenían en las “chapas patentes” que los identificaban una combinación de una letra y luego seis o siete números.
La letra se utilizaba para distinguir la provincia. El número que seguía identificaba el auto.


Por ejemplo, una “chapa patente” de un auto radicado en la provincia de Córdoba era así:


X357892


Y uno de la provincia de San Juan,


J243781

Los de la provincia de Buenos Aires y los de la Capital Federal comenzaron a presentar un problema. Como el parque automotor superaba el millón de vehículos, se utilizaba –aparte de la letra B para Buenos Aires y C para la Capital– un número que ahora consistía de siete dígitos.

Por ejemplo, se podían ver por la calle autos con patentes como éstas:

B1793852


O bien:


C1007253

Es decir, se necesitaba “empequeñecer” al número después de la letra (que indicaba a “qué millón” pertenecía el auto) porque ya no había más espacio disponible.


Toda esta introducción es para presentar la “solución” (?) que se encontró... y el ERROR GROSERO que se cometió.

La idea fue cambiar todo el sistema de patentamiento de vehículos del país y utilizar tres letras y tres dígitos.


La idea era conservar la primera letra como identificatoria de la provincia y aprovechar que, como el número de letras en el alfabeto es mayor que el número de dígitos, se tendría la cantidad deseada de “patentes” para resolver el problema.


Por ejemplo patentes posibles serían:


NDC 378


O bien:


XEE 599


Ahora bien. Estaba todo listo para empezar el “re-patentamiento”, cuando apareció un problema. Pero antes de exhibir cuál fue, quiero invitarlo a pensar (conmigo) cuántas patentes se pueden escribir de esa forma.

Piense en la información que viene en una “chapa patente”: se tienen tres letras y tres números.

Pero como se pretendía que la primera letra estuviera fija para cada provincia, en realidad, hay SOLAMENTE dos letras y tres números con los que “jugar”.


El alfabeto castellano, excluyendo la letra “ñ”, tiene veintiséis letras. ¿Cómo hacer para contar los pares diferentes que se pueden formar? En lugar de mirar la respuesta que yo voy a escribir más abajo, piense (un poco) sola/o.


Una ayuda: los pares podrían ser


AA, AB, AC, AD, AE, AF, ...., AX, AY, AZ (o sea, hay 26 que empiezan con la letra A).
Luego, seguirían (si los pensamos ordenadamente)BA, BB, BC, BD, BE, .... , BX, BY, BZ (otra vez veintiséis, que son los que empiezan con la letra B).

Podríamos ahora escribir los que empiezan con la letra C y tendríamos otros veintiséis. Y así siguiendo. Entonces, por cada letra para empezar, tenemos 26 posibilidades para aparear. O sea, hay en total, 26 x 26 = 676 pares de letras.


Ahora bien. Ya hemos contabilizado todas las combinaciones posibles de tres letras. La primera identifica la provincia, y para las dos siguientes tenemos 676 posibilidades.


Ahora, nos falta “contar” cuántas posibilidades tenemos para los tres números. Pero esto es más fácil. ¿Cuántas ternas se pueden formar con tres números? Si uno empieza con la terna 000


y sigue, 001, 002, 003,... hasta llegar a 997, 998, 999... el total es entonces 1000 (mil) (¿entiende por qué es mil y no 999?) (si quiere pensar sola/o, mejor. Si no, piense que las ternas comienzan en el “triple cero”).


Bien. Ya tenemos todas las herramientas que necesitamos.Cada provincia (luego, eso fija la primera letra) tiene 676 posibilidades para las letras y 1000 posibilidades para las ternas de números. En total, entonces, hay ¡¡676.000!! combinaciones.

Como usted advierte, este número hubiera sido suficiente para algunas provincias de la Argentina, pero no para las más pobladas, y mucho menos con la idea de resolver el problema que había originado todo el cambio.


¿Qué solución encontraron entonces, luego de haber hecho la campaña para “modernizar” el patentamiento y “actualizar” la base de datos del parque automotor?


Tuvieron que “liberar” la primera letra. En ese caso, cuando ya no hay restricción para la primera letra (que no necesita estar asociada a una provincia) hay entonces 26 posibilidades más para cada una de las 676.000 combinaciones de los “cinco” lugares restantes (las dos letras y los tres dígitos).


(Para entender esto: tome una de las 676.000 combinaciones posibles. Agrégueles la letra A al principio. Ahora, tome las mismas 676.000 y agrégueles la letra B al principio. Como se ve, ahora uno ha duplicado el número de “patentes”. Si uno ahora agrega la letra C al principio, triplica el número. Si sigue con este proceso y va utilizando cada una de las 26 letras del alfabeto, encuentra que ha multiplicado por 26 las posibilidades que tenía antes.)


Luego, el número total es


26 x 676.000 = 17.576.000


Ahora sí, con más de 17 millones de “chapas patentes” disponibles, no hay más conflictos..., al menos, en el futuro inmediato (dentro de cinco años, hablamos nuevamente). Pero lo peor es que ya no se sabe a qué provincia pertenece cada auto (como se pretendía en un principio). Por último: ¿hubo algún responsable de un error tan grosero? ¿Quiénes fueron los que hicieron las cálculos iniciales que ocasionaron semejante aberración? "


¿Que les pareció? ¿con qué temas de la Unidad Nº3 podríamos relacionar? ¿Qué conceptos podríamos aplicar con este tipo de problema? ¿notaron que no utilizo ninguna formula?

fuente: http://www.pagina12.com.ar/diario/contratapa/index-2007-07-05.html

martes, 7 de abril de 2009

Cuidado con los Graficos de Torta en tres dimensiones¡¡¡

Hola¡¡ hoy en dia los distintos soft que producen gráficos estadísticos, poseen una variedad de graficos impresionantes, mezclando colores, dimensiones, perspectivas, diseños, etc, que hacen de los mismos un medio visual esteticamente deslumbrantes, pero no podemos olvidar que detras de esa imagen linda, hay datos, y que la idea inicial al utilizar graficos es presentar la información resumida, resaltando los resultados mas significativos, y si al mirar el grafico, la información es confusa, no logramos lo que queríamos.
A continuación mostramos un ejemplo encontrado en la siguiente dirección: http://www.seh-lelha.org/graficos.htm.
*******************************************************************
En la tabla siguiente se presentan los datos procedentes de un estudio real, correspondientes al nivel cultural de 881 pacientes diabéticos, atendidos en régimen ambulatorio.
En la torta que vemos más abajo se han representado los datos de esa tabla utilizando como lamentablemente es habitual tres dimensiones. No sé qué le parecerá a ud lector, pero a mí, si me fijo en el sector verde (Estudios primarios incompletos) y marron (Sin estudios), me parece que el sector marron es algo más grande que el verde, lo que está en clara contradicción con los datos de la tabla. Les aseguro que el gráfico no está "amañado", me he limitado a capturar la pantalla del excel. Prueben con su programa favorito. El problema óptico radica en dónde coloquemos cada sector.

Fíjense en cambio en el diagrama de barras de la siguiente figura. Ahora sí se está reflejando adecuadamente los datos en el gráfico y nos permite establecer relaciones visuales fiables entre ellos.








jueves, 19 de marzo de 2009

Conceptos Introductorios de Estadística

Hola a todos¡¡ Ya que comenzamos trabajando con conceptos introductorios de Estadística, sería interesante verlos en un contexto a todos juntos.

Encontramos este interesante trabajo de investigación:
“Uso de herramientas de búsqueda de información científica en la Web por profesionales de salud en una universidad venezolana. Un estudio Transversal.” Por Espinoza, Norelkys, Rincón, Angel G., Chacín, Belkys de la Universidad de Los Andes (ULA) Venezuela.

Aquí el resumen para que se hagan una idea de las cuestiones abordadas.


Resumen
El creciente uso de bases de datos en todas las áreas del conocimiento ha producido importantes cambios en la práctica de la ciencia. Estas bases de datos permiten efectuar una búsqueda más eficiente acerca de investigaciones, realizadas sobre un tema en particular, y publicadas en revistas científicas especializadas e indizadas. Es por ello que este trabajo busca conocer las estrategias de búsqueda de información científica empleadas por los profesores de las facultades de ciencias de la salud de la Universidad de Los Andes (ULA), Venezuela. Este estudio de tipo transversal, fue efectuado específicamente en las facultades de Medicina, Odontología y Nutrición en el año 2005. A pesar de que la mayoría de los Profesores de la ULA se consideraba “buenos” o “muy buenos” en cuanto a sus competencias en el uso de Internet, se determinó que 71% de los mismos utiliza motores de búsqueda generales para localizar información científica, no obstante la calidad del contenido, mientras que sólo un 29% usa exclusivamente las bases de datos especializadas en salud: Medline, Lilacs, Cochrane y otras. También se encontró que estos profesores consideran que las principales dificultades para la obtención del artículo completo son el costo y el desconocimiento acerca de la forma de obtenerlo. Se concluye que los profesores universitarios desconocen las herramientas ideales para obtener información científicamente confiable, de lo cual podemos poner en tela de juicio la calidad de la documentación como base de su actualización y futuras investigaciones.


Rescatamos del desarrollo del trabajo el apartado “Materiales y Métodos” el cual transcribimos a continuación (los subrayados son nuestros), para trabajar a la luz de los conceptos que estuvimos viendo.

MATERIALES Y MÉTODOS
Este estudio descriptivo, de tipo transversal, fue efectuado específicamente en las Escuelas de Medicina, Odontología y Nutrición de la Universidad de Los Andes en el año 2005.
Se tomó una muestra representativa al azar de 38 profesores activos. Sin embargo, para efectos de este estudio fueron excluidos los profesores adscritos al Departamento de Investigación de la Facultad de Odontología, por ser los autores de esta investigación.
A los sujetos seleccionados se les aplicó una encuesta cerrada (ver anexo 1), aplicada por los propios investigadores, la cual contempló el conocimiento en el manejo y búsqueda de la información científica, sitios de acceso y dificultades que presentaban a la hora de recuperar los artículos completos.
Se registraron las siguientes variables: edad, género, profesión, escalafón, grado académico, años e servicio en la ULA y se determinó la frecuencia de búsqueda de información científica, erramientas de búsqueda utilizadas por los docentes, capacitación en el uso de las nuevas ecnologías, razones que los motivan, limitaciones en el acceso a la información, entre otros.
Posterior a la recolección de datos, se utilizó un programa para procesamiento estadístico (SPSS 7.5) a fin de crear una base de datos, para analizarlos y una vez procesados se presentaron en forma de tablas de frecuencias, gráficos de barras y sectores, calculando los estadísticos descriptivos básicos. Adicionalmente se crearon tablas de contingencia para comparar los esultados en las distintas respuestas.

(Pueden acceder al trabajo completo haciendo clic aquí.)

A partir de lo anterior, ¿Por qué los autores hablan de un “estudio descriptivo”? ¿Qué significa que sea transversal? ¿Cuál es la población objeto del estudio? ¿Es finita o infinita? ¿Cuál es la muestra? ¿Qué significa que la hayan seleccionado “al azar”? ¿Qué significa que sea “representativa”, representativa de qué? ¿Por qué creen que los autores fueron excluidos de la muestra? ¿Como se denominarían estadísticamente cada uno de los sujetos seleccionados? ¿Qué es una encuesta cerrada? ¿Cómo clasificarías a las variables que se relevaron?
Esperamos sus aportes en los comentarios, no hace falta responder a todas las preguntas, por lo menos a 2 o 3 cada uno así pueden participar todos, no vale repetir!!

Luego seguiremos trabajando con los resultados gráficos de la misma investigación.