Sie sind auf Seite 1von 85

587. ... a decir en las mismas circunstancias. 3) La significacin estadstica y la mdica, econmica, lingstica, etc, son independientes.

586. ... de la significacin estadstica. 2) Significativo, en Estadstica, significa que lo que decimos muy posiblemente lo volveramos ...

585. Muchos das sin decir ni po. Tres frases a modo de recopilacin de este Curso de Estadstica: 1) La Estadstica es la ciencia ...

584. ...las usa un operario y las otras dos mquinas las usa el otro operario. Para ser cruzados cada operario debera usar las cuatro.

583. Tenemos dos factores: mquina (con cuatro niveles) y operario (con dos niveles). Y estn anidados. No estn cruzados. Dos mquinas ... 22 Mar

582. Tenemos cuatro tipos de mquinas y dos operarios. El primer operario trabaja en las mquinas 1 y 2, el segundo en la 3 y la 4. 22 Mar

581. Supongamos que queremos ver la influencia que tienen, en los resultados de calidad de un producto, la mquina usada y el operario.

580. Dos factores estn anidados (uno dentro de otro) cuando los niveles de uno se combinan, jerrquicamente, entre los niveles del otro. 18 Mar

579. Son dos factores cruzados porque se combinan todos los niveles de un factor con todos los niveles del otro factor, como hemos visto. 18 Mar

578. Para simplificar supongamos que se trata a una nica dosis, por eso los niveles por factor son nicamente dos: ausencia y presencia. 18 Mar

577. ...otros slo con ARA II y, finalmente, un grupo de pacientes es tratado con los dos antihipertensivos al mismo tiempo. 18 Mar

576. ...niveles son ausencia y presencia. Y se cruzan: o sea, unos pacientes son tratados con placebo (sin nada), otros slo con IECA, ... 18 Mar

575. Supongamos que en un estudio clnico ensayamos dos tipos de antihipertensivos: un IECA y un ARA II. Cada uno es un factor y sus dos ... 18 Mar

574. Dos factores estn cruzados cuando todos los niveles de un factor se cruzan con todos los niveles del otro factor. 18 Mar

573. Cuando tenemos dos o ms factores stos pueden estar, entre s, dos a dos, cruzados o anidados. 18 Mar

572. El ANOVA puede tener uno, dos, tres, cuatro, etc. factores. Sin embargo, lo ms habitual es tratar con un nmero reducido de factores. 18 Mar

571. ...cuando los niveles que estudias es una muestra de niveles. Lo que te interesa, realmente, es la poblacin de niveles, no la muestra. 17 Mar

570. Un factor puede ser fijo o aleatorio. Fijo es cuando los niveles que estudias son los nicos niveles que te interesan. Aleatorio es ... 17 Mar

569. Otro ejemplo: estamos comparando en un estudio clnico cuatro frmacos diferentes. Ahora tenemos el factor frmaco y cuatro niveles. 17 Mar

568. ...de insecto en tres localidades distintas: diramos que trabajamos con el factor localidad y que ese factor tiene tres niveles. 17 Mar

567. A esos grupos generados por un factor se les denomina "niveles del factor". Pe: imaginemos que estamos comparando el peso de un tipo... 17 Mar

566. El primero de esos conceptos es el de factor. Un factor en ANOVA es una variable cualitativa que genera una serie de grupos a comparar. 17 Mar

565. Hemos de ver una serie de conceptos bsicos que nos permitirn conocer el vocabulario que maneja el lenguaje del ANOVA. 17 Mar

564. ...esto es fcilmente generalizable a la comparacin de ms de dos grupos, porque el mecanismo de accin es exactamente el mismo. 14 Mar

563. En los tweets 463, 464 y 465 ya he hablado y dibujado cmo influyen estos tres elementos en las comparaciones de dos grupos, pero ... 14 Mar

562. Las tcnicas de comparacin siempre analizan estos tres elementos: dispersin, diferencias de medias y tamao de muestra. 14 Mar

561. ...pero tambin las diferencias de medias entre los grupos y, tambin, por supuesto,como siempre en Estadstica, el tamao de muestra. 14 Mar

560. En las tcnicas ANOVA se comparan siempre las medias y se hace a travs de un contraste de hiptesis donde se analiza la varianza, ... 14 Mar

559. ANOVA es un acrnimo Analysis of variance: ANlysis Of VAriance. Pero el nombre de anlisis de la varianza no es muy afortunado. Veamos. 14 Mar

558. Ahora toca escribir sobre las comparaciones de ms de dos grupos. Entraremos as en las tcnicas estadsticas denominadas ANOVA.

557. ...H1: Mediana1<>Mediana2. No es que esto represente una gran diferencia, pero hay que tenerlo presente. 4 Mar

556. Una peculiaridad de estas dos tcnicas es que el contraste no es sobre la media sino sobre la mediana. O sea: H0: Mediana1=Mediana2,... 4 Mar

555. ...significa que cuesta ms rechazar la hiptesis nula. Tienen menor capacidad de detectar diferencias. 4 Mar

554. Esta mayor versatilidad la pagan con menor potencia: Son tcnicas ms conservadoras que las denominadas paramtricas, lo que ... 4 Mar

553. Son tcnicas "todo terreno". Aplicables en muchas ms situaciones. Al no precisar una determinada distribucin son ms verstiles. 4 Mar

552. Estas tcnicas slo precisan la continuidad de las variables, que se trate de variables con muchos valores potenciales posibles. 4 Mar

551. Observemos que se trata de tcnicas donde las variables no necesitan seguir una distribucin concreta: ni una dicotmica ni una normal. 4 Mar

550. El test de Mann-Whitney y el de los signos son tcnicas llamadas no paramtricas. Estas tcnicas precisan pocas condiciones previas.

549. ...siguiendo una serie de pasos (muestras independientes o relacionadas, normalidad, varianzas) hasta decidir qu tcnica aplicar. 22 hours ago

548. Si la variable es dicotmica ya hemos visto que el test a aplicar es el de proporciones. Si la variable es continua, debe irse ... 23 hours ago

547. Con esto tenemos, pues, explicado todo el mapa trazado en el esquema del protocolo expuesto en el tweet 508. 23 hours ago

546. Si el p-valor es menor que 0,05 rechazaremos H0, aceptaremos H1 y aplicaremos el test de la t de Student de varianzas desiguales. 23 hours ago

545. Si el p-valor es mayor que 0,05 mantendremos la hiptesis de iguadad y aplicaremos el test de la t de Student de varianzas iguales. 23 hours ago

544. El contraste es: H0: DE1=DE2, H1: DE1<>DE2. El test ms conocido y usado para resolver este contraste es el denominado test de la F. 23 hours ago

543. El test tiene la estructura de siempre: presuncin de igualdad. De igualdad,en este caso, de varianzas o de desviaciones estndar (DE). 23 hours ago

542. Para decidir si aplicar la t de Student de varianzas iguales o la de varianzas desiguales hay que aplicar un test sobre las varianzas. 23 hours ago

541. ...el test de Mann-Whitney. Y si hay normalidad y, por lo tanto, estamos en el apartado 1ai necesitamos realizar un nuevo paso. 27 Feb

540. Retomando el tweet 534, en muestras independientes, si no hay normalidad de las dos muestras (estamos, pues, en 1aii) aplicaremos ... 27 Feb

539. ...aplicaremos el test de la t de Student de datos apareados (o relacionados) y en el segundo caso aplicaremos el test de los signos. 27 Feb

538. Si sigue la normal estaremos en 1bi y si no la sigue estaremos en 1bii. En el primer caso, siguiendo el protocolo del tweet 508, ... 27 Feb

537. La normalidad se contrasta en esa muestra de restas obtenida a partir de los valores de las dos muestras relacionadas. 26 Feb

536. ...de los que se tienen dos valores: uno en cada muestra, se hacen las restas de los valores por individuo, creando una nica muestra. 26 Feb

535. En las muestras relacionadas se suele calcular la muestra resta a partir de las dos muestras. Como son una serie de individuos ... 26 Feb

534. En las muestras independientes, para seguir por la va 1ai las dos muestras deben seguir la normalidad. Si no es as seguimos por 1aii. 25 Feb

533. Los tests de bondad de ajuste a la normal ms usados son el de la ji-cuadrado, el de Kolmogorov-Smirnov y el de Shapiro-Wilks. 25 Feb

532. ...la poblacin de donde se ha tomado la muestra tenga una variabilidad en forma de campana de Gauss. 25 Feb

531. En cambio, si la p es inferior a 0,05 debemos rechazar la normalidad: la estructura de los datos no nos permiten pensar que ... 25 Feb

530. Por lo tanto, en un test de Bondad de ajuste a la normal con un p-valor superior a 0,05 mantendremos la suposicin de normalidad. 25 Feb

529. Todas ellas tienen la misma estructura: H0: Normalidad. H1: No normalidad. Hay, pues, en Estadstica, presuncin de normalidad. 25 Feb

528. Para la comprobacin de la normalidad de una muestra existen diferentes tcnicas de "Bondad de ajuste a la normal". 25 Feb

527. Para decidir si la variabilidad de una muestra sigue una determinada distribucin existen las tcnicas denominadas "Bondad de ajuste". 25 Feb

526. Sera interesante revisar los tweets 69-101 para entender mejor la nocin de comprobacin estadstica de la normalidad de una muestra. 25 Feb

525. El siguiente paso que nos llevar al apartado 1ai, 1aii, 1bi o 1bii es la comprobacin de la normalidad, o no, de ambas muestras. 24 Feb

524. En el caso, pues, de las dos facultades estaramos en el 1a del protocolo y en el caso de una nica facultad estaramos en el 1b. 24 Feb

523. En este caso estaramos ante muestras relacionadas. De unos mismos individuos tenemos dos medidas y queremos ver si hay diferencias. 24 Feb

522. ...al empezar sus estudios universitarios y al final de esos mismos estudios. Y queremos comprobar si ha habido un cambio en ese nivel. 24 Feb

521. ...dos facultades, las estudiadas, fueran unos mismos estudiantes de una facultad (Pe: Medicina) que tenemos el nivel de ingls ... 24 Feb

520. En este caso es claro, son dos muestras con individuos distintos, son muestras independientes. Pero, imaginemos que en lugar de ser ... 24 Feb

519. ...independientes o relacionadas. Aqu se trata de ver si los individuos de las dos muestras son los mismos o si son distintos. 24 Feb

518. ...del protocolo del tweet 508. Y ahora no tenemos todava el test a realizar, sino que debemos decidir si las muestras son ... 24 Feb

517. ...ante una variable claramente continua. Hay muchos valores posibles potencialmente entre 0 y 10. Estamos, ahora, en el apartado 1 ... 24 Feb

516. Si queremos ver el nivel de ingls de los estudiantes en esas mismas facultades mediante un examen con notas del 0 al 10, estaremos ... 24 Feb

516. ... nos dir si, por el tamao de muestra que tenemos, podemos considerar que esa diferencia del 10% es o no significativa. 24 Feb

515. ...Test de proporciones. En ste, como siempre, en la H0 tendremos la igualdad (p1=p2) y en la H1 la desigualdad (p1<>p2). Y la p ... 24 Feb

514. ..."ser mujer" es una variable dicotmica. Por lo tanto, estamos en el punto 2 del protocolo del tweet 508. Deberemos aplicar un ... 24 Feb

513. Es esta diferencia estadsticamente significativa? Debemos aplicar una tcnica estadstica para saberlo. Es claro que la variable ... 24 Feb

512. Tomaremos dos muestras, una de cada facultad, y veremos qu proporcin de mujeres hay en cada muestra. Pe: obtenemos: 60 y 50%. 24 Feb

511. Supongamos que queremos ver si la proporcin de estudiantes mujeres en una facultad de Medicina y en una de Econmicas es distinta. 24 Feb

510. Se trata de ver si continuamos por el apartado 1 2 del protocolo. Si es una variable continua iremos por 1, si es dicotmica, por 2. 23 Feb

509. Veamos el funcionamiento de este protocolo de actuacin: Lo primero es ver si estamos ante una variable continua o dicotmica 23 Feb

508. Protocolo de decisin entre tcnicas de comparacin de dos grupos: http://t.co/WsyXaEH 23 Feb Un

507. ...elegir la ms ajustada al caso optimiza el funcionamiento de la propia tcnica y su fiabilidad. 23 Feb

506. ...trascendental (elegir entre H0 y H1) en manos de una maquinaria matemtica, como es una tcnica estadstica, por lo que ... 23 Feb

505. ...la propia maquinaria de la tcnica y que, de esta forma, sus resultados sean ms fiables. Pensemos que dejamos una decisin ... 23 Feb

504. ...de actuacin, de decisin. Es importante siempre elegir bien la tcnica ms adecuada en cada circunstancia para afinar as ms ... 23 Feb

503. Voy a trazar un mapa de las tcnicas ms usuales de comparacin de dos grupos y lo voy a hacer estructurado a modo de protocolo ... 23 Feb

502. Es muy importante ver con detalle cmo elegir, en una determinada situacin concreta, la tcnica adecuada entre las muchas disponibles. 23 Feb

501. En los prximos tweets vamos a ver tcnicas estadsticas concretas de comparacin de dos grupos.

500. Una buena forma de celebrar el tweet 500 de este curso es dar un ndice de lo hecho hasta ahora:jaumellopis.blogspot.com/2011/02/indice
5 minutes ago

499. ...dispersin como de la diferencia de medias que sea relevante captar. Y si no disponemos de esos valores no sabremos la n necesaria.
21 hours ago

498. En todo caso lo que importa es entender el concepto de eleccin de la n necesaria, captando que esta eleccin depender tanto de la ...
21 hours ago

497. ...alterar considerablemente el valor propuesto de la n. Pe: si en lugar k=2 tomramos el valor k=2,25 la n pasara de ser 16 a ser 20.
22 hours ago

496. ...deberamos tomar otro valor. Se ha escrito mucho sobre los valores posibles de esta k. Y pensemos que un ligero cambio de k puede...
21 Feb

495. Deca all que podamos tomar k como 2; pero si manejramos ms nivel de exigencia en cuanto a las posibilidades de acertar ...
21 Feb

494. Llegados a este punto es interesante retomar el tweet 474 donde hablaba de la constante k de la ecuacin que venimos usando.
21 Feb

493. ...detectar esta diferencia de 1g de aumento de hemoglobina que es el mnimo aumento que consideramos valioso mdicamente.
30 seconds ago

492. Entonces el tamao de muestra ideal para trabajar es: n=422/11=16. Con este tamao de muestra y con esta dispersin podremos ...
3 minutes ago

491. Entendemos que a partir de un aumento de 1g ya podemos entender que el frmaco es interesante. Sabemos por estudios previos que DE=2.
8 minutes ago

490. Un ejemplo: Estamos estudiando un frmaco para aumentar la Hemoglobina a un grupo de pacientes de una patologa que tienen media 10g.
11 minutes ago

489. ...una diferencia que tiene significacin estadstica pero no la mdica, econmica, etc, en realidad nos ha servido para muy poco.
1 minute ago

488. ...que comentamos en los tweets 393 y 394. Es lgico fijar una diferencia mnima, porque si la muestra es muy grande pero detecta ...
3 minutes ago

487. Respecto a la diferencia de medias mnima a detectar (dm), esto tiene que ver con la significacin mdica, econmica, etc, ...
6 minutes ago

486. ...una pequea muestra previa, una premuestra, que nos permita hacer una previsin de la dispersin que tenemos en el estudio.
13 minutes ago

485. El conocimiento de lo que todava no conocemos lo debemos suplir por informacin de otros estudios previos o por una muestra piloto,...
16 minutes ago

484. Esta paradoja es importante: para elegir un tamao de muestra ideal necesitamos saber cmo ser la dispersin de esa futura muestra.

21 minutes ago

483. ...qu dispersin podemos preveer que tendremos en la futura muestra. Necesitamos saber, pues, cmo ser la muestra que an no tenemos.
26 minutes ago

482. O sea, a la hora de elegir un tamao de muestra debemos saber qu diferencia de medias mnima nos interesa detectar entre grupos y ...
33 minutes ago

481. Dicho de otra forma: la n deber estar relacionada de forma directa con la dispersin y de forma inversa con la diferencia de medias. 1 hour ago

480. Si necesitamos detectar una dm pequea deberemos tener una muestra grande.Si la dm que precisamos es amplia la muestra podr ser menor. 2 hours ago

479. Otra forma de expresar esa ecuacin: n=4dede/dmdm. Hagamos afirmaciones a partir de ella: Si hay mucha dispersin necesitamos ms n. 10 hours ago

478. Y en la ecuacin dm=2de/raiz(n) la parte derecha de la igualdad es esa expresin de dos veces el error estndar. 10 hours ago

477. Adems se vea en esos tweets la nocin de dos veces el EE para la construccin del intervalo de confianza del 95%. 10 hours ago

476. Si se revisan los tweets del 121 al 146, se podr recordar la nocin de Error estndar (EE), cuya expresin es EE=DE/raiz(n). 11 hours ago

475. Por lo tanto, la ecuacin quedara dm=2de/raiz(n). Vamos a reflexionar algunas cosas importantes que nos genera esta igualdad. 11 hours ago

474. Esta constante k puede tener distintos valores en diferentes circunstancias, pero un valor que podemos establecer como bueno es 2. 11 hours ago

473. Una expresin posible de esa ecuacin que liga dm, de y n es la siguiente: dm=kde/raiz(n). Donde k es una constante. 13 hours ago

472. Expreso la dispersin mediante "de" porque ya sabemos que la forma ms habitual de medir la dispersin es la desviacin estndar. 15 hours ago

471. La diferencia de medias (dm), la dispersin (de) y el tamao muestral (n) mantienen una relacin que puede expresarse en una ecuacin. 15 hours ago

470. Es una de las preguntas que con ms frecuencia nos hacen a los estadsticos: "Cul es el tamao de muestra ideal para mi estudio?".

16 hours ago

469. Todo esto que estamos viendo nos ha preparado bien el terreno para hacer unas reflexiones acerca de la eleccin del tamao de muestra. 16 hours ago

22 hours ago

468. Las tcnicas estadsticas, ante dos muestras, analizan los tres factores conjuntamente y acaban dando un veredicto mediante un p-valor. 23 hours ago

467. ...comparacin de medias se decidan o por mantener la hiptesis nula de igualdad o por pasar a la alternativa de desigualdad de medias. 23 hours ago

466. Hemos visto, pues, en estos tres tweets, cmo influyen individualmente estos tres factores para que las tcnicas estadsticas de ... 23 hours ago

465. Y veamos, finalmente, cmo influye el tamao de muestra:jaumellopis.blogspot.com/2011/02/tamano 23 hours ago

464. Veamos, ahora, la influencia de la dispersin:jaumellopis.blogspot.com/2011/02/disper 23 hours ago

463. Veamos la influencia de la diferencia de medias:jaumellopis.blogspot.com/2011/02/difere 23 hours ago

462. Y a travs de ese anlisis de la diferencia de medias, de la dispersin y del tamao de muestra la tcnica nos proporciona un p-valor. 19 Feb

461. ...a la hora de dar un p-valor. Porque cada tcnica estadstica de comparacin analiza, siempre, esos tres factores conjuntamente. 19 Feb

460. Los otros dos factores sern iguales en los tres experimentos de cada dibujo. De esta forma podremos ver el papel de cada factor ... 19 Feb

459. En cada grfico veremos tres experimentos diferentes entre los cuales nicamente uno de los tres factores presenta diferencias. 19 Feb

458. En cada dibujo veremos la influencia de uno de estos tres factores a la hora de decidir si la diferencia es o no significativa. 19 Feb

457. Para ello vamos a ver posibles situaciones experimentales con muestras dibujadas sobre la recta real. Voy a mostrar tres dibujos. 19 Feb

456. Vamos a ver el papel que juega cada uno de esos tres factores y la relacin que hay entre ellos a la hora de delimitar la significacin

19 Feb

455. Tres factores juegan, siempre, un papel nuclear en esas tcnicas: la diferencia de medias, la dispersin y el tamao de muestra. 19 Feb

454. Veremos a partir de ahora diferentes tcnicas para comparar dos grupos. Todas ellas funcionan de una forma muy similar. 19 Feb

453. Lo complejo es encontrar la significacin de esa diferencia. Para encontrarla necesitamos de una tcnica estadstica que nos d una p. 18 Feb

452. Al comparar las medias de dos grupos a travs de sus respectivas muestras ver el signo y la magnitud de la diferencia es trivial. 18 Feb

451. ...son iguales mientras no se demuestre lo contrario. Tenemos, en Estadstica, pues, presuncin de igualdad. 15 Feb

450. En el mundo de la Estadstica hay presuncin de igualdad. Las medias, las desviaciones estndar, las medianas, los porcentajes, ... 15 Feb

449. Como siempre en la hiptesis nula (H0) tenemos lo que podemos decir antes de empezar: las medias son iguales. No hay diferencias. 15 Feb

448. Observemos que el contexto es otro pero el procedimiento estadstico ser el mismo: un contraste de hiptesis: (H0: m1=m2, H1: m1<>m2). 15 Feb

447. ...la significacin. Mediante ella podremos saber si aquella diferencia es fiable o si podra ser un efecto del azar del muestreo. 15 Feb

446. ...ha obtenido un promedio mejor. El valor absoluto de la resta nos dar la magnitud. Pero, como siempre en Estadstica, necesitamos... 15 Feb

445. De momento nos centraremos en comparar medias. Pues bien, si restamos las dos medias tendremos un signo, que nos dir qu grupo ... 15 Feb

444. Pero hay ms: comparar las desviaciones estndar o comparar los porcentajes de alumnos que en cada grupo tienen ms que un 7, p.e. 15 Feb

443. Si queremos comparar los dos grupos lo podemos hacer de formas distintas: una posibilidad es hacerlo comparando las medias muestrales. 15 Feb

442. ...ensayando dos mtodos con finalidad de aplicacin potencial a otros, sus alumnos son,en realidad,una muestra de los alumnos futuros. 15 Feb

441. Alguien puede pensar: si tiene las notas de todos los alumnos de los dos grupo tiene poblaciones, no muestras. Pero como est ... 15 Feb

440. ...un examen comn a todos los exmenes. Tendr, entonces, dos muestras: una de un grupo y otra del otro. Y dos medias muestrales. 15 Feb

439. ...la clsica (como lo ha hecho siempre) y mediante un procedimiento nuevo que l quiere ensayar. Al finalizar el experimento pone ... 15 Feb

438. Supongamos que un profesor de matemticas que tiene dos grupos de estudiantes les explica un tema de dos formas distintas: ... 15 Feb

437. Observemos que eso del signo, de la magnitud y de la significacin ha sido, tambin, el hilo conductor de lo visto en la correlacin. 14 Feb

436. ...en diferentes condiciones que interesa comparar, evaluando el signo, la magnitud y la significacin de sus diferencias. 14 Feb

435. ...se focaliza en grupos de individuos que estn (estudios observacionales) o que se les sita (estudios experimentales), ... 14 Feb

434. ...pero vamos ahora a ver tcnicas de comparacin. Si en las tcnicas de relacin se focaliza en las variables,en las de comparacin... 14 Feb

433. Hasta ahora nos hemos centrado en tcnicas de descripcin y de relacin. Volveremos a ver, ms adelante, ms tcnicas de stas, ... 14 Feb

432. ...a unos resultados as nicamente es posible llegar o mediante estudios multicntricos o de meta-anlisis, como hemos comentado. 9 hours ago

431. Ahora esta diferencia entre un 7% y un 6% entre los dos protocolos comparados tiene SE y SM. Pero, en circunstancias como estas, ... 9 hours ago

430. Observemos que ahora el 1 no est en el intervalo de confianza. Ahora la Estadstica apuesta por pensar en una diferencia fiable. 9 hours ago

429. La OR sigue, lgicamente, siendo 1,17, el intervalo del 95% (1.05, 1.32) y la p 0,004. Ahora es estadsticamente significativo. 9 hours ago Un

428. Supongamos que tenemos ahora: M: (P1: 700, P2: 600) V: (P1: 9300, P2: 9400). Ahora hemos multiplicado por 100.La muestra es muy grande. 9 hours ago Un

427. El intervalo de confianza del 95% es, ahora, (0.86, 1.68) y la p 0,36. Seguimos igual, por lo tanto. Aumentemos el tamao muestral. 9 hours ago Un

426. Con esta muestra la OR segue siendo la misma (1,17) porque lo nico que hemos hecho es multiplicar por 10 cada valor. 9 hours ago

425. Vamos a ver qu pasara si tuviramos un tamao de muestra superior.Supongamos la siguiente: M: (P1: 70, P2: 60) V: (P1: 930, P2: 940). 9 hours ago Un

424. P1 tiene un 7% de muertes y, en cambio, P2 un 6%. Y decamos que para un cardilogo la diferencia es relevante. Pero no tiene SE. 9 hours ago

423. Recordemos los datos: M: (P1: 7, P2: 6) V: (P1: 93, P2: 94). La OR es 1,179, el intervalo del 95% (0.38, 3.64) y el p-valor 0,77. 10 hours ago Un

422. Volvamos a los datos del tweet 381 para ver, en este caso, el beneficio que obtenemos de aumentar el tamao muestral para alcanzar SE. 10 hours ago

421. ...diferentes centros en un nico estudio y en el meta-anlisis coordinando en un estudio descoordinados estudios paralelos. 11 hours ago

420. En ambos casos la finalidad es aumentar el tamao de muestra para encontrar, as, SE. En los estudios multicntricos coordinando ... 12 hours ago

419. ...para tener SE, se han desarrollado mucho los estudios multicntricos y un nuevo campo de la ciencia: el meta-anlisis. 12 hours ago

418. Para situaciones de este tipo en las que una pequea diferencia puede tener SM y en las que es necesario grandes tamaos de muestra ... 12 hours ago

417. ...la diferencia y al aumentar la muestra pase ya a ser SE y, por lo tanto, pasemos a una situacin del primer tipo: SE y SM. 12 hours ago

416. ...la muestra la diferencia que antes se vea se disuelve y ya o no existe o es tan pequea que ya no es SM. 2)Que se mantenga ... 12 hours ago

415. Pueden darse dos situaciones al aumentar el tamao de muestra: 1)Que la Estadstica tena razn al ser cautelosa y al aumentar ... 12 hours ago

414. En estos casos la Estadstica claramente slo debe dar una respuesta: Hay que aumentar el tamao de muestra. 13 hours ago

413. Era el caso de la comparacin de protocolos en el tratamiento del infarto de miocardio. Pasar de un 7 a un 6% puede ser SM. 13 hours ago

412. Y ahora el cuarto tipo de situacin, el que ha originado todos estos comentarios. Una situacin, adems, muy frecuente: no SE y SM. 15 hours ago

411. ...apunten que podemos acabar encontrando SE aumentando la muestra pero difcilmente encontremos SM. Insisto: "todo abierto". 15 hours ago

410. ...todo est abierto, que puede pasar, todava, cualquier cosa, que conviene ampliar el estudio aunque los resultados, de momento, ... 15 hours ago

409. ...desde el punto de vista mdico (o econmico o lingstico, etc). Los estadsticos en estas situaciones acostumbramos a decir que ... 15 hours ago

408. El tercer tipo de situacin (no SE y no SM) poco nos dice. Son no fiables los resultados y, adems, lo que vemos promete poco ... 15 hours ago

407. ...sirve para muy poco, si es que sirve, en realidad, para algo. Por lo tanto, suele ser un punto y final de un estudio, habitualmente. 15 hours ago

406. Esto es muy importante tenerlo en cuenta porque a veces pensamos que el objetivo ltimo y nico es la SE. Tener SE pero no SM ... 15 hours ago

405. ...la nefropata de un paciente. Este es una de las muchas situaciones posibles en las que podemos encontrar SE acompaada de no SM. 15 hours ago

404. ...porque ese frmaco tiene sus efectos secundarios que no se compensan por un descenso que en realidad no cambia, en realidad, nada... 15 hours ago

403. Y ahora supongamos que un nefrlogo nos dice que para obtener un descenso promedio de este nivel no compensa tomar ese frmaco ... 16 hours ago

402. ...desde un valor promedio de 425mg/da a un valor de 405mg/da tratndose de un descenso estadsticamente significativo. 16 hours ago

401. Supongamos que un estudio demuestra que un determinado frmaco permite un descenso en la proteinuria, en enfermos de una nefropata,... 16 hours ago

400. ...el que no sean significativos desde el punto de vista mdico implica que es un resultado que no tiene ninguna trascendencia mdica. 16 hours ago

399. El segundo tipo (SE y no SM) implica tambin un final del estudio, habitualmente. La SE implica que los resultados son fiables, pero... 16 hours ago

398. El primer caso (SE y SM) es la situacin ideal: significacin estadstica y mdica. Nada que comentar. Todo perfecto. 16 hours ago

397. El caso de los protocolos para tratar el infarto es del tipo 4: no SE y SM. Pero veamos primero los otros tres casos. 16 hours ago

396. ...con resultados que nos lleven a estas cuatro combinaciones posibles: 1) SE y SM. 2) SE y no SM. 3) no SE y no SM. 4) no SE y SM. 12 hours ago

395. Voy a usar ahora el siguiente cdigo: SE: Significacin estadstica. SM: Significacin mdica. En un estudio nos podemos encontrar ... 12 hours ago

394. ...contexto en el que estamos ahora (la cardiologa), pero esta idea es fcil trasladarla a otros mbitos: econmico, sociolgico,etc. 13 hours ago

393. Esto nos lleva a un tema muy importante: Una cosa es "significacin estadstica" y otra "significacin mdica". Digo mdica por el ... 13 hours ago

392. ...no fueran los que apuntaba el estudio. Esto es lo que significa que algo no sea estadsticamente significativo: que no es fiable. 13 hours ago

391. ...pasar perfectamente que pasramos al P2 y acabramos viendo que al aplicarlo a miles y miles de personas los resultados obtenidos... 13 hours ago

390. ...estadsticamente significativo no podemos decir que el P2 salva ms vidas, porque podra ser fruto del azar del muestreo, podra ... 13 hours ago

389. Y la estadstica est por encima de todo. Es el Tribunal que dicta la ltima sentencia ante unos datos concretos. Y si no es ... 13 hours ago

388. ...infartos salvamos una vida. Esto es relevante desde el punto de vista mdico. Pero el Tribunal estadstico dice: "no significativo". 13 hours ago

387. Los cardilogos que han propuesto el protocolo 2 (P2) pueden pensar: Con el P1 muere un 7%, con el P2 el 6%; o sea, de cada cien ... 13 hours ago

386. ...significativas entre los resultados de los protocolos que estamos comparando. Pero esto nos lleva a un tema muy importante. 13 hours ago

385. Pero tambin podemos llegar a ella a partir del p-valor porque ste es 0,77. Por lo tanto, no podemos decir que haya diferencias ... 13 hours ago

384. ...rechazar la hiptesis nula (OR=1). Observemos que la conclusin del contraste la obtengo a partir de observar el intervalo. 14 hours ago

383. A partir de estos valores la conclusin estadstica es que no hay una relacin entre tipo de protocolo y xito porque no podemos ... 14 hours ago

382. En el P2 mueren 6 y viven 94;o sea, muere el 6%. Ante estos datos la OR es 1,179 y un intervalo de confianza del 95% es (0.38, 3.64). 14 hours ago

381. Supongamos la siguiente tabla de contingencias: M: (P1: 7, P2: 6) V: (P1: 93, P2: 94). En el P1 mueren 7 y viven 93;o sea, muere el 7%. 14 hours ago

380. Seguir la siguiente codificacin: M: Mueren. V: Viven. P1: Protocolo 1. P2: Protocolo 2. 14 hours ago

379. Imaginmonos que se ha hecho una comparacin entre dos protocolos y se ha contabilizado los que han muerto o no. 14 hours ago

378. Ante el tratamiento ante un infarto de miocardio es habitual ensayar comparativamente distintos protocolos de actuacin. 14 hours ago

377. Un mbito mdico donde se usa tambin la Odds ratio (OR) es para comparar dos procedimientos teraputicos. Veamos un caso tpico. 14 hours ago

376. ...hemos visto que una cosa y la otra tienen significados completamente opuestos), interesa tambin la magnitud y la significacin. 16 hours ago

375. ...signo, magnitud y significacin (ver tweet 160). Pues en la OR, de forma paralela, interesa si es mayor o menor que 1 (porque ya ... 16 hours ago

374. Obsrvese que la OR funciona un poco como la correlacin. Decamos de la correlacin que interesaban tres cosas de ella: ... 16 hours ago

373. De nuevo coherencia entre lo que nos dice el p-valor del contraste de hiptesis y lo que nos dice mirar si el 1 est en el intervalo. 16 hours ago

372. ...aunque la OR sea grande (10 en este caso), se trata de un valor no fiable, que puede ser atribuible al azar del muestreo. 16 hours ago

371. ..., adems, observemos que el intervalo contiene al 1. El valor de OR=1 es posible perfectamente. Por esto ante una tabla as ... 16 hours ago

370. El intervalo de confianza del 95% de la OR es, ahora, (0.85, 117.02). Muy amplio, claro. El tamao de muestra es muy pequeo. Pero ... 16 hours ago

369. ... nos dice que este valor de 10 no es significativo. Recordemos que la frontera de la significacin est en el 0,05 y 0,069>0,05. 16 hours ago

368. Tomemos ahora la otra tabla: CA: (E: 5, NE: 4) CO: (E: 1, NE: 8). La OR es tambin 10, el p-valor era, recordmoslo, 0,067; o sea, ... 16 hours ago

367. Es lgico: si el intervalo contiene al 1 es que este valor es posible que sea el real, luego no es significativa la OR calculada. 16 hours ago

366. Hay, por lo tanto, una sintona entre el p-valor del contraste de hiptesis y mirar si intervalo de confianza del 95% contiene al 1. 16 hours ago

365. ...porque la probabilidad de que el verdadero valor sea 1 o menor que 1 es muy pero que muy pequea. 16 hours ago

364. ...el verdadero valor poblacional de OR est entre 4.59 y 21.76. En cualquier caso, por encima de 1. Por eso es significativa esa OR... 16 hours ago

363. En esta tabla un intervalo de confianza del 95% de la OR es el siguiente: (4.59, 21.76). Con un 95% de posibilidades de acertar, ... 16 hours ago

362. Retomemos la tabla: CA: (E: 50, NE: 40) CO: (E: 10, NE: 80), decamos que OR=10 y que el p-valor era 0,0005,por lo tanto significativa. 16 hours ago

361. Intervalo que ser ms estrecho cuanto mayor sea el tamao muestral. Calculemos este intervalo en las dos tablas que estamos manejando. 16 hours ago

360. Pues bien,la OR que calculamos a traves de una muestra expresada en una tabla de contingencias tambin tiene su intervalo de confianza. 16 hours ago

359. ...numerador S, la DE de la variable de trabajo y en el denominador una forma del tamao muestral: su raz cuadrada. 16 hours ago

358. Recordemos que la Desviacin estndar (DE) de la media muestral de una variable normal con DE igual a S era S/raiz(n). En el ... 16 hours ago

357. ...la dispersin de la variable con la que estamos trabajando y en el denominador tenemos, en alguna forma, el tamao de muestra. 16 hours ago

356. ...crea intervalos ms estrechos. La dispersin de una estimacin depende siempre de un cociente donde en el numerador tenemos ... 16 hours ago

355. ...de dos cosas: de la dispersin y del tamao de muestra. La dispersin alta crea intervalos amplios y el mayor tamao muestral ... 16 hours ago

354. ...a travs de un clculo muestral podemos contruir un intervalo de confianza de la estimacin que, en general, depender ... 16 hours ago

353. Vamos a recuperar ahora la nocin de intervalo de confianza. Recordemos que al hacer una estimacin de un valor poblacional ... 16 hours ago

352. El tamao de muestra es decisivo, como siempre. El tamao de muestra en Estadstica es clave. Se entiende?Es muy importante todo esto. 16 hours ago

351. En la muestra de la tabla del tweet 346 el p-valor es 0,067. La primera OR es significativa, la segunda no, an siendo ambas: OR=10. 16 hours ago

350. ...de hiptesis lo comprobamos.El contraste es ahora: H0: OR=0, H1: OR<>0.En la muestra de la tabla del tweet 336 el p-valor es 0,0005. 16 hours ago

349. ...es la diferencia? La significacin, por supuesto. En el primer caso es significativa, en el segundo no. Si hacemos un contraste ... 16 hours ago

348. Por lo tanto, la OR ser la misma. Calculmosla en ambos casos: En el primero es (5/0,5)=10. Y ahora es la misma: 10. Pero, cul ... 16 hours ago

347. ... en el tweet 313. Observemos que es como la trabajada hace poco pero eliminando un cero de las cuatro situaciones posibles. 16 hours ago

346. Pero observemos esta otra situacin: CA: (E: 5, NE: 4) CO: (E: 1, NE: 8). Es una tabla de contingencias de la que ya hemos hablado ... 16 hours ago

345. ...tendremos que pensar que esta exposicin ms bien protege de la adquisicin de tal patologa. 16 hours ago

344. ...querr decir que la exposicin al riesgo acarrea ms proporcin de enfermos y, por el contrario, si la OR es menor que 1 ... 16 hours ago

343. ...los expuestos y los no expuestos. Cuanto ms distinto de 1 sea la OR querr decir que ms relacin hay. Si es mayor que 1 ... 16 hours ago

342. La OR es justo este cociente. Si OR = 1 es que numerador y denominador son iguales y, por lo tanto, el cociente CA/CO es igual entre... 16 hours ago

341. ...estaremos estimando cuntas veces la relacin CA/CO entre los expuestos est contenida en la relacin CA/CO entre los no expuestos. 16 hours ago

340. Si hacemos el cociente CA/CO de los expuestos respecto al CA/CO de los no expuestos; o sea: ((CA/CO) de E) / ((CA/CO) de NE), ... 16 hours ago

339. Esto significa que entre los expuestos hay cinco veces ms CA que CO y entre los no expuestos hay la mitad de CA que de CO 0,5 veces. 16 hours ago

338. Entre los expuestos tenemos un cociente CA/CO de 50/10; o sea, un cociente de 5. Entre los no expuestos este cociente es (40/80) = 0,5. 16 hours ago

337. ...por lo que, lo que digamos ahora lo podemos trasladar al estudio de la relacin entre sexo y una patologa,o a otros casos anlogos. 16 hours ago

336. Veamos la siguiente tabla de contingencias: CA: (E: 50, NE: 40) CO: (E: 10, NE: 80). Observemos que los datos son los del tweet 300,... 16 hours ago

335. Utilizar el siguiente cdigo: casos (CA), controles (CO), expuestos (E) y no expuestos (NE). 23 hours ago

334. ...de los casos y de los controles han estado expuestos y cuntos no. Por ejemplo: cncer de pulmn y exposicin al tabaco (fumador). 8 Feb

333. Si se quiere ver la relacin de esa patologa con un factor concreto o con la exposicin a un determinado riesgo, se separan cuntos... 8 Feb

332. Los estudios Caso-Control analizan individuos que tienen una determinada patologa (Casos) y otros que no la tienen (Controles). 8 Feb

331. ...en Medicina: la Odds ratio (OR). Aunque se est alejado de este mundo, el concepto de OR creo que es muy importante comprenderlo. 8 Feb

330. ...con diferentes ndices que valoren y cuantifiquen el grado de relacin. Voy a describir en prximos tweets un ndice muy usado ... 8 Feb

329. ...en todos los campos, como sucede con la correlacin de Pearson en variables cuantitativas. En distintos mbitos se trabaja ... 8 Feb

328. En las variables cualitativas no hemos hablado de ningn tipo de cuantificacin del grado de relacin.Porque no hay ninguno aceptado...

8 Feb

327. ...una diferencia muy importante. En las variables cuantitativas la correlacin (r) nos cuantifica la relacin,cuando es significativa. 8 Feb

326. ...el contraste de hiptesis es equivalente. En la nula tenemos "no relacin" y en la alternativa tenemos "relacin". Pero hay ... 8 Feb

325. Observemos que si comporamos lo visto antes en la correlacin de variables cuantitativas con la relacin de variables cualitativas ... 8 Feb

324. Hemos visto ejemplos con variables con dos valores posibles, pero las variables pueden tener ms de dos valores posibles, por supuesto. 8 Feb

323. Por ejemplo, fumador y no fumador como exposicin a un riesgo y tener o no cncer de pulmn. 8 Feb

322. En el mundo de la Medicina es muy usual comparar exposicin o no a un riesgo y la presencia o no de una determinada patologa. 8 Feb

321. Por ejemplo, en las encuestas sociolgicas para ver si hay relacin entre dos tems (preguntas) diferentes. 8 Feb

320. La ji-cuadrado como tcnica para evaluar la relacin entre variables cualitativas es muy til en muchos campos. 8 Feb

319. ...cuando digamos que hay relacin entre las variables, podremos decir que es una afirmacin significativa, fiable. 7 Feb

318. Hay, por lo tanto, presuncin de independencia. Y un gran margen de confianza en esa independencia. As cuando la rechacemos, ... 7 Feb

317. En este caso la Hiptesis nula es H0: Variables independientes (no relacionadas) y la alternativa es H1: variables relacionadas. 7 Feb

316. ...del segundo caso le genera desconfianza a la tcnica estadstica y, por esto, acaba dando el veredicto de no significacin. 7 Feb

315. Sin embargo, en el primer caso hay ms posibilidades de ser significativa la relacin que en el segundo. El pequeo tamao muestral ... 7 Feb

314. ...son las mismas entre hombres y mujeres en ambos casos, porque la nica diferencia es el cero de ms de la primera tabla. 7 Feb

313. Por un lado: H: (S: 50, N: 40) M: (S: 10, N: 80) y por otro: H: (S: 5, N: 4) M: (S: 1, N: 8). Las diferencias de proporciones ... 7 Feb

312. Y en esta decisin el tamao de muestra, como siempre en Estadstica, tiene un papel decisivo. Porque, observemos los datos siguientes: 7 Feb

311. ...si las diferencias de proporciones que se ven son atribuibles al azar del muestreo y no son unas diferencias slidas y fiables. 7 Feb

310. ...si la muestra obtenida permite pensar en una relacin significativa entre las variables cualitativas o, por el contrario, ... 7 Feb

309. La tcnica de la ji-cadrado es la tcnica estadstica que analiza estas tablas de contingencia y dictamina objetivamente ... 7 Feb

308. ...pensar que ahora s que hay relacin, que esa enfermedad no se presenta independiente al sexo, sino que hay asociacin, relacin. 7 Feb

307. ...la proporcin de enfermos y no enfermos es muy distinta en hombres y en mujeres. Esta diferencia de proporciones es lo que hace ... 7 Feb

306. ...porque en hombres y en mujeres hay una proporcin muy similar de enfermos y de no enfermos. Sin embargo,en la tabla del tweet 300... 7 Feb

305. Si comparamos las dos tablas de contingencias podemos ver que en la del tweet 304 no hay en absoluto indicios de relacin, ... 7 Feb

304. ...de esos datos tuvisemos estos otros: H: (S: 50, N: 40) M: (S: 48, N: 42). Y, ahora, comparmoslos. Qu diferencias hay? 7 Feb

303. Para valorar una tabla como la del tweet 300 y as detectar si hay relacin entre sexo y esa enfermedad vamos a suponer que en lugar... 7 Feb

302. A los datos de dos variables cualitativas expresados en frecuencias, en una tabla como esta, se le denomina "tabla de contingencias". 7 Feb

301. Y tenemos, tambin, en la muestra 10 mujeres enfermas y 80 que no. A partir de estos valores, estn relacionadas estas variables? 7 Feb

300. Supongamos los siguientes datos: H: (S: 50, N: 40) M: (S: 10, N: 80). Tenemos una muestra con 50 hombres enfermos y 40 que no. 7 Feb

299. ...o Mujer (M).Enfermedad: S la tiene (S) o No la tiene (N). Dos variables cualitativas con dos valores posibles en cada una de ellas. 7 Feb

298. Supongamos que queremos evaluar la relacin entre sexo y una determinada patologa. Son dos variables cualitativas. Sexo: Hombre (H)... 7 Feb

297. Ms adelante, en este curso, veremos otros tipos de regresin, pero ahora vamos a ver tcnicas de relacin con variables cualitativas. 7 Feb

296. ...y la regresin hemos visto tcnicas para trabajar con variables cuantitativas. De regresin hemos visto slo la lineal simple. 7 Feb

295. Recordemos que en Estadstica tenemos tres tipos de tcnicas y que estamos viendo ahora tcnicas de relacin. Con la correlacin ... 7 Feb

294. He preparado con diversos tweets ya escritos un texto, refrito, recogiendo ideas sobre la significacin estadsticajaumellopis.blogspot.com/2011/02/la-sig 6 Feb

293. Podemos decir, para acabar con todo esto que la Estadstica es el Tribunal de la significacin de la ciencia. 6 Feb

292. Y la comunidad cientfica est muy pendiente de estos veredictos, por su fundamental trascendencia. 5 minutes ago

291. Con la Estadstica sucede un poco lo mismo. Analiza unos datos y acaba dando un veredicto: "significativo" o "no significativo". 9 minutes ago

290. Al final sus sentencias son, en esencia, decir "constitucional" o "no constitucional".Y lo que dice este tribunal es la ltima palabra. 16 minutes ago

289. El Tribunal constitucional tiene como objetivo bsico analizar las leyes y acabar dictaminando si se adaptan o no a la constitucin. 20 minutes ago

288. De nuevo vuelvo por unos tweets ms con la significacin: En el fondo los estadsticos somos un poco como el Tribunal constitucional. 25 minutes ago 50 minutes ago

287. ...de no relacin, podemos decir que aquella relacin es significativa, es fiable, que existen pocas posibilidades de que no sea as. 5 Feb

286. Pero cuando lo hagamos, cuando digamos que hay relacin, como lo habremos hecho tras darle mucho margen de confianza a la presuncin...

5 Feb

285. nicamente si es incoherente mantener esas presunciones, a la luz de la muestra (nuestras pruebas y testigos),diremos que hay relacin. 5 Feb

284. En Estadstica podemos decir que existe la presuncin de no relacin entre las variables. Presuncin de r=0, de a=0, de b=0. 5 Feb

283. ...si durante el juicio, mediante las pruebas y testigos, se ve que la inocencia no se puede mantener se pasar a la culpabilidad. 5 Feb

282. ...inocencia y culpabilidad. Y las dos no parten paralelas. Una parte como cierta: la inocencia ("presuncin de inocencia"), y slo ... 5 Feb

281. El paralelismo de la Estadstica con el mundo judicial es sorprendente. En un juicio tambin hay dos hiptesis a contrastar: ... 5 Feb

280. En la hiptesis nula siempre tenemos lo que podemos decir antes de hacer cualquier cosa(lo que podemos presuponer):que no hay relacin. 5 Feb

279. Obsrvese el paralelismo con el contraste de la correlacin: Ho: r=0, H1: r<>0. 5 Feb

278. El contraste de hiptesis en estos dos casos es: Ho: a=0, H1: a<>0 (distinto de cero). Con la b lo mismo: Ho: b=0, H1: b<>0. 5 Feb

277. Las otras dos son las de los parmetros de la recta: la a y la b del modelo y=ax+b. Cada uno tiene su p-valor asociado. 5 Feb

276. En una regresin lineal en realidad tenemos tres significaciones implicadas: una ya la hemos visto, la de la correlacin. 5 Feb

275. Como puede verse en el grfico anterior los puntos se articulan en torno a la recta y su dispersin es la modelizada por la N(0, 0.4). 4 Feb

274. Grfico de regresin http://bit.ly/hCIMu9 4 Feb

273. Ejemplo de correlacin y de regresin:jaumellopis.blogspot.com/2011/02/ejempl 4 Feb

272. Voy a plantear unos datos reales con los que poder ver todo lo visto. Lo plantear a travs de un enlace a un blog en el prximo tweet. 4 Feb

271. ...a la recta de mnimos cuadrados permiten estimar la DE de la distribucin N(0, DE) de la e del modelo de regresin. 3 Feb

270. ...sobre el plano una nube de puntos para los cuales una recta es un buen modelo. Los residuos calculados punto por punto respecto ... 3 Feb

269. As es cmo cualquier software estadstico estima la recta de regresin que se adapta a los valores de dos variables que dibujan ... 3 Feb

268. ...la recta que minimice, que haga mnimas, las distancias al cuadrado calculadas desde cada uno de los puntos hasta la recta. 3 Feb

267. ...se adapte a esa representacin. Esto se hace mediante la llamada tcnica de los mnimos cuadrados. Mediante esta tcnica se busca... 3 Feb

266. Si tenemos valores de dos variables y tenemos una representacin bidimensional. El problema ser encontrar la recta que mejor ... 3 Feb

265. ...en el origen, porque es el valor de la y (de las ordenadas) cuando la x es cero (en el origen). 3 Feb

264. ...eje de las ordenadas y al de la x eje de las abcisas. Al punto x=0 se le denomina origen. Por eso a la b se le llama ordenada ...

3 Feb

263. A la b se le denomina "ordenada en el origen". Y representa el valor de la y cuando la x vale cero.Al eje de la y se le suele llamar... 3 Feb

262. A la a se se denomina pendiente de la recta. Si es positiva, de izquierda a derecha la recta asciende. Si es negativa, desciende. 3 Feb

261. Tanto la a como la b pueden ser cualquier nmero real. Cada pareja de nmeros diferentes define una recta distinta. 3 Feb

260. Nos falta explicar la a y la b. La a y la b son los llamados "parmetros de la recta". Toda recta tiene la frmula y=ax+b. 3 Feb

259. Quiero decir "en ella vamos a centrarnos", claro. Pues bien, en la ecuacin y=ax+b+e ya sabemos qu es la y, la x y la e. 3 Feb

258. A esta regresin la podemos ver nombrada de estas cuatro formas. Es la regresin bsica y la ms usual. En ellas vamos a centrarnos. 3 Feb

257. De momento nos centraremos en la lineal: Regresin simple lineal o regresin lineal simple o regresin lineal o regresin simple. 3 Feb

256. O sea, la regresin lineal es la representada por el modelo matemtico: y=ax+b+e. La no lineal es la que sigue cualquier otra funcin. 3 Feb

255. De regresiones simples hay de dos tipos: la regresin lineal y la no lineal. La lineal es la que la f(x) es la ecuacin de la recta. 3 Feb

254. ...independiente, como antes: la y, pero d variables independientes: x1, x2, ..., xd.De momento nos centraremos en la regresin simple. 3 Feb

253. ...variable dependiente, la x es la variable independiente. En la mltiple la funcin es: y=f(x1,x2,...,xd)+e. Una variable ... 3 Feb

252. En la regresin mltiple se relacionan ms de dos variables. En la simple la frmula general es la ya vista: y=f(x)+e. La y es la ... 3 Feb

251. Para empezar con el mapa de las regresiones distinguiremos la regresin simple de la mltiple.En la simple se relacionan dos variables. 3 Feb

250. Observemos que si planteramos la relacin entre Km y metros como una regresin: m=1000Km+e, la DE de esta e sera obviamente cero. 3 Feb

249. ...por esto podemos decir que esta e sigue una distribucin N(0, DE), donde esta desviacin estndar depender de la r. 3 Feb

248. ...tiene generalmente una distribucin normal centrada en el cero, por ser valores por exceso y por defecto, y con una dispersin, ... 3 Feb

247. Una aclaracin sobre estos ltimos tweets: Esta e de la regresin, el residuo, como son valores de distancias positivas y negativas... 3 Feb

246. ...hablar ahora de tipos de funciones y, por ello,como veremos, de tipos de regresiones.Ser importante dibujar un mapa de regresiones. 3 Feb

245. Hasta ahora hemos hablado de la regresin y=f(x)+e y tambin de representaciones bidimensionales alrededor de una recta. Deberemos... 3 Feb

244. ...ser tanto mayor cuanto menor sea la correlacin entre las variables x e y. 3 Feb

243. ...a la recta que pasa entre los puntos (distancias positivas y negativas) sigue una distribucion normal N(0, DE), donde esta DE ... 2 Feb

242. A la e se le denomina Residuo. Y en condiciones normales las distancias desde los valores de la representacin bidimensional ... 2 Feb

241. ...una representacin bidimensional menos dispersa alrededor de la recta que la representacin de alturas con pesos. 2 Feb

240. ...de la e tiene que ver con la dispersin de esta representacin bidimensional alrededor de esta recta. Y alturas con pies tienen ... 2 Feb

239. Cuanta mayor correlacin los valores en una representacin bidimensional estn ms reunidos a lo largo de una recta. Y la dispersin... 2 Feb

238. ...la e en Altura=f(Pie)+e es una variable con menos dispersin que la e en Altura=f(Peso)+e. Esto es bsico entenderlo. 2 Feb

237. Como hemos dicho en los tweets del 177 al 179 la altura tiene una r ms grande con la longitud del pie que con el peso.Por lo tanto,... 2 Feb

236. Si relacionamos Altura con Longitud de pie podemos decir que la funcin sera Altura=f(Pie)+e. De nuevo la e. 2 Feb

235. En la regresin siempre se crean funciones matemticas donde es imprescindible aadir esta e. Veremos ms tarde el papel de esta e. 2 Feb

234. ...crear el modelo: Altura=f(Peso)+e. Antes poda escribir Metros=f(Km), sin tener que aadir esa e. Porque la relacin es exacta. 2 Feb

233. Si quiero relacionar Altura y Peso la cosa no funciona tan bien porque no hay una frmula que lo haga de forma exacta. Pero puedo ... 2 Feb

232. Otro ejemplo: cuando expreso una distancia en Km y la quiero pasar a metros creo una relacin matemtica (una funcin): y=1000x 2 Feb

231. ...llueve y no llueve. La y tiene tambin dos valores posibles: me quedo en casa y voy a Girona. Y con la frase construyo una relacin. 2 Feb

230. Si digo: "Si el domingo llueve me quedar en casa, si no llueve ir a Girona", estoy construyendo una funcin.La x tiene dos valores... 2 Feb

229. Una funcin matemtica y=f(x) es la representacin (la modelizacin) matemtica de una relacin entre dos variables: x e y. 2 Feb

228. A la regresin vamos a dedicar ahora unos cuantos tweets. Primero tenemos que recordar el concepto de funcin matemtica. 2 Feb

227. ...para crear una funcin matemtica que modelice la relacin entre esas variables. A esto segundo se le denomina "Regresin". 2 Feb

226. Volvamos a la correlacin: sta se calcula por dos razones bsicas:para cuantificar el grado de relacin entre las dos variables o/y... 2 Feb

225. El tema machacn del Bolero de Ravel de la Estadstica es esta nocin de contraste de hiptesis y el p-valor como criterio de decisin. 21 hours ago

224. Siempre digo que la estructura de la Estadstica es como la del Bolero de Ravel: un mismo tema que va repitindose machaconamente. 21 hours ago

223. Esta lgica de funcionamiento va a ser el tema nuclear de casi todas las tcnicas que iremos viendo a lo largo de este curso. 22 hours ago

222. ...basado en el anlisis de la muestra que nos permite decidirnos por mantener H0 o pasarnos a la H1. 22 hours ago

221. En todo lo visto con la correlacin podemos ahora conectar: H0 es r=0 y H1 es r distinta de 0. El p-valor es el criterio objetivo ... 22 hours ago

220. Por eso H1 se le denomina alternativa, porque es la alternativa de la nula cuando no es lgico mantenerla tras analizar la muestra. 22 hours ago

219. La H0 parte como cierta y slo nos decantaremos por la H1 si la H0 es absurdo mantenerla viendo lo que vemos en la muestra. 22 hours ago

218. La decisin no es como cuando compramos una camisa poniendo una al lado de la otra para ver cul nos gusta ms. 22 hours ago

217. En Contraste de hiptesis se habla de Hiptesis nula: H0, y de Hiptesis alternativa: H1. Y de que hemos de decidirnos por una u otra. 22 hours ago

216. En Estadstica a todo esto que estamos viendo le denominamos "Contraste de hiptesis". Vamos a ver, ahora, la terminologa que usamos. 22 hours ago

215. Entender este razonamiento es fundamental en Estadstica. Estamos abordando, con esto, en realidad, el ncleo bsico de la Estadstica. 2 hours ago

214. ...coherente mantener esta afirmacin a la luz de lo que estamos viendo en la muestra que tenemos. 2 hours ago

213. Por eso hablamos de correlacin significativa, entonces. Porque le hemos dado mucho margen a r=0 y acabamos viendo que no es ... 2 hours ago

212. ...est relativamente mucho ms a favor del aprobado. Esto es para que cuando suspenda r=0 tengamos muy pocas posibilidades de errar. 2 hours ago

211. ..., en Espaa, las notas son un nmero del 0 al 10, con una frontera muy clara en el 5. Como puede verse la frontera en el p-valor ... 2 hours ago

210. Al basarse la decisin en un nmero entre 0 y 1 y en una frontera (0,05), el paralelismo con la enseanza es claro: En sta ... 2 hours ago

209. ...decimos que no tenemos pruebas que nos permitan afirmar, de forma fiable, que hay correlacin entre esas variables. 2 hours ago

208. ...que 0,05 suspende r=0 y hablamos, pues, de correlacin significativa; y si es mayor o igual que 0,05 no suspende r=0 y, ...

2 hours ago

207. ...por eso digo que se puede ver como si quien se examinara fuera r=0 y que el pvalor fuera como la nota de ese examen: Si es menor... 2 hours ago

206. ...que 0,05 decimos entonces que no hay correlacin; o sea, que no tenemos ningn argumento para dudar de la afirmacin: r=0, ... 2 hours ago

205. La correlacin es significativa si el p-valor es inferior a 0,05. Como el p-valor se mueve entre 0 a 1 y si, ste, es mayor o igual ... 2 hours ago

204. La metfora de los tweets 194 y 195 tal vez habr que explicala ms, a peticin de algunos seguidores de este curso por Twitter. 2 hours ago

203. En muestras grandes hay mucha homogeneidad entre las diferentes muestras posibles. Por eso ser ms fiable lo que una de ellas diga. 23 Jan

202. Las muestras de tamao pequeo son muy imprevisibles porque las diferentes muestras posibles son muy diversas entre ellas. 23 Jan

201. La significacin tiene mucho que ver con el tamao de muestra. Si ese tamao es pequeo es difcil que la Estadstica se fe de ella. 23 Jan

200. Por eso ante esta posibilidad la tcnica estadstica nos dice: Ante la duda mejor afirmar que no hay relacin;o sea,que r es igual a 0. 23 Jan

199. De la misma forma que en esta muestra hemos calculado una r=0,8 en otra muestra tomada en las mismas condiciones podramos tener r=-0,8 23 Jan

198. Porque, en este caso, la r=0,8, al no ser significativa, no podemos fiarnos de ella. Puede ser un efecto del azar del muestreo... 23 Jan

197. De esta forma podemos decir que una r=0,8 con un p-valor de 0,26 es, en realidad, una correlacin ms baja que una r=0,4 con p=0,001. 23 Jan

196. Observemos que el margen de la afirmacin r=0 es muy amplio (0,95). Esto es lo que permite hablar de "significativo" cuando suspende. 23 Jan

195. ...si el p-valor es inferior a 0,05 suspende, decidimos que la r no es 0 y nos quedamos con el signo y la magnitud de la r calculada. 23 Jan

194. Siguiendo la metfora de las notas, es como si se examinara la afirmacin r=0, si el p-valor es igual o superior a 0,05 aprueba, ... 23 Jan

193. Una correlacin ser significativa si su p-valor es inferior a 0,05. Si no es significativa hemos de presuponer que r=0. 23 Jan

192. La frontera del 0,05 en el p-valor es, en cierto modo, equivalente al 5 en las notas. Pero cuidado: 0,05, no 0,5. 23 Jan

191. ...y es bien distinto el sector de notas que va del 0 al 5 que el que va del 5 al 10. Esto mismo sucede con el p-valor. 23 Jan

190. ...del 0 al 0,05 y del 0,05 al 1. Una metfora posible es la de las notas: En nuestro sistema educativo las notas van del 0 al 10, ... 23 Jan

189. La significacin estadstica se mide mediante el p-valor. ste es un valor que va del 0 al 1, con dos sectores bien diferenciados: ... 23 Jan

188. ...sea fruto del azar de un muestreo. Si una tcnica estadstica duda de la representatividad de un muestreo dice: "no significativo". 22 Jan

187. Una afirmacin si es estadsticamente significativa representa que la Estadstica cree que aquel resultado es muy poco probable que ... 22 Jan

186. ...tipo, ante una buena muestra de muestras, una muestra representativa del conjunto de muestras que hubiramos podido tener. 22 Jan

185. ...pero con otra muestra, acabaramos diciendo algo similar, algo equivalente. Podemos pensar, pues, que estamos ante una muestra ... 22 Jan

184. Ante una afirmacin estadsticamente significativa podemos pensar que si volvisemos a hacer lo mismo, en las mismas circunstancias,... 22 Jan

183. Significacin en Estadstica significa algo as como fiabilidad. Un resultado significativo es un resultado por el que podemos apostar. 22 Jan

182. ...signo y magnitud. Vamos a ver ahora el ms complejo:la significacin. Este es un concepto nuclear en Estadstica,como iremos viendo. 22 Jan

181. En el tweet 160 deca que hay tres elementos a tener en cuenta en la correlacin: signo, magnitud y significacin. Hemos visto ... 22 Jan

180. Mayor magnitud de la correlacin significa, pues, mayor dependencia, mayor proximidad a la relacin que tienen pesetas y euros. 21 Jan

179. Si sabemos la altura de una persona las longitudes de pie posibles tienen menos dispersin que los pesos. Los pesos pueden variar ms. 21 Jan

178. Entre altura y peso posiblemente tengamos una r=0,6. Claro que hay una correlacin positiva, pero de menor magnitud. 21 Jan

177. La correlacin posiblemente sea prxima a 0,9. Ahora medir 1,80 no determina exactamente el pie que calzas. Hay una cierta variacin. 21 Jan

176. Saber el valor en euros sabes el valor en pesetas. Aqu no hay incertidumbre. Otra cosa es la relacin entre la altura y el pie. 21 Jan

175. En este caso estamos en la situacin de mxima magnitud de correlacin. Se trata de un caso de total dependencia entre dos variables. 21 Jan

174. Respecto a la magnitud de la correlacin hemos de matizar un poco su significado. El valor de las cosas en euros y en pesetas tiene r=1 21 Jan

173. ...posibles: -1 y +1 ms correlacin tenemos. Por eso, r=-0,9 es ms correlacin que r=0,8, porque 0,9 es ms grande que 0,8. 21 Jan

172. ...sin signo, valorando la magnitud del nmero puro. Esto significa que cuanto ms cerca de los extremos del intervalo de valores ... 21 Jan

171. Lo segundo a tener en cuenta en la correlacin es la magnitud. Y esto lo marca el valor absoluto de la correlacin; o sea, el valor ... 21 Jan

170. La correlacin suele abreviarse con una r. Por lo tanto, r=0,7 es una correlacin positiva y r=-0,9 es una correlacin negativa. 21 Jan

169. Pe: Goles a favor y Goles en contra en una liga de ftbol. Asistencias y rebotes. Valores altos de una van con bajos de la otra. 20 Jan

168. ...van asociados, ahora, a valores grandes de la otra; y valores grandes de una variable van asociados a valores pequeos de la otra. 20 Jan

167. La correlacin negativa la tienen, por el contrario, variables con una relacin inversa: valores pequeos de una variable ... 20 Jan

166. Nmero de oficinas y nmero de empleados en entidades financieras tambin tiene una correlacin positiva. 20 Jan

165. Ms ejemplos de correlacin positiva: Goles a favor y puntos de un equipo de ftbol. Asistencias y puntos de 3 en basket. 20 Jan

164. ...de la otra; y valores grandes de una variable van asociados a valores grandes de la otra. Pe: La altura y la longitud del pie. 20 Jan

163. Correlacin positiva significa que las variables tienen una relacin directa: valores pequeos de una van asociados a valores ... 20 Jan

162. Hay, por lo tanto, correlaciones positivas y negativas. El signo es, pues, el primer elemento bsico a tener en cuenta. 20 Jan

161. La correlacin, como cuantificacin del grado de relacin que hay entre dos variables, es un valor entre -1 a +1, pasando por el cero. 20 Jan

160. Hay tres elementos bsicos a tener en cuenta al analizar la correlacin: signo, magnitud y significacin. Vemoslos con detalle. 20 Jan

159. ...de correlacin. La correlacin ms usada es la de Pearson, que es de la que vamos a hablar especialmente aqu. 20 Jan

158. Para cuantificar la relacin entre dos variables cuantitativas tenemos la Correlacin. Varios estadsticos han diseado un clculo ... 20 Jan

157. ...potencialmente muchos valores posibles, como las variables: altura, peso, renta, goles de un equipo en una temporada, etc. 18 Jan

156. Empezaremos con las cuantitativas que son con las que medimos valores numricos. En concreto tratatemos con las que pueden tener... 18 Jan

155. Para hablar de relacin necesitamos dos variables evaluadas a una serie de individuos. Estas pueden ser cualitativas o cuantitativas. 18 Jan

154. Hasta ahora nos hemos dedicado a las tcnicas de descripcin. Ahora empezaremos con las tcnicas de relacin. Vamos con ello. 13 Jan

153. ...es una disciplina de tcnicas. Y esas tcnicas pueden clasificar en tres familias: de descripcin, de relacin y de comparacin. 13 Jan

152. Vamos a empezar ahora con tcnicas de relacin. Al empezar este curso, en los primeros tweets, deca que la Estadstica... 13 Jan

151. Parece mentira que no se asesoraran antes. Cualquier estadstico hubiera advertido del riesgo del sesgo de la muestra tomada. 11 Jan

150. ...tomaron una muestra no representativa. Posiblemente con un exceso en la proporcin de votantes europeos y de periodistas. 11 Jan

149. ...peridico italiano, ellos se basaron en una muestra amplia de votantes del premio. Pues tomaron una muestra grande pero muy mala,... 11 Jan

148. ...de muestra no representativa. La gazzetta dello sport haba pronosticado que ganara Iniesta. Segn dijo ayer un directivo del ... 11 Jan

147. Entre los tweets 10 y 16 he hablado de muestra y de su representatividad. Ayer en la entrega del baln de oro se vio un caso... 11 Jan

146. ...el intervalo (150, 190), de cundo se dan intervalos de la media como los (168, 172) o (169, 171). Es bsico ver esta diferencia. 8 Jan

145. Pero es muy importante diferenciar cundo se dan intervalos de la variacin de una variable, como cuando se daba en el tweet 109, ... 8 Jan

144. Tener muestras ms grandes nos permite contruir intervalos ms estrechos a la hora de hacer predicciones. 8 Jan

143. El EE que tena la media muestral del equipo B hemos visto en el tweet 137 que era 0.5. Dos veces ese EE nos lleva al intervalo 170+-1. 8 Jan

142. ...dos errores estndar (EE). El EE que tena la media muestral del equipo A hemos visto, en el tweet 136, que era 1, de ah el 170+-2. 8 Jan

141. Se entiende, pues, que el intervalo del 95% del equipo A sea (168, 172) y el del B sea (169, 171), basta con restar y sumar ... 8 Jan

140. El error estndar es, pues, una DE, pero una DE de la media muestral, una DE que se constriye a partir de la DE de la variable original 8 Jan

139. ...porque este cociente es la DE de la media. A esta DE de la media muestral, vista como variable, se le denomina error estndar. 8 Jan

138. Puede entenderse, pues, que si costruyen un intervalo de confianza del 95% de la media tomen la media ms menos dos DE/raiz(n) ... 8 Jan

137. Para el equipo B, DE/raiz(n) vale 10/raiz(400)=10/20=0.5. Por lo tanto, la media muestral sigue una distribucin N(10, 0.5). 8 Jan

136. Para el equipo A, DE/raiz(n) vale 10/raiz(100)=10/10=1. Por lo tanto, la media muestral sigue una distribucin N(10, 1). 8 Jan

135. Veamos cmo calcula cada equipo su intervalo de confianza del 95% de la media. 7 Jan

134. Pero veamos en el tweet 111 que el intervalo de confianza del 95% de la media que da cada equipo es distinto: (168, 172) y (169, 171). 7 Jan

133. Porque ambos equipos modelizan la poblacin de la misma forma: con una distribucin normal N(170, 10). 7 Jan

132. Como las M y las DE son las mismas en ambas muestras, deca en el tweet 109 que el intervalo del 95% de valores que dan es el mismo. 7 Jan

131. Los dos equipos trabajaban con distinto tamao de muestra: el A con tamao 100 y el B con tamao 400. Pero los dos tenan igual M y DE. 7 Jan

130. Volvamos al ejemplo de los tweets 104 al 115. Tenamos dos equipos: el A y el B, estudiando las alturas de una misma poblacin. 7 Jan

129. ...de la media poblacional sern ms estrechos, ms precisos. Porque el intervalo de la media es una prediccin de la media poblacional 7 Jan

128. Cuanto mayor es el tamao de la muestra, como la n est en el denominador, DE/raz(n) es menor y los intervalos de prediccin ... 7 Jan

127. De ah que la precisin a la hora de construir intervalos de confianza de la media dependa del tamao de muestra (ver tweet 115). 7 Jan

126. O sea, si una variable sigue una distribucin N(M, DE) la media muestral sigue una distribucin N(M, DE/raz(n)). 7 Jan

125. Su DE es la de la variable original dividido por la raz cuadrada del tamao de muestra: DE/raz(n). 7 Jan

124. Una normal tambin con su media y su desviacin estndar. Su media es, exactamente, la misma que la de la variable original; o sea: M. 7 Jan

123. Pues aqu va un concepto muy importante: Si una variable sigue la N(M, DE) la media de esta variable tambin es una normal. 7 Jan

122. ..., tericamente, conceptualmente; que significa, en estadstica, algo as como aproximadamente. 7 Jan

121. Por lo tanto, la media muestral como variable que es tiene media y DE. Media y DE que nunca tendremos realmente pero s idealmente,... 7 Jan

120. Cuando tomamos una muestra de una poblacin la muestra que tenemos es una de las muchsimas muestras que podramos tener. 7 Jan

119. Pues bien, algo muy importante: la media muestral es una variable que se puede medir a toda muestra de un tamao n en una poblacin. 7 Jan

118. El nmero de slabas es una variable que podemos medir a toda palabra del castellano. El nmero de trabajadores lo es para empresas.Etc 7 Jan

117. ...que podemos evaluar a unas entidades determinadas. El peso, la altura, la renta en 2010 son variables que podemos medir a personas. 7 Jan

116. Para entender esto hay que profundizar en la nocin de variable en estadstica. Una variable cuantitativa es una medida ...

7 Jan

115. ...una prediccin. Cuanto mayor sea el tamao de muestra ms precisin y, por lo tanto, ms estrecho el intervalo. 5 Jan

114. Y en este tipo de intervalo de la media el tamao de la muestra es determinante porque marca la precisin que tenemos para hacer... 5 Jan

113. ...significa que tenemos una probabilidad del 95% de que la verdadera media poblacional est dentro del intervalo. 5 Jan

112. Porque el intervalo es ahora "de la media". Este intervalo no significa que el 95% de alturas estn entre sus lmites ... 5 Jan

111. Pero si ambos equipos nos dieran un intervalo del 95% de la media sera: (168, 172) el del equipo A y (169, 171) el del equipo B. 5 Jan

110. Para decir eso ambos equipos miran primero la normalidad de la muestra y toman, luego, la media y le suman y restan dos veces la DE. 5 Jan

109. Ambos equipos dirn que entre 150 y 190 tenemos el 95% de alturas poblacionales, por todo lo dicho en tweets anteriores. 5 Jan

108. ...valores muy parecidos. Pensemos que ambos equipos estn estudiando la misma poblacin. Es lgico que no haya mucha diferencia. 5 Jan

107. El que la media y la DE den lo mismo es porque estamos teorizando y me va bien que sea as, pero no sera extrao que dieran... 5 Jan

106. El equipo B toma una muestta de tamao 400 y resulta que al calcular la media y la DE obtiene los mismos valores: 170 y 10. 5 Jan

105. El equipo A toma una muestra de tamao 100 y la media resulta que es 170 y la desviacin estndar (DE) es 10. 5 Jan

104. Supongamos dos equipos de investigacin que estudian las alturas de una misma poblacin: el equipo A y el equipo B. 5 Jan

103. Significa esto que el 95% de la gente mide entre 169 y 171? 5 Jan

102. Supongamos que un estudio dice que un intervalo del 95% de la media de la altura de adultos es (169, 171). 5 Jan

101. ...la poblacin modelizada. Lo de media ms menos una, dos y tres DE y los porcentajes vistos son ejemplos de esas preguntas posibles. 31 Dec

100. ...manejar, maquetas a las que les podemos preguntar cosas: lo que ellas nos respondan es, aproximadamente, lo que nos respondera... 31 Dec

99. ...a la poblacin. Esta es la ventaja de tener modelos en ciencia: sustituyen a la realidad, son maquetas matemticas que podemos... 31 Dec

98. Una vez tenemos una normal concreta como modelo de una poblacin lo que calculemos al modelo es como si, en realidad, lo calculsemos... 31 Dec

97. La M y la DE calculada a una muestra que se ajusta a una normal nos eligen la talla de la campana de Gauss que se ajusta a nuestro caso. 29 Dec

96. Cuando decimos que utilizamos una N(M, DE) es como cuando pedimos el nmero 42 de un determinado modelo de zapato. 29 Dec

95. Cuando decimos que utilizaremos una N(mu, sigma) es como decir que queremos comprar un determinado modelo de zapato. 29 Dec

94. La DE de una muestra estima la sigma, que es una medida de la dispersin poblacional. Por eso M es a mu lo que DE es a sigma. 28 Dec

93. ...media que, matemticamente, es representada por la mu de la normal 28 Dec

92. He escrito ahora N(mu,sigma) pero antes he usado la expresin N(M, DE) porque la media M, de una muestra, estima la media poblacional... 28 Dec

91. La mu es el punto ms alto de la campana de Gauss y la sigma es una medida del grosor de la campana, de su estilizacin. 28 Dec

90. ...pedimos dos nmeros. Como si para los zapatos pidiramos con dos nmeros: uno para la longitud y otro para la anchura. 28 Dec

89. La mu y la sigma son los llamados parmetros de la normal, son las tallas. Como cuando pedimos unos zapatos del 42. Pero aqu ... 28 Dec

88. De Campanas de Gauss tenemos infinitas. El smbolo general de una de ellas es N(mu, sigma). Qu significan la mu y la sigma? 28 Dec

87. Gauss cre una maquinaria matemtica (la campana de Gauss) que es una buena maqueta de la variabilidad de muchas variables. 28 Dec

86. La distribucin normal, como modelo de la realidad, es muy usual porque muchas variables se distribuyen de esta forma. 28 Dec

85. ...modelo, porque sustituye a una realidad, porque la aproxima, porque la representa, porque, en cierto sentido, puede ocupar su lugar. 1 hour ago

84. ...estadsticamente por esa distribucin. Lo que calculemos a la N(6.75, 3) es como si le calculsemos a la poblacin. Por eso es un... 1 hour ago

83. ...la poblacin donde hemos tomado la muestra es una normal 6.75, 3. Escrito as: N(6.75, 3). Esta poblacin queda modelada ... 1 hour ago

82. Muestra: (1,2,4,5,5,6,6,6,6,7,7,7,7,7,7,8,8,10,11, 15). Sigue la distribucin normal. La media es 6.75, la DE es 3. Podemos decir que... 1 hour ago

81. Media ms menos una DE, ms menos dos DE y ms menos tres DE, cubren, pues, el 68.5, el 95 y el 99.5%, respectivamente, de la poblacin. 21 Dec

80. En el ejemplo del tweet 78, en el intervalo (154, 186) tenemos el 95% de individuos de la poblacin y en (146, 194) el 99.5%. 21 Dec

79. De la misma forma, la media ms menos dos DE cubre el 95% y la media ms menos tres DE cubre el 99.5%. 21 Dec

78. ...mide entre 162 y 178 cm, o sea, dentro del intervalo (170-8, 170+8)= (162, 178). 21 Dec

77. Ejemplo: Si una muestra de alturas de personas, que sigue una normal, tiene una media de 170 y una DE de 8, el 68.5% aproximadamente ... 21 Dec

76. Esto lo escribiremos, aqu, as: M+-DE. El + y el - normalmente se escribe uno encima del otro. Tambin escribiremos: (M-DE, M+DE). 20 Dec

75. Dentro del intervalo que va de la media menos una DE hasta la media ms una DE tenemos aproximadamente el 68.5% de los valores. 20 Dec

74. Ante toda muestra que sigue bien una distribucin normal podemos hacer unas importantes afirmaciones acerca de la poblacin: 20 Dec

73. La muestra (1,4,6,6,7,7,7,8,9,11,13) sigue bien el carcter de normalidad. La muestra (3,3,3,4,11,12,12,123) no lo sigue. 17 Dec

72. ...de forma progresiva y simtrica va disminuyendo la densidad de valores al alejarse, por ambos lados, de la media. 17 Dec

71. Una muestra se distribuyen de forma normal, o segn una campana de Gauss, cuando cerca de la media est la mayora de valores y ... 17 Dec

70. Cuanto ms forma de campana de Gauss siga la distribucin de los valores de la muestra ms ser cierto lo dicho en el tweet anterior. 17 Dec

69. En la mayor parte de muestras, sabiendo la media y la DE podemos deducir todos los dems clculos que podemos hacer a una muestra. 17 Dec

68. De hecho, si sabemos la media y la DE de una muestra, en buena parte sabemos lo esencial de su distribucin. Son los dos valores bsicos 17 Dec

67. Si de una muestra tenemos la media, la mediana, diferentes percentiles y la DE sabemos las cosas esenciales de su distribucin. 17 Dec

66. Cuando tenemos muchos de estos estadsticos, de estos clculos, de una muestra conocemos mejor cmo se distribuyen sus valores. 17 Dec

65. En cambio la varianza, que se queda en el promedio de los cuadrados, es de difcil manejo por el cambio de escala. 17 Dec

64. El que se use ms la DE que la varianza es porque en la DE al hacerse la raz cuadrada final volvemos a la escala de nuestros valores. 17 Dec

63. En la definicin de DE el orden es: raz, promedio, cuadrados, restas. Pero el clculo es: restas, cuadrados, promedio, raz. 17 Dec

62. ...pero en orden inverso: primero hemos hecho las restas, luego el cuadrado, luego su promedio y al final la raz cuadrada. 17 Dec

61. Si se lee con atencin la definicin de DE del tweet 56 se comprobar que para este clculo hemos seguido sus pasos... 17 Dec

60. Este 12.5 es la varianza muestral. La varianza no suele usarse mucho en la prctica. La raz cuadrada de 12.5 es 3.53. Esta es la DE. 17 Dec

59. Para evitar que la media d 0 elevamos al cuadrado. En nuestro caso tendramos 25, 0, 0, 25. El promedio de estos cuatro valores es 12.5 17 Dec

58. Estas son las desviaciones, respecto a la media, de esta muestra: (-5, 0, 0, 5). Si hiciese la media de estas desviaciones dara 0.

17 Dec

57. Muestra:(0,5,5,10). La media es 5. Las restas de cada valor de la muestra respecto a la media son 0-5=-5, 5-5=0, 5-5=0, 10-5. 17 Dec

56. La DE es la raz cuadrada del promedio de los cuadradros de las restas de cada valor de la muestra respecto a la media muestral. 16 Dec

55. La desviacin estndar (DE) es la medida ms fina y la ms usada como cuantificacin de la dispersin. 16 Dec

54. Necesitamos una medida de dispersin ms fina. Uno de los clculos ms importantes de una muestra es la desviacin estndar o tpica. 16 Dec

53. Veamos dos muestras: (0,0,10,10) y (0,5,5,10). Tienen el mismo rango: 10. Sin embargo, la dispersin de la primera es superior. 16 Dec

52. El rango como medida de dispersin es pobre, se fija slo con los valores extremos, no tiene en cuenta al conjunto de la muestra. 16 Dec

51. El rango es una medida de dispersin, una medida de lo alejados que estn los valores de la muestra respecto a la media. 16 Dec

50. Muestra: (0,1,1,2,2,3,3,5). El rango es 5. El rango intercuartlico es 2, porque el Tercer cuartil vale 3 y el Primer cuartil vale 1. 16 Dec

49. Rango intercuartlico es la diferencia entre el Tercer cuartil y el Primer cuartil. 16 Dec

48. Al Percentil 25 se le denomina tambin Primer cuartil. Al Percentil 75, Tercer cuartil. 16 Dec

47. El rango de una muestra es el mximo menos el mnimo. Muestra: (1,4,6,7,8). El rango es 7. 16 Dec

46. Es cierto que a muestras como la ltima del tweet anterior a veces se le llama bimodal. Pero lo ms habitual es decir que no hay moda. 16 Dec

45. Muestra:(1,2,2,3,4): La moda es 2. Muestra:(1,2,3,6): No hay moda. Muestra:(1,2,2,3,3): No hay moda. Debe ser nica la moda. 16 Dec

44. Si ningn valor se repite o si los que se repiten ms veces se repiten el mismo nmero de veces entonces la muestra no tiene moda. 16 Dec

43. La moda de una muestra es el valor que se repite como mnimo dos veces y que ningn otro valor se repite tanto. 16 Dec

42. Muestra: (3,5,7,11,15). Alguien que tenga un valor de 8 tiene un percentil de 60. El 60% de la muestra son valores inferiores a 8. 15 Dec

41. Si el nio, en cuanto a la altura, tiene el percentil 67 significa que el 67% de nios de su edad son ms bajos que l. 15 Dec

40. El pediatra cuando mide a un nio les da a los padres el percentil del nio, que es la posicin relativa del nio entre los de su edad. 15 Dec

39. Muchas veces ms que calcular percentiles a un muestra interesa calcular el percentil de un valor dentro de una muestra. 15 Dec

38. Muestra: (1,3,4,4,4,6,8,8,8,10). El Percentil 10 es 2. El 2 separa la muestra en un 10 y en un 90%. El Percentil 60 es 7. El 90 es 9. 15 Dec

37. Muestra: (1,3,5,9). El Percentil 25 es 2.El 2 separa la muestra en el 25% y el 75%.El Percentil 75 es 7. La mediana o Percentil 50 es 4. 15 Dec

36. El valor que divide la muestra en un fragmento del 75% y otro del 25% (siempre la muestra ordenada de menor a mayor) es el Percenti 75. 15 Dec

35. El valor que divide la muestra en dos fragmentos, uno del 25% y otro del 75%, se le denomina Percentil 25. 15 Dec

34. A partir de esta idea puede construirse un Percentil cualquiera entre 0 y 100. 15 Dec

33. A la mediana tambin se le denomina Percentil 50, porque es el valor que divide la muestra en dos fragmentos con el 50% de valores. 15 Dec

32. La media sufre los efectos de valores extremos, los cuales influyen mucho en su magnitud. La mediana es resistente a esos valores. 14 Dec

31. En la muestra del tweet anterior la media es 10 y la mediana es 2. El valor de la mediana refleja aqu mejor un valor de centralidad. 14 Dec

30. La muestra: (1,1,1,2,2,2,3,4,40,44) podra ser tanto de aos de vida despus de padecer un cncer o de rentas anuales en miles de euros. 14 Dec

29. Tambin la mediana es muy usada en economa, al analizar la distribucin de la renta de un pas. 14 Dec

28. La mediana es muy usada en medicina.Especialmente al analizar los aos de vida despus del diagnstico de un determinado tipo de cncer. 14 Dec 14 Dec

27. Ejemplo:(5,3,42,1,8,3,8). La media es 10.Para la mediana se ordena la muestra:(1,3,3,5,8,8,42) y como es impar cojo el valor central: 5. 14 Dec

26. Si la muestra es de tamao par la mediana se calcula ordenando la muestra y calculando la media de los dos valores centrales. 14 Dec

25. Si la muestra es de tamao impar para calcular la mediana se toma el valor central de la muestra ordenada. 14 Dec

24. En la muestra (0,1,2,6,50) la mediana es 2. El valor 2 separa a la muestra en dos fragmentos del mismo tamao. 14 Dec

23. La media y la mediana pueden ser muy distintas. La muestra (0,1,3,16) tiene una media de 5 y una mediana de 2. 14 Dec

22. En la muestra (0,4,6,10) la mediana es 5. El valor real 5 separa la muestra en dos mitades del mismo tamao. 14 Dec

21. La mediana es aquel nmero que, una vez ordenada la muestra de menor a mayor, la separa en dos partes con el mismo nmero de valores. 14 Dec

20. La muestra: (0,4,6,10) tiene una media de 5. 14 Dec

19. La media de una muestra se calcula sumando todos sus valores y dividiendo por el tamao de muestra. 14 Dec

18. Cada estadstico, cada clculo, capta numericamente un aspecto concreto distinto de la muestra. 14 Dec

17. Una vez se tiene la muestra, como deca en el tweet 9, se le pueden calcular muchos estadsticos diferentes. 14 Dec

16. Si no se tiene ninguna informacin de la poblacin a estudiar la opcin es coger una muestra al azar. Este es siempre el ltimo recurso. 14 Dec

15. Muestreo proporcional: Dos subpoblaciones de 6000 y 4000 personas. Si se toma una muestra de 100, se tomarn 60 y 40, respectivamente. 14 Dec

14. Si se sabe que en la poblacin hay subpoblaciones con importantes diferencias la muestra se tomar proporcional. 14 Dec

13. Es bsico utilizar toda la informacin disponible que nos lleve a una mejor miniaturizacin de la muestra. 13 Dec

12. Como la poblacin no la tenemos la representatividad la marca el propio procedimiento seguido para obtener la muestra, su objetividad. 13 Dec

11. Una muestra es representativa cuando representa a la poblacin a estudiar, cuando es lo ms prximo a la poblacin en miniatura. 13 Dec

10. Una muestra es un subconjunto de una poblacin. Un subconjunto que, por la forma de tomarla, se pretende que sea representativa. 13 Dec

9. Las tcnicas descriptivas ms usuales son el clculo de los denominados "estadsticos": media, mediana, desviacin tpica, rango, etc. 11 Dec

8. Por esto la Estadstica puede decirse que es, en buena parte, el lenguaje de la ciencia. Por esto se estudia en todas las facultades. 12 Dec

7. Pero, Qu hace cualquier cientfico en su actividad diaria? Tambin describir, comparar y relacionar. 12 Dec

6. En Estadstica estamos siempre describiendo, comparando o relacionando. 12 Dec

5. Relacin: Tcnicas que buscan relaciones entre variables, entre diferentes caractersticas medidas a una serie de individuos. 12 Dec

4. Comparacin: Tcnicas que comparan grupos de individuos. El objetivo es poder hablar de la igualdad o la diferencia de esos grupos. 12 Dec

3. Descripcin: Tcnicas donde no se infiere, slo se mira lo que se tiene, la muestra. Miradas diferentes a lo mismo. 12 Dec

2. En Estadstica hay tres tipos de tcnicas, tres actividades bsicas, tres acciones: Descripcin, Comparacin y Relacin. 12 Dec

1. La estadstica es una ciencia de tcnicas. Tcnicas analticas para ver en unos datos lo que nuestra mirada no es capaz de ver.

Das könnte Ihnen auch gefallen