Sie sind auf Seite 1von 14

PROYECTO DE AULA

Lucy Vega
Tatiana Fory
BASE DE DATOS

 El término de bases de datos fue escuchado por primera vez en 1963, en un


simposio celebrado en California, USA. Una base de datos se puede definir
como un conjunto de información relacionada que se encuentra agrupada ó
estructurada.

Desde el punto de vista informático, la base de datos es un sistema formado


por un conjunto de datos almacenados en discos que permiten el acceso
directo a ellos y un conjunto de programas que manipulen ese conjunto de
datos.

Cada base de datos se compone de una o más tablas que guarda un conjunto
de datos. Cada tabla tiene una o más columnas y filas. Las columnas guardan
una parte de la información sobre cada elemento que queramos guardar en la
tabla, cada fila de la tabla conforma un registro.
BIGDATA

 Cuando hablamos de Big Data nos referimos a conjuntos de datos o


combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad
(variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura,
gestión, procesamiento o análisis mediante tecnologías y herramientas
convencionales, tales como bases de datos relacionales y estadísticas
convencionales o paquetes de visualización, dentro del tiempo necesario para
que sean útiles.
ANÁLISIS DE DATOS

 El análisis de datos es la ciencia que se encarga de examinar un conjunto de


datos con el propósito de sacar conclusiones sobre la información para poder
tomar decisiones, o simplemente ampliar los conocimientos sobre diversos
temas.
 El análisis de datos consiste en someter los datos a la realización de
operaciones, esto se hace con la finalidad de obtener conclusiones precisas
que nos ayudarán a alcanzar nuestros objetivos, dichas operaciones no
pueden definirse previamente ya que la recolección de datos puede revelar
ciertas dificultades.
DATA SCIENCE

 El Data Science, también conocido como Ciencia de Datos, es la rama


científica de la que se sirven los Data Scientist para llevar a cabo análisis de
diversas fuentes de datos, con el fin de poder extraer conclusiones a raíz de
un conjunto inmenso de datos y convertirlas en información útil a la hora de
la toma de decisiones de la empresa.
Las aplicaciones son múltiples y muy diversas. Como ya hemos comentado, la
función principal de la Ciencia de Datos es analizar un conjunto inmenso de datos
para obtener ciertas conclusiones que pueden incidir sobre ciertos aspectos en el
desarrollo de tu negocio.
CONTEXTUALIZACIÓN BASE DE DATOS

 La siguiente base de datos se tomó de la universidad Cataluña del año2013,


donde en ella se especifica, el nombre del estudiante, sexo, tipo de programa
académico que está estudiando y el país de procedencia; adicionalmente se
añadieron los datos numéricos (edad y estrato)
Lo que queremos hacer con todos estos datos es tipificarlos y ordenarlos de
tal manera que se aplique la estadística descriptiva para realizar diferentes
estrategias de mejora; aplicando los temas vistos en clase.
CANTIDAD Nombre EDAD ESTRATO NOTA 1 Programa Pais SEXO

1 Maria Victoria Buenaventura Fernandez 25 5 2 SPOLICONT PER FEMENINO

2 Nidia Moreno 29 5 2 DHSEQ PER FEMENINO

3 Nelson Enrique Rivera Torrenegra 29 4 4 DNIC COL MASCULINO

4 Nancy Victoria Ojeda Esatia 30 2 4 DGP PER FEMENINO

5 Jaime E Vargas Huertas 29 4 4 DGP COL MASCULINO

6 Andrea Catalina Manchola Castillo 29 1 2 DGP COL FEMENINO

7 Maria Reales Acevedo 26 1 5 DHSEQ PER FEMENINO

8 Antonio Jose Urbina 26 3 4 DHSEQ PER MASCULINO

9 Doris Cabra Lopez 27 1 4 DHSEQ COL FEMENINO

10 Ma Amparo Gonzalez 25 2 2 DNIC PER FEMENINO

11 Mercedes Bernal Prieto 27 1 3 DNIC COL FEMENINO

12 Johan Alexander Garcia Gonzalez 29 5 2 DNIC COL MASCULINO

13 Flor Alba Ramirez De Muñoz 27 3 1 DNIC PER FEMENINO

14 Yuri Baquero 27 4 4 DNIAS COL FEMENINO

15 Jorge Uriel 25 5 1 DHSEQ COL MASCULINO

16 Guillermo Cubillos 26 5 4 DGP PER MASCULINO

17 Nohora Lucia Ordoñez Llanos 25 5 1 DSISO COL FEMENINO

18 Daniel 26 3 3 DGP PER MASCULINO

19 Sandra Milena Romero Segura 29 4 5 DGP COL FEMENINO

20 Antonio Reyes 28 1 1 SPOLICONT PER MASCULINO

21 Marco Edwin Garcia Jimenez 25 5 4 DHSEQ COL MASCULINO

22 Sunilda Mondragon Aramburo 29 3 5 DHSEQ PER FEMENINO

23 Ruben Guillermo Rubio Delgado 25 2 2 DNIC PER MASCULINO

24 Olga Lucia Becerra 26 3 1 SPOLICONT COL FEMENINO

25 Jaime Otero 25 1 5 DNIC PER MASCULINO

26 Esperanza Pardo A 29 5 1 DNIC COL FEMENINO

27 Nayade Salazar 26 1 5 DNIAS PER FEMENINO

28 Alexandra Rivera Lopez 29 1 4 DNIAS COL FEMENINO

29 Cecilia Gomez Duarte 25 4 1 DNIAS PER FEMENINO

30 Liliana Briñez 28 1 5 DNIAS PER FEMENINO


ESTADISTICA DESCRIPTIVA
EDAD ESTRATO NOTA 1
Media 41,3 Media 3,0 Media 3,03
Error típico 2,3 Error típico 0,3 Error típico 0,28
Mediana 42,0 Mediana 3,0 Mediana 3,50
Moda 58,0 Moda 1,0 Moda 4,00
Desviación estándar 12,5 Desviación estándar 1,6 Desviación estándar 1,52
Varianza de la muestra 156,3 Varianza de la muestra 2,6 Varianza de la muestra 2,31
Curtosis -1,3 Curtosis -1,6 Curtosis -1,55
Coeficiente de asimetría -0,2 Coeficiente de asimetría -0,1 Coeficiente de asimetría -0,12
Rango 38,0 Rango 4,0 Rango 4
Mínimo 21,0 Mínimo 1,0 Mínimo 1
Máximo 59,0 Máximo 5,0 Máximo 5
Suma 1238 Suma 90 Suma 91
Cuenta 30 Cuenta 30 Cuenta 30
INTERVALOS DE CONFIANZA

Intervalo de confianza del 92 % para la media.

 Las directivas de la universidad quieren saber si la media de la edad de la


población estudiantil es menor de los 23, para empezar a realizar cursos de
coaching; use una confianza del 92%
 La universidad lo contrata a usted para que realice un estudio donde indique
dentro de que rangos de estrato están los estudiantes; si están por debajo de
estrato 3 se van a incrementar las becas a 1 por programa académico; use una
confianza del 92%.
 El área de bienestar quiere premiar a los estuantes con una salida a
Cartagena si el promedio de notas global está por encima del 3.6; realice el
estudio con una confianza del 92%.
Varianza
PRUEBA DE HIPOTESIS

Das könnte Ihnen auch gefallen