My Profile Photo

Mucio Osorio


Blog del curso de Probabilidad y Estadística


Tarea para miércoles 29 de abril. Métodos Estadísticos

Intervalos de predicción para datos asimétricos.

Cuando los datos son asimétricos con sesgo positivo el intervalo de predicción que se utiliza es:

Mas detalles en pag. 81 de libro.

Intervalo predicción asimétrico

Ejemplo. COnsidere el problema visto en clase del arsénico.

Si se toma una muestra mas de agua,¿cuál será su concentración de arsénico?

Los datos del arsénicoson asimétricos c on sesgo positivo.como puede ver:

a <- c(1.3,8,1.5,9.5,100,580,110,1.8, 2.6, 2.8, 3.5,12, 14, 19, 23,120, 190, 240, 250,4.0,41,300,4.8,80,340)
hist(a)

En R, el intervalo se puede calcular así:


# Los datos
a <- c(1.3,8,1.5,9.5,100,580,110,1.8, 2.6, 2.8, 3.5,12, 14, 19, 23,120, 190, 240, 250,4.0,41,300,4.8,80,340)

# 0.  El tamaño de muestra

n <- length(a)

# 1. transformar a logaritmo
y=log(a)

# 2. media de los logaritmos
m <- mean(y)

# 3. desviación estándar de los logaritmos
s <- sd(y)

# 4. valor de la distribución t al 95%, recuerde que el tamaño de muestra es 25 y en la formula dice n-1
t <- abs(qt(.025,n-1))

#Finalmente los límites de los intervalos
li <- exp(m-t*sqrt(s^2+s^2/n))
ls <- exp(m+t*sqrt(s^2+s^2/n))
li
ls

Finalmente podremos decir que la concentración de arsénico se encontrará entre 0.39 ppb y 1476.1 ppb.

Tarea.

En R, para cambiar el valor de t. Use lo siguiente:

Si la confianza es

99 %————–usa 0.005

95 %————–usa 0.025

90 %—————usa 0.05

Ejercicios.

  • The following 43 values are annual 7-day minimum flows for 1941−1983 on the Little Mahoning Creek at McCormick, PA.

flujos <- c(0.69,2.90,4.40,0.80,3.00,4.80,9.70, 9.80,1.30,3.10,4.90,10.00,1.40,3.30,5.70,11.00,1.50, 1.50, 1.80, 1.80, 2.10, 2.50,3.70 ,3.80, 3.80, 4.00, 4.10, 4.20,5.80, 5.90, 6.00, 6.10, 7.90, 8.00,11.00 ,12.00, 13.00, 16.00, 20.00, 23.00,2.8,4.2,8)

Construya e interprete el intervalo de predicción de una nueva observación al 90% de confianza

  • Las autoridades sanitarias de un municipio evaluaron la calidad del agua para consumo en términos de colonias de bacterias tróficas en un acuífero próximo a una ciudad (número de colonias por 1000 mm de agua):
x <- c(194, 199, 121, 102, 215, 214, 197,
204, 139, 102, 230, 123, 194, 109,
158, 161, 123, 174, 110, 156, 156,
156, 158, 161, 188, 139, 147, 116,110,155,130,120,100,125)

¿Cual será el número de colonias que tendrá una nueva muestra de agua? Use 99% de confianza.

Dudas: mucio.osorio@itson.edu.mx (estoy respondiendo rápidamente dudas, pero por favor no esperen al ultimo momento para entrega)

Subir aquí la tarea:

https://forms.gle/uMbasYwZRuQLGTai6

NOTA: NO SUBIR AQUI TAREAS DE OTRO DIA