OCW Curso Práctico de Inferencia Estadística con R

U. Faura, F. Arnaldos, M.T. Díaz, L. Molera, I. Parra

Instrucciones

  1. Establezca un directorio de trabajo para esta práctica. Para saber cuál es el directorio de trabajo actual use la función getwd(). Para cambiarlo desde RStudio puede pinchar en el siguiente menú: Session/Set Working Directory/Choose Directory.

  2. Guarde en ese directorio un R Script con los códigos de R utilizados en esta práctica. Para crear un R Script debe pinchar en menú File/New File/R Script.


Volver al principio


Sección 1.1. Cálculo de probabilidades y cuantiles


Funciones a utilizar: dbinom, pbinom, qbinom, pnorm, qnorm, pchisq, qchisq, pt, qt, pf, qf

Funciones similares: dpois, ppois, qpois, pexp, qexp, pgamma, qgamma


En R hay un conjunto de funciones que permiten calcular la función probabilidad (caso discreto) o la función de densidad (caso continuo), la función de distribución y los cuantiles para diferentes modelos de distribuciones. El nombre de dichas funciones siempre comienza con la misma letra: una d para obtener la función de probabilidad puntual o la función de densidad; una p para la función de distribución, y una q para los cuantiles.

Por ejemplo, la función dbinom(x, size, prob) permite obtener probabilidades puntuales, \(P(X = x)\), de una distribución binomial de parámetros size, que es el número de ensayos (el parámetro \(n\) en la mayoría de los textos de estadística), y prob, que es la probabilidad de éxito \(p\).

Al terminar la práctica, en la sección Recopilatorio de funciones utilizadas dispondrá de una selección de los argumentos más usuales de las funciones empleadas. Si desea una relación exhaustiva de argumentos, lo más sencillo es consultar el menú de ayuda,

help(dbinom)

o simplemente

?dbinom


Ejercicio 1. Distribución binomial

Dada X ~ B(40, 0.3), calcule:

  1. La probabilidad de que X sea igual a 10.

  2. La probabilidad de que X sea como mucho igual a 10.

  3. La probabilidad de que X sea inferior a 15.

  4. La probabilidad de que X sea superior a 8.

  5. El valor del percentil 95.


a. Calcule la probabilidad de que X sea igual a 10.

Hay que calcular una probabilidad puntual, P(X = 10), para lo que se utiliza la función dbinom(x, size, prob). Para especificar el valor de cada argumento, se puede escribir después del nombre de éste seguido del símbolo =,

dbinom(x = 10, size = 40, prob = 0.3)
## [1] 0.1128173

o simplemente escribir todos los valores separados por comas en el orden correspondiente a los argumentos en la definición de la función según la ayuda de R:

dbinom(10, 40, 0.3)
## [1] 0.1128173

Observe que si especifica antes de los valores de los argumentos su nombre y el signo =, podrá escribir estos en el orden que desee, por ejemplo,

dbinom(10, prob = 0.3, size = 40)
## [1] 0.1128173

Por tanto, P(X = 10) = 0.1128173


b. Calcule la probabilidad de que X sea como mucho igual a 10.

Para calcular la probabilidad acumulada \(P(X\leq 10)\) empleamos la función pbinom:

pbinom(10, 40, 0.3)
## [1] 0.3087427

Es decir, \(P(X\leq 10)\) = 0.3087427


c. Calcule la probabilidad de que X sea inferior a 15.

En este caso, como \(P(X<15) = P(X\leq 14)\), se obtiene

pbinom(14, 40, 0.3)
## [1] 0.8074482


d. Calcule la probabilidad de que X sea superior a 8.

Esta probabilidad se podría calcular como \(P(X > 8) = 1 - P(X\leq 8)\),

1 - pbinom(8, 40, 0.3)
## [1] 0.8889908

aunque también podría cambiarse el argumento lower.tail de la función pbinom, que por defecto toma el valor lower.tail = TRUE (permite calcular la probabilidad de que la variable sea menor o igual que un determinado valor) por la alternativa lower.tail = FALSE (para calcular la probabilidad de que la variable sea mayor que un determinado valor):

pbinom(8, 40, 0.3, lower.tail = FALSE)
## [1] 0.8889908


e. Calcule el valor del percentil 95.

Al tratarse de una variable discreta, debe calcularse el menor valor de c tal que \(P(X \leq c) \geq 0.95\).

Mediante la función qbinom

qbinom(0.95, 40, 0.3)
## [1] 17

se obtiene que el valor 17, pero si calculamos \(P(X\leq 17)\)

pbinom(17, 40, 0.3)
## [1] 0.9680487

no obtenemos exactamente 0.95, sino un valor superior. Puesto que

pbinom(16, 40, 0.3)
## [1] 0.9366871

\(P(X\leq 16)=0.9366871<0.95\), se tiene que 17 será el menor valor c tal que \(P(X \leq c) \geq 0.95\).


Nota: El cálculo de probabilidades con R para cualquier distribución discreta como, por ejemplo, la distribucion de Poisson, sería similar al explicado aquí para la distribución binomial. Para más información, puede consultar la ayuda disponible en help(distributions) o la sección final de este documento sobre Recopilatorio de funciones utilizadas.

Volver al principio


Ejercicio 2. Distribución normal

Sea X una variable aleatoria N(5,3).

  1. Calcule la probabilidad de que X sea menor que 11.

  2. Halle el valor que deja a su izquierda una probabilidad del 99%.

  3. Halle el valor que deja a su derecha una probabilidad del 99%.

  4. Calcule la probabilidad de que X sea inferior a 10 pero superior a 2.


a. Calcule la probabilidad de que X sea menor que 11.

Al contrario de lo que ocurría en el ejercio anterior, al tratarse ahora de una variable continua, se tiene que \(P(X<11)=P(X\leq 11)\). La función a utilizar para llevar a cabo este cálculo será pnorm(q, mean, sd), cuyos argumentos corresponden, respectivamente, al punto en el que se desea calcular la probabilidad acumulada, y a la media y la desviación típica de la distribución normal:

pnorm(11, 5, 3)
## [1] 0.9772499

Es decir, la probabilidad de que \(X\) sea menor de 11 es 0.9772499.


b. Halle el valor que deja a su izquierda una probabilidad del 99%.

El valor que deja a la izquierda una probabilidad del 99% es el percentil 99 (o cuantil 0.99), es decir, aquel valor c tal que \(P(X\leq c)=0.99\).

qnorm(0.99, 5, 3)    
## [1] 11.97904

En este caso, como la distribución es continua, el valor obtenido sí dejará a su izquierda una probabilidad de 0.99:

pnorm(11.97904, 5, 3)    
## [1] 0.99


c. Halle el valor que deja a su derecha una probabilidad del 99%.

El valor c que deja a su derecha una probabilidad del 99% se puede calcular en R de dos formas. La primera, teniendo en cuenta que \(P(X>c)=1-P(X\leq c)=0.99\) y, por tanto, \(P(X\leq c)=0.01\)

qnorm(1 - 0.99, 5, 3)
## [1] -1.979044

Otra posibilidad es utilizar el argumento lower.tail, en concreto lower.tail = FALSE indicando que no se desea trabajar con la probabilidad a la izquierda sino a la derecha:

qnorm(.99, 5, 3, lower.tail = FALSE)
## [1] -1.979044

Sea cual sea el método empleado el valor buscado es -1.979044.


d. Calcule la probabilidad de que X sea inferior a 10 pero superior a 2.

Recuerde que \(P(2<X<10)=P(X<10)-P(X\leq 2)\), y como la distribución normal es continua, coincidiría con \(P(X\leq 10)-P(X\leq 2)\):

pnorm(10, 5, 3) - pnorm(2, 5, 3)
## [1] 0.7935544

Se tiene entonces que \(P(2<X<10)=0.7935544\)


Nota: El cálculo de probabilidades con R para cualquier distribución continua, como la exponencial o las derivadas de la normal (explicadas con detalle en el siguiente ejercicio), sería similar al desarrollado aquí para la distribución normal. Para más información, puede consultar la ayuda disponible en help(distributions) o la sección final de este documento sobre Recopilatorio de funciones utilizadas.


Volver al principio


Ejercicio 3. Distribuciones derivadas de la normal

  1. Dada una variable aleatoria X con distribución t de Student con 10 grados de libertad, halle la probabilidad de que X sea inferior a 5, así como el valor que a su derecha acumula una probabilidad igual a 0.1

  2. Sea X una variable aleatoria chi-cuadrado con 9 grados de libertad. Determine la probabilidad de que X sea inferior a 5.5 y obtenga el cuantil 0.975 para esta distribución.

  3. Sea X una variable aleatoria F de Snedecor con 3 y 8 grados de libertad. Halle la probabilidad de que X sea superior a 7.3 y el percentil 30 de esta distribución.


a. Dada una variable aleatoria X con distribución t de Student con 10 grados de libertad, halle la probabilidad de que X sea inferior a 5, así como el valor que a su derecha acumula una probabilidad igual a 0.1

La primera parte del ejercicio se calcularía con la función pt(q, df), donde el argumento q corresponde al punto en el que calcular la probabilidad acumulada y el argumento df a los grados de libertad de la distribución t:

pt(5, 10)
## [1] 0.9997313

Por tanto, P(X < 5) = 0.9997313.

Para calcular la segunda parte hay dos modos distintos de proceder usando la función qt(p, df), puesto que el argumento p corresponde, por defecto, a la probabilidad a la izquierda, pero se puede cambiar a la probabilidad a la derecha usando lower.tail = FALSE:

qt(1 - 0.1, 10)     # una forma de calcularlo
## [1] 1.372184
qt(0.1, 10, lower.tail = FALSE)     # otra forma de calcularlo
## [1] 1.372184

En cualquier caso, el resultado nos indica que el valor que deja a su derecha una probabilidad igual a 0.1 (el percentil 90 o cuantil 0.9) es 1.372184.


b. Sea X una variable aleatoria chi-cuadrado con 9 grados de libertad. Determine la probabilidad de que X sea inferior a 5.5 y obtenga el cuantil 0.975 para esta distribución

Para calcular P(X < 5.5) en una distribución chi-cuadrado se emplea pchisq(q, df),

pchisq(5.5, 9)
## [1] 0.211272

y se obtiene P(X < 5.5) = 0.211272.

Por otra parte, el cuantil 0.975 de esta distribución es el valor que deja a su izquierda una probabilidad de 0.975,

qchisq(0.975, 9)
## [1] 19.02277

esto es, \(P(X\leq 19.02277)=0.975\).


c. Sea X una variable aleatoria F de Snedecor con 3 y 8 grados de libertad. Halle la probabilidad de que X sea superior a 7.3 y el percentil 30 de esta distribución.

Para calcular P(X > 7.3) basta utilizar la función pf(q, df1, df2) teniendo en cuenta que \(P(X>7.3)=1-P(X\leq 7.3)\),

1 - pf(7.3, 3, 8)
## [1] 0.01117662

o bien

pf(7.3, 3, 8, lower.tail = FALSE)
## [1] 0.01117662

Para calcular el percentil 30, se emplea qf:

qf(0.3, 3, 8)
## [1] 0.4881782


Volver al principio


Nota: El programa R tiene implementadas más distribuciones de probabilidad de las estudiadas aquí. Para obtener más información, puede consultar help(distributions).


Sección 1.2. Representación gráfica de variables aleatorias


Funciones a utilizar: plot, curve, legend, seq

Además, se usarán también algunas de las funciones para el cálculo de probabilidades puntuales o acumuladas ya vistas en la sección anterior.


La representación gráfica de distribuciones de variables aleatorias puede realizarse con ayuda de las funciones plot o curve. Además, la librería de R ofrece un paquete, TeachingDemos, que permite representar algunas de las distribuciones más habituales.


Ejercicio 4. Representación de distribuciones discretas

  1. Represente gráficamente la función de probabilidad, \(P(X=x)\), y la función de distribución, \(F(x)\), de una variable aleatoria que sigue una distribución de Poisson de parámetro \(\lambda=3\).

  2. Represente gráficamente la distribución de probabilidad de una variable aleatoria B(10, 0.5).


a. Represente gráficamente la función de probabilidad, \(P(X=x)\), y la función de distribución, \(F(x)\), de una variable aleatoria que sigue una distribución de Poisson de parámetro \(\lambda=3\).

Vamos a emplear la función plot. Para poder usar esta función, primeramente hemos de calcular probabilidades para el conjunto de los posibles valores que puede tomar la variable.

Como la distribución de Poisson puede tomar cualquier valor entero positivo, vamos a escoger únicamente los primeros quince. Para ello, generamos una secuencia desde 0 hasta 15, con una separación de una unidad entre ellos, con la función seq:

x <- seq(0, 15, 1) 

A continuación, calculamos, para cada uno de esos valores, el valor que toma la función de probabilidad:

probabilidad <- dpois(x, lambda = 3)

Por último, representamos conjuntamente los valores de x y de probabilidad mediante el comando plot,

plot(x, probabilidad, main = "Función de probabilidad P(3)", type = "h")

en el que se han incluido los argumentos main para establecer el título del gráfico y type para especificar el tipo de representación gráfica (en concreto, type = "h" permite obtener las líneas verticales de la función de probabilidad). Observe que si no incluye type = "h", el gráfico solo lo forman los puntos correspondientes a los valores para los que se ha calculado la función de probabilidad.

Para representar la función de distribución de esos mismos valores de X, necesitamos calcular las probabilidades acumuladas,

acumulado <- ppois(x, lambda = 3)

y su gráfico sería

plot(x, acumulado, main = "Función de distribución P(3)", type = "s")

donde el argumento type = "s" especifica que el gráfico tenga forma de escalera, como corresponde a una función de distribución (observe que si no incluye este argumento, el gráfico solo lo forman los puntos correspondientes a los valores para los que se ha calculado la función de distribución).


b. Represente gráficamente la distribución de probabilidad de una variable aleatoria B(10,0.5)

Al igual que en el apartado anterior, utilizamos la función plot, por lo que previamente generamos una secuencia de valores que represente el campo de variación de la variable binomial (de 0 a 10 en este caso).

x <- seq(0, 10, 1)
probabilidad <- dbinom(x, size = 10, prob = 0.5)
plot(x, probabilidad, main = "Función de probabilidad B(10,0.5)", type = "h")

Avanzado: Otra forma de resolver este ejercicio sería usando el paquete TeachingDemos, que tiene implementada la representación gráfica de algunas distribuciones: binomial (vis.binomial), normal (vis.normal), t-Student (vis.t) y gamma (vis.gamma). Para ello, previamente descargamos el paquete del repositorio CRAN mediante la instrucción install.packages("TeachingDemos") y, a continuación, lo ejecutamos:

library(TeachingDemos)

Una vez cargado el paquete, para obtener el gráfico de la función de probabilidad de una binomial, el comando sería:

 vis.binom()

## <Tcl>

En este gráfico se pueden manipular los dos parámetros de la binomial usando el cuadro de diálogo que se muestra a continuación.

alt text


Dependiendo del sistema operativo utilizado en su ordenador, este cuadro de diálogo aparecerá en la pantalla de una forma u otra.


Volver al principio


Ejercicio 5. Representación gráfica de distribuciones continuas

  1. Represente gráficamente la función de densidad de una variable aleatoria N(90, 5).

  2. Represente la función de distribución de una variable aleatoria Gamma de parámetros a = 3 y p = 2.


a. Represente gráficamente la función de densidad de una variable aleatoria N(90, 5).

Mediante un razonamiento similar al realizado en el ejercicio anterior, primero generamos una secuencia de valores, por ejemplo, desde 65 hasta 115, con una separación de medio punto entre ellos (evidentemente, se podría haber escogido cualquier otro rango de valores centrado en la media, ya que el campo de variación de una distribución normal es toda la recta real):

x <- seq(65, 115, 0.5)

Después calculamos, para cada uno de esos valores, el valor que toma la función de densidad, \(f(x)\), mediante la función dnorm(x, mean, sd), siendo x los valores de la variable, mean su media y sd la desviación típica:

densidad <- dnorm(x, 90, 5)

Con el comando plot representamos conjuntamente los valores de la variable y de la función de densidad, correspondiendo el argumento type = "l" a un gráfico de línea (observe que si no incluye este argumento, el gráfico solo lo forman los puntos correspondientes a los valores para los que se ha calculado la función de densidad).

  plot(x, densidad, main = "N(90, 5)", type = "l")


También podríamos haber utilizado la función curve, especificando que se represente la función de densidad para los valores entre 65 y 115:

curve(dnorm(x, 90, 5), 65, 115, main = "N(90,5)")


b. Represente la función de distribución de una variable aleatoria gamma de parámetros a = 3 y p = 2.

Primero generamos posibles valores para la variable,

x <- seq(0, 10, 0.1)

y, a continuación, su función de distribución mediante la función pgamma(q, shape, rate), donde el argumento shape corresponde al parámero \(p\) de la distribución gamma y el argumento rate al parámetro \(a\),

fdistrib <- pgamma(x, shape = 2, rate = 3)

cuya representación viene dada por

plot(x, fdistrib, main = "Función de distribución gamma (a = 3, p = 2))", type = "l")


Volver al principio


Sección 1.3. Teorema central del límite


El teorema central del límite permite aproximar a una distribución normal la suma de un número elevado (en general mayor que 30) de variables aleatorias independientes idénticamente distribuidas con media y varianza finitas.


Ejercicio 6. Aproximación de una distribución binomial a una normal

Represente gráficamente una distribución binomial de parámetros n = 10 y p = 0.8. Represente también la distribución binomial con parámetros n = 50 y p = 0.8 y su aproximación por el teorema central del límite.


Por el teorema central del límite, una distribución binomial (que es suma de distribuciones de Bernoulli independientes con la misma probabilidad de éxito \(p\)) se puede aproximar a una distribución normal si el parámetro \(n\) es suficientemente grande: \[ \frac{B(n, p)-np}{\sqrt {np(1-p)}} \rightarrow N(0,1) \] En la sección anterior ya se ha explicado cómo representar la función de probabilidad de una distribución discreta y la función de densidad de una variable continua. Ahora superpondremos ambas representaciones en un mismo gráfico (con el argumento add = TRUE en la segunda representación, la de la distribución normal con la función curve):

x <- seq(0, 10, 1)
probabilidad <- dbinom(x, 10, 0.8)
plot(x, probabilidad, main = "Comparación entre B(10, 0.8) y Normal", type = "h")
curve(dnorm(x, 10*0.8, sqrt(10*0.8*0.2)), 0, 20, add = TRUE, col = 'red')
legend("topleft", legend = c("Binomial", "Normal"), col = c(1, "red"), ncol = 1, lwd = 1)


Si ahora repetimos el proceso para los parámetros n=50 y p=0.8 en la distribución binomial, podemos observar que la aproximación es mejor:

x <- seq(0, 50, 1)
probabilidad <- dbinom(x, 50, 0.8)
plot(x, probabilidad, main = "Comparación entre B(50, 0.8) y Normal", type = "h")
curve(dnorm(x, 50*0.8, sqrt(50*0.8*0.2)), 0, 50, add = TRUE, col = 'red')
legend("topleft", legend = c("Binomial", "Normal"), col = c(1, "red"), ncol = 1, lwd = 1)


Volver al principio


Ejercicio 7. Comparativa de probabilidades calculadas de forma aproximada según el teorema central del limite con las probabilidades exactas

Calcule, de forma exacta y mediante la aplicación del teorema central del límite, la probabilidad de que la suma de 100 variables aleatorias independientes distribuidas según una Poisson de media 2 sea inferior a 210.


La distribución de Poisson es reproductiva, así que la suma de 100 variables de Poisson independientes da lugar a otra Poisson: \(S_{100}=X_1+X_2+\ldots+X_{100}\sim P\left ( 200 \right )\) siendo cada \(X_i\sim P\left ( 2 \right )\)

Por tanto, la probabilidad exacta es:

ppois(209, 200)
## [1] 0.751189

        \(P(S_{100}<210)=P(S_{100}\leq 209)=0.751189\)

Esta probabilidad se puede calcular aplicando aplicando el teorema central del límite, según el cual: \[ \frac{S_n-E(S_n)}{\sqrt {Var(S_n)}} \rightarrow N(0,1) \]

y, por tanto, \[ \frac{S_{100}-E(S_{100})}{\sqrt {Var(S_{100})}}= \frac{S_{100}-200}{\sqrt {200}}\approx N(0,1) \] Así, \(S_{100}=X_1+X_2+\ldots+X_{100}\) se distribuye aproximadamente \(N(200,\sqrt{200})\). Hay varias posibilidades para calcular esta probabilidad aproximada:

  • \(P(S_{100}<210)=P(S_{100}\leq 209)\cong P(Z\leq (209-200)/\sqrt{200})=0.7377409\)

    pnorm(209, 200, sqrt(200))
    ## [1] 0.7377409
  • \(P(S_{100}<210)\cong P(Z\leq (210-200)/\sqrt{200})=0.7602499\)

    pnorm(210, 200, sqrt(200))
    ## [1] 0.7602499
  • Utilizando la corrección por continuidad

    \(P(S_{100}<210)=P(S_{100}\leq 209)=P(S_{100} <209.5)\cong P(Z\leq (209.5-200)/\sqrt{200})= 0.749129\)

    pnorm(209.5, 200, sqrt(200))
    ## [1] 0.749129


Nota: Observe que la probabilidad calculada utilizando la corrección por continuidad está más próxima a la probabilidad exacta.


Volver al principio


MATERIAL DE APOYO


Cálculo de probabilidades y cuantiles con Geogebra

Geogebra es un paquete gratuito y de acceso directo que no necesita instalación. Está disponible con sólo acceder a este link: Geogebra. Una vez que se entra en geogebra, se pincha en Iniciar GeoGebra.

alt text


En la pantalla emergente se pincha sobre Probabilidad .
alt text


De esta forma se carga un applet que nos permite visualizar probabilidades y cuantiles de distintas distribuciones.

alt text


Volver al principio


Apps con Geogebra

Los siguientes apps pueden servir de ayuda para entender mejor el concepto de cuantil, tanto para una variable aleatoria discreta como para una variable aleatoria continua:


RECOPILATORIO DE FUNCIONES UTILIZADAS


Funciones relativas a distribuciones de probabilidad DISCRETAS


1. Función dbinom: Permite calcular probabilidades puntuales, \(P(X = x)\), de una distribución binomial.

dbinom(x, size, prob)

Argumentos   
x valor para el que se desea calcular su probabilidad puntual (número de éxitos obtenidos en el experimento); también puede ser un vector de valores, en cuyo caso devuelve un vector con las probabilidades puntuales
size número de ensayos o experimentos Bernoulli (parámetro \(n\) de la distribución binomial)
prob probabilidad de éxito en un ensayo o experimento Bernoulli (parámetro \(p\) de la distribución binomial)



2. Función pbinom: Calcula la función de distribución de una variable aleatoria binomial, \(P(X \leq x)\).

pbinom(q, size, prob, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
size número de ensayos (parámetro \(n\) de la distribución binomial)
prob probabilidad de éxito en el experimento (parámetro \(p\) de la distribución binomial)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda o la derecha del valor; como la opción por defecto TRUE corresponde a \(P(X \leq x)\), si deseamos \(P(X > x)\), cambiaremos este argumento a FALSE



3. Función qbinom: Calcula los cuantiles de una distribución binomial; es decir, dada una probabilidad \(p\) proporciona el menor valor \(c\) tal que \(P(X \leq c) \geq p\).

qbinom(p, size, prob, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el menor valor \(c\) tal que \(P(X \leq c) \geq p\)
size número de ensayos (parámetro \(n\) de la distribución binomial)
prob probabilidad de éxito en el experimento (parámetro \(p\) de la distribución binomial)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha



4. Función dpois: Permite calcular probabilidades puntuales de una distribución de Poisson, \(P(X = x)\).

dpois(x, lambda)

Argumentos   
x valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) puntual(es)
lambda parámetro \(\lambda\) de la distribución de Poisson



5. Función ppois: Calcula la función de distribución de una variable aleatoria de Poisson, \(P(X \leq x)\).

ppois(q, lambda, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
lambda parámetro \(\lambda\) de la distribución de Poisson
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda o la derecha del valor; como la opción por defecto TRUE corresponde a \(P(X \leq x)\), si deseamos \(P(X > x)\), cambiaremos este argumento a FALSE



6. Función qpois: Calcula los cuantiles de una distribución de Poisson; es decir, dada una probabilidad \(p\) proporciona el menor valor \(c\) tal que \(P(X \leq c) \geq p\).

qpois(p, lambda, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el menor valor \(c\) tal que \(P(X \leq c) \geq p\)
lambda parámetro \(\lambda\) de la distribución de Poisson
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha



Volver al principio


Funciones relativas a distribuciones de probabilidad CONTINUAS


7. Función dchisq: Proporciona el valor de la función de densidad de una distribución chi-cuadrado.

dchisq(x, df)

Argumentos   
x valor (o vector de valores) para el que se desea calcular la función de densidad
df grados de libertad de la distribución chi-cuadrado



8. Función pchisq: Calcula la función de distribución de una variable aleatoria chi-cuadrado.

pchisq(q, df, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
df grados de libertad de la distribución chi-cuadrado
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha del valor



9. Función qchisq: Calcula los cuantiles de una distribución chi-cuadrado; es decir, dada una probabilidad \(p\) proporciona el valor \(c\) tal que \(P(X \leq c) = p\).

qchisq(p, df, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el valor \(c\) tal que \(P(X \leq c) = p\)
df grados de libertad de la distribución chi-cuadrado
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha



10. Función dexp: Proporciona el valor de la función de densidad de una distribución exponencial.

dexp(x, rate = 1)

Argumentos   
x valor (o vector de valores) para el que se desea calcular la función de densidad
rate parámetro \(\lambda\) de la distribución exponencial (por defecto toma el valor 1)



11. Función pexp: Calcula la función de distribución de una variable aleatoria exponencial, \(P(X \leq x)\).

pexp(q, rate = 1, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
rate parámetro \(\lambda\) de la distribución exponencial (por defecto toma el valor 1)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha del valor



12. Función qexp: Calcula los cuantiles de una distribución exponencial; es decir, dada una probabilidad \(p\) proporciona el valor \(c\) tal que \(P(X \leq c) = p\).

qexp(p, rate = 1, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el valor \(c\) tal que \(P(X \leq c) = p\)
rate parámetro \(\lambda\) de la distribución exponencial (por defecto toma el valor 1)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha



13. Función df: Proporciona el valor de la función de densidad de una distribución F de Snedecor.

df(x, df1, df2)

Argumentos   
x valor (o vector de valores) para el que se desea calcular la función de densidad
df1 grados de libertad del numerador de la distribución F
df2 grados de libertad del denominador de la distribución F



14. Función pf: Calcula la función de distribución de una variable aleatoria F de Snedecor, \(P(X \leq x)\).

pf(q, df1, df2, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
df1 grados de libertad del numerador de la distribución F
df2 grados de libertad del denominador de la distribución F
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha del valor



15. Función qf: Calcula los cuantiles de una distribución F; es decir, dada una probabilidad \(p\) proporciona el valor \(c\) tal que \(P(X \leq c) = p\).

qf(p, df1, df2, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el valor \(c\) tal que \(P(X \leq c) = p\)
df1 grados de libertad del numerador de la distribución F
df2 grados de libertad del denominador de la distribución F
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha



16. Función dgamma: Proporciona el valor de la función de densidad de una distribución gamma.

dgamma(x, shape, rate = 1)

Argumentos   
x valor (o vector de valores) para el que se desea calcular la función de densidad
shape parámetro \(p\) de la distribución gamma
rate parámetro \(a\) de la distribución gamma (por defecto toma el valor 1)



17. Función pgamma: Calcula la función de distribución de una variable aleatoria gamma, \(P(X \leq x)\).

pgamma(q, shape, rate = 1, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
shape parámetro \(p\) de la distribución gamma
rate parámetro \(a\) de la distribución gamma (por defecto toma el valor 1)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha del valor



18. Función qgamma: Calcula los cuantiles de una distribución gamma; es decir, dada una probabilidad \(p\) proporciona el valor \(c\) tal que \(P(X \leq c) = p\).

qgamma(p, shape, rate = 1, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el valor \(c\) tal que \(P(X \leq c) = p\)
shape parámetro \(p\) de la distribución gamma
rate parámetro \(a\) de la distribución gamma (por defecto toma el valor 1)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha



19. Función dnorm: Proporciona el valor de la función de densidad de una distribución normal.

dnorm(x, mean = 0, sd = 1)

Argumentos   
x valor (o vector de valores) para el que se desea calcular la función de densidad
mean media de la distribución normal (por defecto toma el valor 0)
sd desviación típica de la distribucion normal (por defecto toma el valor 1)



20. Función pnorm: Calcula la función de distribución de una variable aleatoria normal, \(P(X \leq x)\).

pnorm(q, mean = 0, sd = 1, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
mean media de la distribución normal (por defecto toma el valor 0)
sd desviación típica de la distribución normal (por defecto toma el valor 1)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha del valor



21. Función qnorm: Calcula los cuantiles de una distribución normal; es decir, dada una probabilidad \(p\) proporciona el valor \(c\) tal que \(P(X \leq c) = p\).

qnorm(p, mean = 0, sd = 1, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el valor \(c\) tal que \(P(X \leq c) = p\)
mean media de la distribución normal (por defecto toma el valor 0)
sd desviación típica de la distribución normal (por defecto toma el valor 1)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha



22. Función dt: Proporciona el valor de la función de densidad de una distribución t de Student.

dt(x, df)

Argumentos   
x valor (o vector de valores) para el que se desea calcular la función de densidad
df grados de libertad de la distribución t



23. Función pt: Calcula la función de distribución de una variable aleatoria t de Student, \(P(X \leq x)\).

pt(q, df, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
df grados de libertad de la distribución t
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha del valor



24. Función qt: Calcula los cuantiles de una distribución t de Student; es decir, dada una probabilidad \(p\) proporciona el valor \(c\) tal que \(P(X \leq c) = p\).

qt(p, df, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el valor \(c\) tal que \(P(X \leq c) = p\)
df grados de libertad de la distribución t
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha



25. Función dunif: Proporciona el valor de la función de densidad de una distribución uniforme.

dunif(x, min = 0, max = 1)

Argumentos   
x valor (o vector de valores) para el que se desea calcular la función de densidad
min extremo inferior del intervalo en el que está definida la distribución uniforme (por defecto toma el valor 0)
max extremo superior del intervalo en el que está definida la distribución uniforme (por defecto toma el valor 1)



26. Función punif: Calcula la función de distribución de una variable aleatoria uniforme, \(P(X \leq x)\).

punif(q, min = 0, max = 1, lower.tail = TRUE)

Argumentos   
q valor (o vector de valores) para el que se desea calcular la(s) probabilidad(es) acumulada(s)
min extremo inferior del intervalo en el que está definida la distribución uniforme (por defecto toma el valor 0)
max extremo superior del intervalo en el que está definida la distribución uniforme (por defecto toma el valor 1)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) o la derecha del valor



27. Función qunif: Calcula los cuantiles de una distribución uniforme; es decir, dada una probabilidad \(p\) proporciona el valor \(c\) tal que \(P(X \leq c) = p\).

qunif(p, min = 0, max = 1, lower.tail = TRUE)

Argumentos   
p probabilidad \(p\) para la que se busca el valor \(c\) tal que \(P(X \leq c) = p\)
min extremo inferior del intervalo en el que está definida la distribución uniforme (por defecto toma el valor 0)
max extremo superior del intervalo en el que está definida la distribución uniforme (por defecto toma el valor 1)
lower.tail valor lógico que indica si la probabilidad acumulada es a la izquierda (opción por defecto) (opción por defecto) o la derecha



Volver al principio



Otras funciones utilizadas


28. Función c: Es una función genérica que combina sus argumentos formando un vector.

c(...)

Argumentos   
... elementos que van a constituir el vector, que se introducen separados por comas (si son caracteres cualitativos se escriben entre comillas)



29. Función curve: Permite representar cualquier función dentro de un intervalo.

curve(expr, from = NULL, to = NULL, add = FALSE, type = "l", main, col, ...)

Argumentos
expr expresión de la función a representar
from, to rango sobre el que se desea dibujar la función
add por defecto toma el valor lógico FALSE, por lo que, si queremos dibujar la curva sobre un gráfico ya existente, lo cambiaremos por TRUE
type indica el tipo de gráfico; por defecto, se dibuja una linea, pero se puede cambiar a otras opciones como, por ejemplo, "o" para puntos superpuestos sobre una línea
main título del gráfico
col color de la línea



30. Función legend: Permite añadir leyendas a los gráficos.

legend(x, y, legend, col, lty, lwd, bty = "o", ncol = 1, ...)

Argumentos   
x, y coordenadas de la posición de la leyenda; se pueden usar también expresiones como "top", "topright", "center", "left", etc.
legend texto que se desea incluir en la leyenda
col color de las líneas o puntos que aparecen en la leyenda
lty, lwd tipo de línea y anchura de la línea (al menos uno de estos argumentos debe especificarse para que aparezcan las líneas en la leyenda)
bty tipo de caja para recuadrar la leyenda (la opción por defecto, "o" es un recuadro, que se puede eliminar usando "n")
ncol número de columnas donde ubicar los items de la leyenda; por defecto es 1 (leyenda vertical)



31. Función library: Permite cargar paquetes que ya están instalados en el ordenador.

library(package, ...)

Argumentos   
package nombre del paquete que se quiere cargar



32. Función plot: Permite representar gráficamente un conjunto de datos.

plot(x, y, type, main, ...)

Argumentos   
x objeto que contiene las coordenadas x de los puntos
y objeto que contiene las coordenadas y de los puntos
type tipo de gráfico; por omisión, se dibuja la nube de puntos o diagrama de dispersión, pero se puede cambiar a otras opciones, como "l" para línea, "o" para puntos superpuestos sobre una línea o "h" para líneas verticales
main título del gráfico



33. Función seq: Genera una secuencia de valores.

seq(from, to, by, ...)

Argumentos   
from primer valor de la secuencia
to último valor de la secuencia
by incremento entre un elemento y el siguiente



34. Función sqrt: Calcula la raiz cuadrada de un número.

sqrt(x)

Argumentos   
x número



Volver al principio