Los modelos de regresión representan la relación que existe entre las variables, ajustando una línea entre los datos observados. Los modelos de regresión lineal utilizan una línea en recta, en cambio los modelos de regresión logística y no lineal utilizan una línea curva. La regresión brinda la posibilidad de poder estimar cómo es que cambia una variable dependiente, a medida que van cambiando las variables independientes.

La regresión lineal simple es utilizada para poder estimar la relación que existe entre dos variables cuantitativas. La regresión lineal simple puede ser utilizada para saber:

Que tan fuerte es la relación entre dos variables (por ejemplo, la relación entre la lluvia y la erosión del suelo).
El valor de la variable dependiente a un cierto valor de la variable independiente (por ejemplo, la cantidad de erosión del suelo a un cierto nivel de lluvia).

Ejemplo

Supongamos que usted es un investigador social que está interesado en la relación entre los ingresos y la felicidad. Usted realiza una encuesta a 500 personas, donde sus sueldos oscilan entre los $ 15k y $ 75k y les pides que clasifiquen su felicidad en una escala del 1 al 10.

La variable independiente (ingreso) y su variable dependiente (felicidad) son cuantitativas, por lo que usted puede realizar un análisis de regresión para ver si existe una relación lineal entre ellas.

Si posee más de una variable independiente, lo ideal es que utilice la regresión lineal múltiple.

Suposiciones de regresión lineal simple

La regresión lineal simple es una prueba paramétrica, esto significa que hace ciertas suposiciones sobre los datos. Estos supuestos son:

Homogeneidad de la varianza (homocedasticidad): el tamaño del error en la predicción no cambia drásticamente entre los valores de la variable independiente.
Independencia de las observaciones: las observaciones en el conjunto de datos se recopilaron utilizando métodos de muestreo estadísticamente válidos, y no hay relaciones ocultas entre las observaciones.
Normalidad: los datos siguen una distribución normal.

La regresión lineal hace una suposición adicional:

La relación entre la variable independiente y dependiente es lineal: la línea de mejor ajuste mediante los puntos de datos es una línea recta (en lugar de una curva o algún tipo de factor de agrupación).
Si sus datos no cumplen con los supuestos de homocedasticidad o normalidad, puede utilizar una prueba no paramétrica, como la prueba de rango de Spearman.

Si sus datos no cumplen con el supuesto de independencia de las observaciones (por ejemplo, si las observaciones se repiten con el tiempo), puede realizar un modelo lineal de efectos mixtos que tenga en cuenta la estructura adicional en los datos.

Cómo realizar una regresión lineal simple

La fórmula para una regresión lineal simple es:

y es el valor predicho de la variable dependiente ( y ) para cualquier valor dado de la variable independiente ( x ).
B 0 es la intersección, el valor predicho de y cuando x es 0.
B 1 es el coeficiente de regresión: cuánto esperamos que cambie y a medida que x aumenta.
x es la variable independiente (la variable que esperamos influye en y ).
e es el error de la estimación, o cuánta variación hay en nuestra estimación del coeficiente de regresión.

La regresión lineal encuentra la línea de la mejor línea de ajuste mediante sus datos al buscar el coeficiente de regresión (B 1) que minimiza el error total (e) del modelo.

RECOMENDADO:  Saldo final: ¿Qué es un Saldo final / Balance de cierre?

Si bien puede realizar una regresión lineal a mano, este es un proceso tedioso, por lo que la mayoría de las personas usan programas estadísticos para ayudarles a analizar rápidamente los datos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *