Rectas de Regresión

Vamos a calcular las rectas de regresión de los datos xi, yi. Los datos x serán la primera fila de la matriz introducida y los de y la segunda, u es el vector de la misma dimensión con todas sus coordenadas 1,

Introduzca una matriz de dos filas o dos columnas:

EJEMPLOS
1,2,3,4,5,1,2,3,4,5,1,2,3,4,5
7,6,5,4,3,6,5,4,3,2,5,4,3,2,1
7,6,5,4,3,6,5,4,3,2,5,4,3,2,1
1,2,3,4,5,1,2,3,4,5,1,2,3,4,5
1,2,3,4,5,4,3,2,1,2,3,4,5
2,1,-1,0,-1,-1,1,1,0,0,0,-2,-2
5,8,1,7,3,6,8,5,6,2
5,11,-3,9,3,7,11,5,5,-1
275
378
585
790
2163
3090
40121
2575

Formato: Para introducir dos filas separe los elementos de una fila con comas, pulse intro para cambiar de fila.  Si introduce dos columnas, en modo tabla como los ejemplos superiores

   

Explicación

Cada recta Ri está determinada por la combinación lineal ax+by+cu que verifica i):

1) multiplicada por los vectores y, u da 0; por x da el cuadrado del volumen de <x, y, u>

2) multiplicada por los vectores x, u da 0; por y da el cuadrado del volumen de <x, y, u>

3) multiplicada por los vectores x, y da 0; por u da el cuadrado del volumen de <x, y, u>

Buscamos la combinación lineal ax+by+cu que más se aproxime a cero sin ser los tres coeficientes iguales a 0, así que a, b o c , uno al menos es distinto de 0

Impongamos que b sea distinto de cero, sea pues b=1. El método de los mínimos cuadrados lo que hace es buscar a, c tales que

la distancia de -ax-cu a y sea mínima,

eso se cumple con el pie de la perpendicular desde y a <x, u>, la diferencia de y a ese pie es perpendicular a <x, u>

(-ax-cu - y)·x=0

(-ax-cu - y)·u=0

o lo que es lo mismo

(ax+by+cu)·x=0, es decir. (a, b, c)·(x·x, y·x, u·x)=0

(ax+by+cu)·u=0, es decir. (a, b, c)·(x·u, y·u, u·u)=0

 

Pues esto es lo que se hace al tomar los adjuntos (como en el producto vectorial para las filas 1 y 3 de M), pero como queda otra condición (por no decidir que b=1) se escoge

 

(ax+by+cu)·y=vol2(x, y, u)

 

Estas tres condiciones las cumplen a, b y c si son los adjuntos de la fila 2, (la tercera condición es el desarrollo del det M por la fila 2).

 

En cuanto a los coeficientes: El coeficiente de regresión al cuadrado es r12
geométricamente

r12 = cos2 (<x, u>, <y, u>)

r13 = cos2 (<x, y>, <u, y>)

r23 = cos2 (<y, x>, <u, x>)

 Cuando algún rij es 1,  la recta formada por la nube de puntos (xi, yi) es perfecta.

 

Más sobre geometría de tres vectores en IRn en este enlace

 

 

 

Problema de Regresión Lineal

Enunciado

Un investigador está interesado en predecir el precio de las viviendas en una ciudad específica utilizando como variable independiente el tamaño de la vivienda en metros cuadrados. Se ha recopilado una muestra de datos que incluye el tamaño de la vivienda (en metros cuadrados) y el precio de venta (en miles de euros). El objetivo es encontrar la relación lineal entre estas dos variables y utilizarla para predecir el precio de una vivienda basada en su tamaño.

Datos

Puedes copiar los datos de la tabla y pegarlos en el imput de arriba, para así ver las rectas de regresión.

Tamaño (m²) Precio (miles de €)

Impacto de las Horas de Estudio en las Calificaciones

Datos de Estudio y Calificaciones

En un estudio sobre el impacto de las horas de estudio en las calificaciones de los estudiantes, se recolectaron los siguientes pares de datos:

Horas de Estudio (h) Calificación
275
378
585
790
992
480
688
891
1095
170

Temperatura media en el mes de julio en España

Año Temperatura media
1920 23.3
1930 23.4
1940 24.2
1950 24.5
1960 24.2
1970 24.8
1980 24.4
1990 24.5
2000 25.5
2010 24.5
2020 25.0
Datos según un modelo hipotético. pdf


  Consolación Ruiz Gil Junio 2024

  https://www.matsolin.com/regresion/regresion2.htm   js realizado con chatGPT