import numpy as np
import torch 
import matplotlib.pyplot as plt
from torch import nn
import pandas as pd

input = [1, 2, 3, 4, 5, 6, 7, 8, 9,10]
output = [4, 7, 5.5, 10.0, 9.0, 14.5, 12.0, 18.0, 15, 20]

df = pd.DataFrame({
    "input": input, 
    "output": output
})

plt.scatter(input,output)
plt.show()

X = torch.tensor(df["input"].values,dtype=torch.float32).unsqueeze(1)
y = torch.tensor(df["output"].values,dtype=torch.float32).unsqueeze(1)

print(X.shape)
print(y.shape)

torch.Size([10, 1])
torch.Size([10, 1])

model = nn.Linear(1, 1)  #y = wx+b , w=weight=slope, b=bias=intercept
loss_fn = torch.nn.MSELoss() #Loss = Mean Squared Error (MSE) 
optimizer = torch.optim.SGD(model.parameters(), lr=0.001) #Optimizer = Stochastic Gradient Descent with a very small learning rate.

with torch.no_grad():
    model.weight.fill_(0)
    model.bias.fill_(10)

losses_list = []
w_list = []
b_list = []
parameter_list = []

for i in range(0,20000):

    # Training pass
    optimizer.zero_grad()
    outputs = model(X)
    loss = loss_fn(outputs, y)
    loss.backward()
    optimizer.step()

    w = model.weight.item()
    b = model.bias.item()

    w_list.append(w)
    b_list.append(b)
    parameter_list.append((w,b))

    # loss fucntion
    losses_list.append(loss.item())

plt.plot(losses_list)
plt.show()

w = model.weight.item()
b = model.bias.item()
print(f"Trained formula: y = {w:.4f} * x + {b:.4f}")
print(f"Trained formula: y = {round(w,2):} * x + {round(b,2):}")

Trained formula: y = 1.6604 * x + 2.3684
Trained formula: y = 1.66 * x + 2.37

x = np.linspace(0,10,50)

y_hat = w*x + b

plt.scatter(input,output)
plt.plot(x,y_hat)
plt.show()

plt.figure(figsize=(8,5),dpi=300)
for w,b in parameter_list:    
    x = np.linspace(0,10,50)
    # y start
    y_start = 0*x + 5
    # updated during training
    y = w*x + b

    plt.plot(x,y, linewidth = 1)

x_start = np.linspace(0,10,50)    
y_start = 0*x + 10
plt.plot(x_start,y_start, linewidth = 1)
plt.scatter(input,output, zorder=5)
plt.show()

xi = df["input"]
yi = df["output"]

xi = xi
yi = yi
xi_times_yi = xi * yi
xi_hat2 = xi**2
yi_hat2 = yi**2
n = len(xi)

sum_xi = np.sum(xi)
sum_yi = np.sum(yi)
sum_xi_times_yi = np.sum(xi_times_yi)
sum_xi_hat2 = np.sum(xi_hat2)
sum_yi_hat2 = np.sum(yi_hat2)

mean_xi = np.mean(xi)
mean_yi = np.mean(yi)

b_ = ((n*sum_xi_times_yi)-(sum_xi*sum_yi))/((n*sum_xi_hat2)-(sum_xi)**2)
b_ = round(b_,2)

a = (sum_yi - b_*sum_xi)/n
print(b_)

1.66

print(f"Linear regression: y = {round(a,2)} * x + {round(b_,2)}")

Linear regression: y = 2.37 * x + 1.66

print(f"Method 1: y = {round(w,2)} * x + {round(b,2)}")
print(f"Method 2: y = {round(b_,2)} * x + {round(a,2)}")

Method 1: y = 1.66 * x + 2.37
Method 2: y = 1.66 * x + 2.37

Readme¶

Exploratory Data Analysis¶

Libraries¶

Load Data¶

Visuzalize data¶

Method 1: Linear Regression via Neuron trained with Gradient Descent¶

Model¶

visualizing linear regression¶

Part 2: Linear Regression by Least Squered Errors¶

Conclusion¶