joblib basic#

scikit-learn এর specific ক্ষেত্রে large numpy array serialization এ Pickel এর থেকে joblib বেশি efficient. linear-regression এর train data joblib ব্যবহার করে একটা file এ save করে রাখা যায়। এবং প্রয়োজনে save file ব্যবহার করে previously train data থেকে test predection করা যায়।

simple linear regression

import pandas as pd
data= pd.read_csv('Salary_Data.csv')

## apply linear regression 
from sklearn import linear_model
model= linear_model.LinearRegression()

# fit data
model.fit(data[["YearsExperience"]],data["Salary"])

# predict data
model.predict([[60000]])

Output:

array([5.67023531e+08])

.dump()#

joblib import করে বা joblib থেকে dump method import করে train model file এ save করে রাখা যায়। dump function ব্যবহার করা হয় model কে extended file আকারে save করে রাখার জন্য।

joblib.dump(model, “fileName”)

Save Trained Model Using joblib

#import joblib
from joblib import dump

joblib.dump(model, 'model_joblib')

Output:

['model_joblib']

Save Trained Model Using joblib full code

import pandas as pd
data= pd.read_csv('Salary_Data.csv')

## apply linear regression 
from sklearn import linear_model
model= linear_model.LinearRegression()

# fit data
model.fit(data[["YearsExperience"]],data["Salary"])

# predict data
print(model.predict([[60000]]))

# dump train data 
from joblib import dump
joblib.dump(model, 'model_joblib')

Output:

[5.67023531e+08]

['model_joblib']

.load()#

joblib import করে বা joblib থেকে load method import করে train model saved file ব্যবহার করে test purpose ব্যবহার করা যায়। load function ব্যবহার করা হয় saved model file কে আবার trained model আকারে একটা variable এ পাওয়ার জন্য ।

joblib.load(“fileName”)

Load save model full code

from joblib import load

loadModel = joblib.load('model_joblib')

from sklearn import linear_model
loadModel.predict([[60000]])

Output:

array([5.67023531e+08])

Full code#

import pandas as pd
data= pd.read_csv('Salary_Data.csv')

## apply linear regression 
from sklearn import linear_model
model= linear_model.LinearRegression()

# fit data
model.fit(data[["YearsExperience"]],data["Salary"])

# predict data
print(model.predict([[60000]]))

# dump train data to save as model_joblib
from joblib import dump
joblib.dump(model, 'model_joblib')


# load train model file to predict
from joblib import load

loadModel = joblib.load('model_joblib')

from sklearn import linear_model
loadModel.predict([[60000]])

Output:

[5.67023531e+08]

array([5.67023531e+08])