joblib basic#
scikit-learn এর specific ক্ষেত্রে large numpy array serialization এ Pickel এর থেকে joblib বেশি efficient. linear-regression এর train data joblib ব্যবহার করে একটা file এ save করে রাখা যায়। এবং প্রয়োজনে save file ব্যবহার করে previously train data থেকে test predection করা যায়।
simple linear regression
import pandas as pd
data= pd.read_csv('Salary_Data.csv')
## apply linear regression
from sklearn import linear_model
model= linear_model.LinearRegression()
# fit data
model.fit(data[["YearsExperience"]],data["Salary"])
# predict data
model.predict([[60000]])
Output:
array([5.67023531e+08])
.dump()#
joblib import করে বা joblib থেকে dump method import করে train model file এ save করে রাখা যায়। dump function ব্যবহার করা হয় model কে extended file আকারে save করে রাখার জন্য।
joblib.dump(model, “fileName”)
Save Trained Model Using joblib
#import joblib
from joblib import dump
joblib.dump(model, 'model_joblib')
Output:
['model_joblib']
Save Trained Model Using joblib full code
import pandas as pd
data= pd.read_csv('Salary_Data.csv')
## apply linear regression
from sklearn import linear_model
model= linear_model.LinearRegression()
# fit data
model.fit(data[["YearsExperience"]],data["Salary"])
# predict data
print(model.predict([[60000]]))
# dump train data
from joblib import dump
joblib.dump(model, 'model_joblib')
Output:
[5.67023531e+08]
['model_joblib']
.load()#
joblib import করে বা joblib থেকে load method import করে train model saved file ব্যবহার করে test purpose ব্যবহার করা যায়। load function ব্যবহার করা হয় saved model file কে আবার trained model আকারে একটা variable এ পাওয়ার জন্য ।
joblib.load(“fileName”)
Load save model full code
from joblib import load
loadModel = joblib.load('model_joblib')
from sklearn import linear_model
loadModel.predict([[60000]])
Output:
array([5.67023531e+08])
Full code#
import pandas as pd
data= pd.read_csv('Salary_Data.csv')
## apply linear regression
from sklearn import linear_model
model= linear_model.LinearRegression()
# fit data
model.fit(data[["YearsExperience"]],data["Salary"])
# predict data
print(model.predict([[60000]]))
# dump train data to save as model_joblib
from joblib import dump
joblib.dump(model, 'model_joblib')
# load train model file to predict
from joblib import load
loadModel = joblib.load('model_joblib')
from sklearn import linear_model
loadModel.predict([[60000]])
Output:
[5.67023531e+08]
array([5.67023531e+08])