fbpx

Бид sklearn library болон түүнийг хэрхэн машин сургалтын алгоритмыг хэрэгжүүлэхэд ашиглах талаар суралцах болно. Бодит ертөнцөд бид үүнийг ашиглах шаардлагатай болгонд хэцүү алгоритмыг бий болгохыг хүсдэггүй. Хэдийгээр алгоритмыг анхнаасаа бий болгох нь түүний үйл ажиллагааны үндсэн ойлголтыг ойлгох гайхалтай арга боловч бид шаардлагатай үр ашиг, найдвартай байдалд хүрч чадахгүй байж магадгүй юм.

Scikit-learn нэртэй Python модуль нь хяналттай болон хяналтгүй сургалтын төрөл бүрийн арга техникийг санал болгодог. Энэ нь NumPy, Pandas, Matplotlib зэрэг таны мэддэг хэд хэдэн технологид суурилсан болно.

Sklearn гэж юу вэ?

Францын судлаач эрдэмтэн Дэвид Курнапогийн scikits.learn нь Google-ийн Summer of Code компани бөгөөд scikit-learn төсөл анх хэрэгжиж эхэлсэн юм. Энэ нэр нь SciPy-ийн “SciKit” (SciPy Toolkit) нэртэй өөрчилсөн гэсэн санааг илэрхийлдэг бөгөөд үүнийг бие даан бүтээж, хэвлүүлсэн. Хожим нь бусад програмистууд үндсэн кодын санг дахин бичсэн.

Францын Роккенкурт дахь Компьютерийн шинжлэх ухаан, автоматжуулалтын судалгааны Францын хүрээлэн нь 2010 онд Александр Грамфорт, Гаэл Варокуа, Винсент Мишель, Фабиан Педрегоса нарын удирдлаган дор уг ажлыг удирдан явуулсан. Тухайн жилийн 2-р сарын 1-нд тус байгууллага төслийн анхны албан ёсны хувилбарыг гаргасан. 2012 оны 11-р сард scikit-learn болон scikit-image-ийг “сайн арчилгаатай, алдартай” скикитуудын жишээ болгон дурдсан. GitHub дээр хамгийн өргөн хэрэглэгддэг машин сургалтын багцуудын нэг бол Python-ийн scikit-learn юм.

Машин сургалтын алгоритмыг хэрэгжүүлэхэд Scikit-Learn-ийг ашиглахын ашиг тус

Та ML-ийн тоймыг хайж байгаа эсэх, хурдан хурдтай болох эсвэл ML сурах хамгийн сүүлийн хэрэгслийг хайж байгаа эсэхээс үл хамааран scikit-learn нь сайн баримтжуулсан бөгөөд ойлгоход хялбар гэдгийг олж мэдэх болно. Энэхүү өндөр түвшний багаж хэрэгслийн тусламжтайгаар та урьдчилан таамагласан өгөгдлийн шинжилгээний загварыг хурдан бүтээж, цуглуулсан өгөгдөлд нийцүүлэн ашиглах боломжтой. Энэ нь дасан зохицох чадвартай бөгөөд бусад Python номын сангуудтай зэрэгцэн сайн ажилладаг.

Шугаман регрессийн алгоритмын жишээ

  1. # Python program to show how to use sklearn to perform linear regression  
  2.   
  3. # Importing the required modules and classes  
  4. import numpy as np  
  5. from sklearn.model_selection import train_test_split  
  6. from sklearn.linear_model import LinearRegression  
  7. from sklearn.datasets import load_iris  
  8.   
  9. # Loading our load_iris dataset  
  10. X, Y = load_iris( return_X_y=True )  
  11.   
  12. # Printing the shape of the complete dataset  
  13. print(X.shape)  
  14.   
  15. # Splitting the dataset into the training and validating datasets  
  16. X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.4, random_state = 10)  
  17.   
  18. # Printing the shape of training and validation data  
  19. print(X_train.shape, Y_train.shape)  
  20. print(X_test.shape, Y_test.shape)  
  21.   
  22. # Training the model using the training dataset  
  23. lreg = LinearRegression()  
  24. lreg.fit(X_train, Y_train)  
  25.   
  26. # Printing the Coefficients of the linear Regression model  
  27. print(“Coefficients of each feature: “, lreg.coef_)  
  28.   
  29. # Printing the accuracy score of the trained model  
  30. score = lreg.score(X_test, Y_test)  
  31. print(“Accuracy Score: “, score)  

Логистик регрессийн алгоритмын жишээ

  1. # Python code to see how to perform Logistic Regression using sklearn.linear_model  
  2.   
  3. # Importing the required modules and classes  
  4. from sklearn.datasets import load_iris  
  5. from sklearn.metrics import accuracy_score  
  6. from sklearn.linear_model import LogisticRegression  
  7. from sklearn.model_selection import train_test_split  
  8.   
  9. # Loading our dataset  
  10. data = load_iris()  
  11.   
  12. # Splitting the independent and dependent variables  
  13. X = data.data  
  14. Y = data.target  
  15. print(“The size of the complete dataset is: “, len(X))  
  16.   
  17. # Creating an instance of the LogisticRegression class for implementing logistic regression   
  18. log_reg = LogisticRegression()  
  19.   
  20. # Segregating the training and testing dataset  
  21. X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state = 10)  
  22.   
  23. # Performing the logistic regression on train dataset  
  24. log_reg.fit(X_train, Y_train)  
  25.   
  26. # Printing the accuracy score  
  27. print(“Accuracy score of the predictions made by the model: “, accuracy_score(log_reg.predict(X_test), Y_test))  

Машин сургалтын дэвшилтэт алгоритмууд Random Forest

  1. # Python program to show how to Random Forest Algorithm  
  2.   
  3. # importing the required libraries  
  4. from sklearn import datasets   
  5. from sklearn.model_selection import train_test_split  
  6. from sklearn.metrics import accuracy_score   
  7. from sklearn.ensemble import RandomForestClassifier  
  8.    
  9. # Loading the dataset  
  10. X, Y = load_iris(return_X_y = True)     
  11.   
  12. # Segregating the dataset into training and testing dataset  
  13. X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.4)  
  14.   
  15. # creating an object of the RF classifier class  
  16. rf = RandomForestClassifier(n_estimators = 100)   
  17.    
  18. # Training the classifier model on the training dataset  
  19. rf.fit(X_train, Y_train)  
  20.    
  21. # Predicting the values for the test dataset  
  22. Y_pred = rf.predict(X_test)  
  23.    
  24. # using metrics module to calculate accuracy score  
  25. print(“Accuracy score for the model is: “, accuracy_score(Y_test, Y_pred))  
  26.   
  27. # predicting the type of flower  
  28. rf.predict([[5, 7, 3, 4]])  

Leave a Reply