20240821 2

[아티클 스터디] 확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘

1. 선형 회귀 (Linear Regressioin) 여러 가지 데이터를 활용하여 연속형 변수인 목표 변수를 예측해 내는 것이 목적이다. 예측하는 데 사용되는 변수들은 연속형일 필요 없다. 복잡한 알고리즘에 비해서는 예측력이 떨어지지만 데이터 특성이 복잡하지 않을 때는 쉽고 바른 예측이 가능해 많이 사용된다. 다른 모델과의 성능을 비교하는 베이스라인으로 사용하기도 한다. 2. 로지스틱 회귀 (Logistic Regressioin)  선형 회귀 분석과 상당히 유사하지만 다루는 문제가 다르다. 선형 회귀 분석은 연속된 변수를 예측하지만 로지스틱 회귀 문석은 Yes/No 와 같이 두 가지로 나뉘는 분류 문제를 다룬다. 다른 모델과의 비교를 목적으로 자주 활용된다. 3. K-최근접 이웃 (KNN)  각 데이터 ..

아티클스터디 2024.08.21

[개인과제] ML

문제 1. 데이터 셋 불러오기scikit-learn 라이브러리의 데이터셋을 사용하는 방법을 익힙니다.아래와 같이 데이터를 불러오세요데이터 셋에는 더 많은 종류가 있으니 찾아보시면 좋겠죠?예시에는 붓꽃 데이터셋을 불러오고 있어요! iris를 제외한 다른 데이터셋을 직접찾아 가져와보세요from sklearn.datasets import load_irisiris = load_iris()X, y = iris.data, iris.target입력 데이터와 레이블을 불러온 후 학습을 위한 데이터셋과 테스트를 위한 데이터셋으로 분리하세요(Hint!) sklearn의 train_test_split를 이용하면 편하게 데이터를 분리할 수 있습니다. 문제 2. Diabetes 데이터 회귀 분석 진행하기Diabetes 데이터셋..