AI/머신러닝16 [머신러닝] AutoML 실습 Google Colab 환경에서 pycaret으로 데이터 분석, 머신러닝 모델 만들기 AutoML이란? Automated Machine Learning (AutoML)은 기계 학습 파이프 라인에서 수작업과 반족되는 작업을 자동화하는 프로세스이다. AutoML 솔루션은 최근 몇 년간 가장 빠르게 진화하는 기술 중 하나로, 예측 모델 개발에 많은 시간을 소요했던 코딩, 알고리즘 선택, 튜닝 작업을 자동화한다. 코드 한줄, 버튼 클릭 또는 머신러닝 스스로를 통하여 그 동안 복잡했던 수작업, 반복적이었던 작업들은 자동으로 처리해주기 때문에 AutoML을 사용하면 매우 쉽고 효율적으로 원하는 결과값을 얻을 수 있다. AutoML은 데이터 과학자, 머신러닝 엔지니어 및 연구원의 생산성을 크게 향상시킬 수 있으며, .. 2022. 4. 24. [머신러닝] Ensemble (앙상블) 부스팅 (Boosting) 대표적인 Boosting 앙상블 AdaBoost , 제일 오래된 알고리즘, 잘 안 쓰임.. GradientBoost LightGBM (LGBM) (MS사 라이브러리, install 필요) XGBoost (외부 라이브러리, install 필요) 성능이 좋은 건? XGBoost업계에서 조금 더 많이 쓰는 것? LightGBM, XGBoost가 성능이 조금 더 좋은데 왜 업계에서는 LightGBM 쓸까? XGBoost 속도가 너무 느려! MS에서는 LightGBM으로 문제점을 보완하고 어느정도 성능도 보장해줌! Boosting 알고리즘 역시 앙상블 학습 (ensemble learning)이며, 약한 학습기를 순차적으로 학습을 하되, 이전 학습에 대하여 잘못 예측된 데이터에 가중치를 .. 2022. 4. 18. [머신러닝] Ensemble (앙상블) Ensemble (앙상블) 머신러닝 앙상블이란 여러개의 머신러닝 모델을 이용해 최적의 답을 찾아내는 기법이다. 여러 모델을 이용하여 데이터를 학습하고, 모든 모델의 예측결과를 평균하여 예측 앙상블 기법의 종류 보팅 (Voting) 서로 다른 알고리즘 분류가 결함됨 여러 모델의 예측 결과를 투표해서 최종적인 예측결과를 결정함 배깅 (Bagging) 샘플 중복 생성을 통해 결과 도출 샘플을 여러번 랜덤하게 뽑아서각 모델을 학습 시키고 그 결과를 집계함. 샘플링을 조합해서 학습하는 방식이 배깅기법. RandomForest가 배깅 알고리즘을 사용한 대표적인 모델이다. 부스팅 (Boosting) 이전 오차를 보완하면서 가중치 부여 여러 모델이 순차적으로 학습 일명 Weak Learner라 불린다. 스태킹 (Sta.. 2022. 4. 18. [머신러닝] 결정트리 결정트리 or 의사결정나무 (Decision Tree) 결정트리를 가장 단수하게 표현하자면, Tree 구조를 가진 알고리즘입니다. 의사결정나무는 데이터를 분석하여 데이터 사이에서 패턴을 예측 가능한 규칙들의 조합으로 나타내며, 이 과정을 시각화 해 본다면 마치 스무고개 놀이와 비슷합니다. 의사 결정트리는 의사를 어떻게 결정할지에 따라 다른 결과를 도출하는 방식으로 전개된다.트리란 내가 의사를 결정하는데 있어서 선택지가 2가지만 있는 것이 아니라 여러 개의 선택지 가능하고 나무를 뒤집어 놓은 것처럼, 가지에 가지를 뻗은 행태로 의사를 결정해 나가는 구조라서 트리라는 이름이 붙여졌다. 이렇게 가지를 뻗어나가는 형태로 최종 의사를 결정할 수 있다. 질문을 던지면서 범위를 축소시켜 나간다. 가장 위의 ‘날개가 .. 2022. 4. 18. [머신러닝] 로지스틱 Logistic Regression 선형 회귀 방식을 이용한 이진 분류 (binary classification)알고리즘 우리가 분류해야 하는 class가 두 개 분류 레이블 : 0 or 1 0~1 범위를 예측 결과로 갖는 모델 필요 가설 결과에 Sigmoid 함수 적용 Logistic, sigmoid 함수 S자 모양의 함수 Logistic, sigmoid 함수 e^(-z) ⇒ np.exp(-z) 사용 𝑧 값을 0과 1사이의 값으로 바꾸는 함수 Sigmoid 함수 원리 11=111=1인데, 분모 1에다 0보다 크거나 같은 어떤 수를 더 하면 그 결과는 1 보다 클 수 없다. 분모에 더 할 값은 𝑒^-𝑧, 이 값은 어떤 𝑧가 주어져도 0보다 작아 지지 않는다. 𝑒^-𝑧는 𝑧의 값이 크면 클 수록 0에 가까.. 2022. 4. 16. [머신러닝] 회귀 모델 (Regression Models) 2 ElasticNet Elastic Net 회귀모형은 가중치의 절대값의 합(L1)과 제곱합(L2)을 동시에 제약 조건으로 가지는 모형입니다. 주요 hyperparameter alpha: 규제 계수 l1_ratio (default=0.5) l1_ratio = 0 (L2 규제만 사용). l1_ratio = 1 (L1 규제만 사용). 0 < l1_ratio < 1 (L1 and L2 규제의 혼합사용) ElasticNet 속성에 l1_ratio에 0.2를 주면 L1 규제 20%, L2 규제 80% 적용한다는 의미이고, l1_ratio에 0.8를 주면 L1 규제 80%, L2 규제 20% 적용한다는 의미입니다. from sklearn.linear_model import ElasticNet alpha = 0.01 #.. 2022. 4. 16. 이전 1 2 3 다음