본문 바로가기

AI/머신러닝16

[머신러닝] K-최근접 이웃(K-NN) 분류 알고리즘 분류 (Classification) K Nearest Neighbors (k-최근접 이웃 분류 알고리즘) 가장 중요한 hyperparameter인 K값은 근처에 참고(reference)할 이웃의 숫자 k-최근접 이웃 분류 알고리즘 가장 고전적이고 직관적인 머신러닝 분류 알고리즘 기하학적 거리 분류기 가장 가깝게 위치하는 멤버로 분류하는 방식 ? 와 가장 가깝게 만나는 이웃들을 지정하여 boundary로 묶음 ? 가 별 ⭐인지 세모 🔺인지 구분 이웃하는 데이터의 개수가 홀수인지 짝수인지에 따라 알고리즘 달라진다. 따라서 k를 몇 개로 지정하느냐에 따라 성능이 달라진다 k가 7이라면 가장 가까운 7개의 모양들의 개수 중 일치하는 개수가 많은 label로 분류 k가 짝수라면 가장 가까운 거리상 비교 k가 홀수.. 2022. 4. 11.
[머신러닝] 데이터셋 다루기 sklearn(scikit-learn)은 2007년 구글 썸머 코드에서 처음 구현됐으며 현재 파이썬으로 구현된 가장 유명한 기계학습 오픈 소스 라이브러리입니다. 뿐만 아니라 통일된 인터페이스를 가지고 있기 때문에 간단하게 여러 기법을 적용할 수 있어서 쉽고 빠르게 결과를 얻을수 있습니다. sklearn.dataset 안에는 빌트인 (built-in) 데이터 셋들이 존재합니다. 물론 튜토리얼 진행을 위한 수준이므로, 규모가 크지는 않습니다. (Toy Dataset 이라고도 불립니다.) 이번에는 Built-in 데이터 셋을 활용하는 방법에 대해서 알아봅시다. 데이터 셋의 종류 load_boston: 보스톤 집값 데이터 load_iris: 아이리스 붓꽃 데이터 load_diabetes: 당뇨병 환자 데이터 l.. 2022. 4. 11.
[머신러닝] 머신러닝과 scikit-learn 개요 머신 러닝(Machine Learning) 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야 데이터로부터 모델을 자동으로 생성하여 스스로 성능을 향상하는 시스템으로 볼 수 있음 1️⃣Training DataSet Data, InputData, Feature, X Label, Target, 정답, y 2️⃣Machine(Model) 입력 fit 데이터셋에 대한 패턴 분석 후 검증 3️⃣ Predict, 예측, 검증 데이터셋 학습에서 사용되지 않는 미지의 데이터들을 학습한 결과를 바탕으로 Model이 예측할 것임! 4️⃣ 정확한 예측 결과 미지의 데이터 셋의 실제 라벨과 예측된 라벨을 비교하여 정확도 판단! 예측 모델 : 데이터를 입력 받아서 모델에 학습하기 검증 모델 :.. 2022. 3. 15.
[머신러닝] 인공지능 개요 인공지능(Artificial Intelligence) - 어떠한 인공물에 대해서 인간과 같은 지적인 활동을 할 수 있도록 지능을 부여하는 것 - 인간의 지능적인 활동을 할 수 있도록 컴퓨터를 구현하는 것 - 계산모델을 이용하여 정신적 기능을 연구하는 학문 - Charniak - 컴퓨터가 지능을 가질 수 있도록 하는 아이디어를 연구하는 학문 – Winstone - 인간의 지능을 필요로 하는 작업을 처리할 수 있는 기계를 만드는 학문 – Minsky - 인간의 지능적 측면 즉, 기계가 잘할 수 있는 계산 같은 것이 아니라 기계는 하기 힘들지만 인간은 비교적 쉽게 잘 할 수 있는 것들, 예를 들면 추론, 인식, 지각과 같은 것을 모의 실험할 수 있는 기계 알고리즘을 만드는 학문 – Callan 머신러닝(mac.. 2022. 3. 15.