전체 글 16

학습 모델 종류와 특징

나이브 베이즈 모델 분류 학습 모델 중에 데이터들 간의 독립적일 경우 효과적인 모델 의사 결정 트리의사결정 트리는 특성의 중요도를 평가하고, 어떤 특성이 분류에 가장 중요한지 쉽게 확인이 가능함 SVM분류 학습 모델 중에 비선형 데이터 분류에 강하고 많은 피쳐들을 가지고 분류할 경우 적합함  학습용 데이터가 중요함 (이상치의 유무 등) 좋은 학습용 데이터란? (아래 5가지가 충족되어야함) 다양성: 학습용 데이터는 다양한 상황과 조건을 반영해야 합니다. 즉, 다양한 예제와 변수를 포함하여 모델이 다양한 경우를 학습할 수 있도록 해야 합니다. 예를 들어, 이미지 인식 모델의 경우 다양한 조명, 각도, 배경을 포함한 이미지가 필요합니다.대표성: 데이터는 실제 문제를 잘 대표해야 합니다. 모델이 실제 환경에서 ..

AI 2024.08.01

이상치

이상치란 다른 데이터들과는 매우 다른 특성을 가진 포인트를 말합니다.이상치의 의미와 영향 이상치는 데이터 세트의 나머지 부분과 비정상적으로 차이가 나는 데이터 포인트입니다. 이상치는 여러 가지 이유로 발생할 수 있습니다:측정 오류데이터 입력 실수데이터 수집 과정에서의 문제실제 변동성 (예: 경제적 이벤트, 자연 재해 등)SVM에서 이상치는 결정 경계(분류를 위해 그려지는 선)에 큰 영향을 미칠 수 있습니다. 특히 SVM은 최대 마진을 찾는 모델이기 때문에, 이상치가 경계 근처에 위치하면 그 경계가 이상치에 의해 크게 왜곡될 수 있습니다. 이는 결국 모델의 일반화 능력을 저하시키며, 새로운 데이터에 대한 예측력이 떨어지는 원인이 됩니다.  이상치 탐지 방법이상치를 탐지하는 방법은 여러 가지가 있습니다. 대..

AI 2024.07.26

SVM(Support vector machine)

SVM (Support vector machine)지도 학습 알고리즘 중 하나로, 주어진 데이터를 바탕으로 클래스를 구분(분류)하는 모델데이터를 두개의 클래스로 분류하기 위해 고차원 공간에서 최적의 초평면을 찾는 것이 목표. 초평면, 결정결계선, 서포트 벡터의 의미 초평면 (Hyperplane):SVM에서 데이터를 분리하는 결정 경계로 사용되는 개념입니다.데이터 포인트들이 N차원 공간에 존재할 때, N-1 차원의 초평면으로 데이터를 나누게 됩니다.예를 들어, 2차원 공간에서 초평면은 하나의 직선이 되며, 3차원 공간에서는 하나의 평면이 됩니다.결정 경계선 (Decision Boundary):SVM에서 초평면이 데이터를 나누는 경계선을 말합니다.이 경계선은 클래스를 분리하는 역할을 하며, 분류기가 새로운 ..

AI 2024.07.26