svm 예제

정규화 매개 변수(파이썬의 sklearn 라이브러리에서 C 매개 변수라고도 함)는 SVM 최적화에 각 학습 예제를 잘못 분류하지 않으려는 정도를 알려줍니다. 이 예제에서는 두 점 클래스가 잘 구분되는 분류 작업의 간단한 경우를 고려합니다. 즉, 레이블이 지정된 학습 데이터(감독 학습)가 주어지면 알고리즘은 새로운 예제를 분류하는 최적의 하이퍼플레인을 출력합니다. 두 개의 디멘션 공간에서 이 초평면은 각 클래스의 양쪽에 놓여있는 두 부분으로 평면을 나누는 선입니다. 더 진행하기 전에 이 문서에서 기본적인 이해를 해 보겠습니다. 여기서는 기계 학습 도구, 즉 파이썬과 호환되는 scikit-learn을 사용하여 암 UCI 데이터 세트의 SVM 분류에 대한 예제를 설명합니다. 필수 조건: Numpy, 팬더, 매트플롯-lib, scikit-learn 의 지원 벡터 분류의 빠른 예제를 보자. 먼저 우리는 데이터 집합을 만들 필요가 : 나는 혼합 선형 및 비선형 데이터를 포함하는 시간계 데이터 세트가있는 경우(예를 들어 산소 포화 도 데이터; SaO2), svm을 사용하여 질병 대 건강 대상자의 분류를 수행함으로써 해당 데이터를 선형 및 비선형 fisrt로 분리해야합니까, 아니면 svm이 해당 데이터의 선형도 차이를 고려하지 않고 분석을 수행 할 수 있습니까? SVM 모델은 별도의 범주의 예제를 가능한 한 넓은 명확한 간격으로 분할되도록 매핑된 공간의 점으로 예제를 표현합니다. SVM은 선형 분류를 수행하는 것 외에도 비선형 분류를 효율적으로 수행하여 입력을 고차원 기능 공간으로 암시적으로 매핑할 수 있습니다. 이러한 커널의 대부분은 데이터를 위해 추가 조정할 수 있는 추가 레버를 제공합니다. 예를 들어, 다항식 커널: 커널: 우리는 이미 그것에 대해 논의했습니다. 여기서는 “선형”, “rbf”, “poly”와 같은 커널과 함께 사용할 수있는 다양한 옵션이 있습니다 (기본값은 “rbf”입니다). 여기서 “rbf” 및 “폴리”는 비선형 하이퍼 평면에 유용합니다.

Comments

Comments are closed.