의 차이점은 무엇입도 학습 및 자율 학습을?

https://stackoverflow.com/questions/1832076

11-09-2019
|

문제

의 관점에서 인공지능 및 기계학습,차이는 무엇인가 감독 및 자율 학습을?을 제공할 수 있는 기본,쉽게 설명과 함께 예?

해결책

이 기본적인 질문을하기 때문에 기계 학습 자체가 무엇인지 지정하는 것이 가치가있는 것 같습니다.

머신 러닝은 데이터 중심의 알고리즘 클래스이며, 즉 "정상적인"알고리즘과 달리 "좋은 답변"이 무엇인지 "알려주는 데이터입니다. 예 : 이미지에서 얼굴 감지를위한 가상의 비가막이 학습 알고리즘은 얼굴이 무엇인지 정의하려고 시도합니다 (눈을 기대하는 어두운 영역이있는 둥근 피부 모양의 색상 디스크). 머신 러닝 알고리즘은 그러한 코딩 된 정의를 가지고 있지 않지만 "학습 예식": 얼굴과 얼굴이 아닌 여러 이미지를 보여 주면 결국에는 보이지 않는지 여부를 배우고 예측할 수 있습니다. 이미지는 얼굴입니다.

이 얼굴 감지 의이 특정한 예는 다음과 같습니다 감독, 그것은 당신의 예가 있어야한다는 것을 의미합니다 라벨이 붙었습니다, 또는 어떤 얼굴인지 명시 적으로 말하고 어떤 것이 아닌지를 말하십시오.

에서 감독되지 않은 알고리즘 예제는 그렇지 않습니다 라벨이 붙었습니다, 즉 당신은 아무 말도하지 않습니다. 물론 그러한 경우 알고리즘 자체는 얼굴이 무엇인지 "발명"할 수 없지만 시도 할 수 있습니다. 무리 다른 그룹으로의 데이터는 얼굴이 말과는 매우 다른 풍경과 매우 다르다는 것을 구별 할 수 있습니다.

또 다른 대답은 그것을 언급하기 때문에 (잘못된 방식으로) : "중간"형태의 감독이 있습니다. 반 감독 그리고 적극적인 학습. 기술적으로, 이것들은 많은 레이블이 붙은 예를 피할 수있는 "스마트"방법이있는 감독 된 방법입니다. 적극적인 학습에서 알고리즘 자체는 어떤 라벨을 표시 해야하는지 결정합니다 (예 : 풍경과 말에 대해 확신 할 수 있지만 고릴라가 실제로 얼굴 그림인지 확인하도록 요청할 수 있습니다). 반 감독 학습에는 라벨이 붙은 예로 시작하는 두 가지 알고리즘이 있으며, 많은 수의 표지되지 않은 데이터에 대해 생각하는 방식을 서로 "알리십시오". 이 "토론"에서 그들은 배웁니다.

다른 팁

감독 학습 로직이 결정을 내릴 수 있도록 알고리즘을 "태그"또는 "레이블로 표시"할 때입니다.

예 : Bayes Spam 필터링, 여기서 항목을 스팸으로 표시하여 결과를 개선해야합니다.

감독되지 않은 학습 원시 데이터 이외의 외부 입력없이 상관 관계를 찾으려고하는 알고리즘 유형입니다.

예 : 데이터 마이닝 클러스터링 알고리즘.

감독 학습

훈련 데이터가 해당 대상 벡터와 함께 입력 벡터의 예를 포함하는 응용은 감독 학습 문제로 알려져 있습니다.

감독되지 않은 학습

다른 패턴 인식 문제에서, 훈련 데이터는 해당 대상 값이없는 입력 벡터 X 세트로 구성됩니다. 감독되지 않은 학습 문제의 목표는 데이터 내에서 유사한 사례 그룹을 발견하는 것입니다. 여기서 클러스터링이라고합니다.

패턴 인식 및 기계 학습 (Bishop, 2006)

감독 학습에서 입력 x 예상 결과가 제공됩니다 y (즉, 입력이있을 때 모델이 생성 해야하는 출력 x), 종종 해당 입력의 "클래스"(또는 "레이블")라고합니다. x.

감독되지 않은 학습에서 예제의 "클래스" x 제공되지 않습니다. 따라서 감독되지 않은 학습은 비정상적인 데이터 세트에서 "숨겨진 구조"를 찾는 것으로 생각할 수 있습니다.

감독 학습에 대한 접근 방식은 다음과 같습니다.

분류 (1R, 순진한 베이, ID3 카트와 같은 의사 결정 트리 학습 알고리즘 등)
숫자 값 예측

감독되지 않은 학습에 대한 접근 방식은 다음과 같습니다.

클러스터링 (K- 평균, 계층 적 클러스터링)
협회 규칙 학습

예를 들어, 종종 신경망을 훈련시키는 것은 학습을 감독하는 것입니다. 네트워크에 어떤 클래스가 공급하는 기능 벡터에 해당하는지 알려줍니다.

클러스터링은 감독되지 않은 학습입니다. 알고리즘이 공통 속성을 공유하는 클래스로 샘플을 그룹화하는 방법을 결정하게합니다.

감독되지 않은 학습의 또 다른 예는 다음과 같습니다 코 호넨의 자체 조직지도.

예를들 수 있습니다.

어떤 차량인지, 어떤 차량이 오토바이인지 인식해야한다고 가정하십시오.

에서 감독 학습 사례, 입력 (교육) 데이터 세트에 레이블을 지정해야합니다. 즉 입력 (교육) 데이터 세트의 각 입력 요소에 대해 자동차 또는 오토바이를 나타내는 지 지정해야합니다.

에서 감독되지 않은 학습 사례는 입력에 레이블을 지정하지 않습니다. 감독되지 않은 모델은 유사한 기능/속성을 기반으로 한 클러스터로의 입력을 클러스터합니다. 따라서이 경우 "자동차"와 같은 레이블이 없습니다.

나는 항상 감독되지 않은 학습과 감독 학습의 차이가 임의적이고 약간 혼란스러워하는 것을 발견했습니다. 두 경우 사이에는 실제 구별이 없으며 알고리즘이 다소 '감독'을 가질 수있는 다양한 상황이 있습니다. 반 감독 학습의 존재는 선이 흐려지는 명백한 예입니다.

나는 감독이 어떤 솔루션을 선호 해야하는지에 대한 알고리즘에 피드백을 제공하는 것으로 생각하는 경향이 있습니다. 스팸 감지와 같은 기존 감독 설정의 경우 알고리즘을 알려줍니다. "훈련 세트에 실수를하지 마십시오"; 클러스터링과 같은 감독되지 않은 기존 설정의 경우 알고리즘을 알려줍니다. "서로 가까운 포인트는 같은 클러스터에 있어야합니다.". 첫 번째 형태의 피드백은 후자보다 훨씬 구체적입니다.

요컨대, 누군가가 '감독'이라고 말할 때, '감독되지 않은'클러스터링을 생각하고 그 이상에 대해 너무 많이 걱정하지 않으려 고 분류를 생각하십시오.

기계 학습 : 데이터에 대해 배우고 예측할 수있는 알고리즘의 연구 및 구성을 탐구합니다. Such 알고리즘은 엄격하게 정적 프로그램 명령어를 따르지 않고 출력으로 표현 된 데이터 중심 예측 또는 결정을 내리기 위해 예제 입력에서 모델을 구축하여 작동합니다.

감독 학습 : 라벨이 붙은 교육 데이터에서 기능을 유추하는 기계 학습 과제입니다. 교육 데이터는 일련의 교육 예로 구성됩니다. 감독 학습에서 각 예제는 입력 객체 (일반적으로 벡터)와 원하는 출력 값 (감독 신호라고도 함)으로 구성된 쌍입니다. 감독 된 학습 알고리즘은 교육 데이터를 분석하고 추론 된 기능을 생성하며, 이는 새로운 예제를 매핑하는 데 사용할 수 있습니다.

컴퓨터에는 "교사"가 제공하는 예제 입력 및 원하는 출력이 제공되며 목표는 입력을 출력으로지도하는 일반적인 규칙을 배우는 것입니다. 특히, 감독 된 학습 알고리즘은 알려진 입력 데이터 세트와 알려진 응답을 취합니다. 데이터 (출력)에, 새로운 데이터에 대한 응답에 대한 합리적인 예측을 생성하기 위해 모델을 훈련시킵니다.

감독되지 않은 학습 : 교사없이 배우는 것입니다. 데이터와 관련하여 원하는 기본 중 하나는 데이터를 시각화하는 것입니다. 표지되지 않은 데이터에서 숨겨진 구조를 설명하는 기능을 추론하는 기계 학습 과제입니다. 학습자에게 주어진 예제는 표지되지 않으므로 잠재적 인 솔루션을 평가하기위한 오류 또는 보상 신호가 없습니다. 이것은 감독되지 않은 학습을 감독 학습과 구별합니다. 감독되지 않은 학습은 자연스러운 패턴 파티션을 찾는 절차를 사용합니다.

감독되지 않은 학습의 경우 예측 결과를 기반으로 한 피드백이 없습니다. 즉, 감독되지 않은 학습 방법에는 라벨이없는 예제가 제공되지 않으며 학습 과정에서 출력 개념이 없습니다. 결과적으로 패턴을 찾거나 입력 데이터의 그룹을 발견하는 것은 학습 체계/모델에 달려 있습니다.

모델을 훈련시키기 위해 많은 양의 데이터가 필요할 때 감독되지 않은 학습 방법을 사용해야하며, 실험하고 탐색하는 의지와 능력, 물론보다 확립 된 방법을 통해 잘 해결되지 않은 도전 과제가되어야합니다. 감독 학습보다 더 크고 복잡한 모델을 배울 수 있습니다.여기 그것에 대한 좋은 예입니다

감독 학습

감독 학습은 이미 할당 된 올바른 분류가있는 데이터 소스에서 데이터 샘플을 훈련시키는 것을 기반으로합니다. 이러한 기술은 피드 포워드 또는 다층 퍼셉트론 (MLP) 모델에 사용됩니다. 이 MLP에는 세 가지 특성이 있습니다.

네트워크가 복잡한 문제를 배우고 해결할 수 있도록 네트워크의 입력 또는 출력 계층의 일부가 아닌 숨겨진 뉴런의 하나 이상의 층
뉴런 활성에 반영된 비선형 성은 차별적이며
네트워크의 상호 연결 모델은 높은 수준의 연결성을 나타냅니다.

교육을 통한 학습과 함께 이러한 특성은 어렵고 다양한 문제를 해결합니다. 감독 된 ANN 모델에서의 교육을 통한 학습은 오류 역전 알고리즘이라고도합니다. 오류 수정 학습 알고리즘은 입력 출력 샘플을 기반으로 네트워크를 훈련시키고 오류 신호를 찾습니다.이 신호는 계산 된 출력의 차이와 원하는 출력의 차이이며 오류의 제품에 비례하는 뉴런의 시냅스 가중치를 조정합니다. 시냅스 중량의 신호 및 입력 인스턴스. 이 원칙에 따라 오류 백 전파 학습은 두 가지 패스로 발생합니다.

포워드 패스 :

여기에서 입력 벡터가 네트워크에 제공됩니다. 이 입력 신호는 네트워크를 통해 뉴런에 의한 뉴런에 의해 앞으로 전파되며 네트워크의 출력 끝에서 출력 신호로 나타납니다. y(n) = φ(v(n)) 어디 v(n) 에 의해 정의 된 뉴런의 유도 국소 분야입니다. v(n) =Σ w(n)y(n). 출력 계층 O (N)에서 계산 된 출력은 원하는 응답과 비교됩니다. d(n) 오류를 찾습니다 e(n) 그 뉴런을 위해. 이 패스 동안 네트워크의 시냅스 가중치는 동일합니다.

뒤로 패스 :

해당 층의 출력 뉴런에서 유래 된 오차 신호는 네트워크를 통해 뒤로 전파됩니다. 이것은 각 층의 각 뉴런에 대한 로컬 그라디언트를 계산하고 네트워크의 시냅스 가중치가 델타 규칙에 따라 변화를 겪을 수 있도록합니다.

Δw(n) = η * δ(n) * y(n).

이 재귀 계산은 계속 진행되며, 전방 패스와 네트워크가 수렴 될 때까지 각 입력 패턴에 대한 뒤로 패스가 이어집니다.

ANN의 감독 학습 패러다임은 효율적이며 분류, 식물 제어, 예측, 예측, 로봇 공학 등과 같은 여러 선형 및 비선형 문제에 대한 해결책을 찾습니다.

감독되지 않은 학습

자체 조직 신경망은 감독되지 않은 학습 알고리즘을 사용하여 배치되지 않은 입력 데이터에서 숨겨진 패턴을 식별합니다. 이 감독되지 않은 것은 잠재적 솔루션을 평가하기위한 오류 신호를 제공하지 않고 정보를 배우고 구성하는 능력을 말합니다. 감독되지 않은 학습에서 학습 알고리즘의 방향이 부족한 것은 언젠가 유리할 수 있습니다. 알고리즘은 이전에 고려되지 않은 패턴을 되돌아 볼 수 있기 때문입니다. 자체 조직지도 (SOM)의 주요 특성은 다음과 같습니다.

임의의 차원의 들어오는 신호 패턴을 하나 또는 2 차원 맵으로 변환 하고이 변환을 적응 적으로 수행합니다.
네트워크는 행과 열로 배열 된 뉴런으로 구성된 단일 계산 층을 갖는 피드 포워드 구조를 나타냅니다. 표현의 각 단계에서 각 입력 신호는 적절한 컨텍스트로 유지됩니다.
밀접하게 관련된 정보를 다루는 뉴런은 함께 가깝고 시냅스 연결을 통해 통신합니다.

계산 층은 층의 뉴런이 서로 경쟁하기 위해 경쟁하기 때문에 경쟁 층이라고도합니다. 따라서이 학습 알고리즘을 경쟁 알고리즘이라고합니다. SOM의 감독되지 않은 알고리즘은 3 단계로 작동합니다.

경쟁 단계 :

각 입력 패턴에 대해 x, 네트워크에 제시, 시냅스 체중으로 내부 제품 w 계산되고 경쟁 층의 뉴런은 뉴런 사이의 경쟁을 유도하는 판별 기능을 발견하고 유클리드 거리의 입력 벡터에 가까운 시냅스 가중치 벡터는 경쟁에서 승자로 발표됩니다. 그 뉴런은 가장 일치하는 뉴런이라고합니다.

i.e. x = arg min ║x - w║.

협력 단계 :

우승 한 뉴런은 토폴로지 이웃의 중심을 결정합니다. h 협력 뉴런의. 이것은 측면 상호 작용에 의해 수행됩니다 d 협력 뉴런 중. 이 토폴로지 이웃은 기간 동안 크기를 줄입니다.

적응 단계 :

우승 뉴런과 이웃 뉴런이 적절한 시냅스 중량 조정을 통해 입력 패턴과 관련하여 판별 기능의 개별 값을 증가시킬 수 있습니다.

 Δw = ηh(x)(x –w).

훈련 패턴을 반복적으로 표현하면 시냅스 중량 벡터는 이웃 업데이트로 인해 입력 패턴의 분포를 따르는 경향이 있으므로 ANN은 감독자없이 학습합니다.

자체 조직 모델은 자연적으로 신경 생물학적 행동을 나타내므로 클러스터링, 음성 인식, 텍스처 세분화, 벡터 코딩 등과 같은 많은 실제 응용 프로그램에서 사용됩니다.

참조.

감독 학습: 정답과 함께 다양한 레이블이 붙은 예제 데이터를 입력으로 제공합니다. 이 알고리즘은 그것으로부터 배우고 그 이후 입력을 기반으로 올바른 결과를 예측하기 시작합니다. 예시: 이메일 스팸 필터

감독되지 않은 학습: 당신은 단지 데이터를 제공하고 레이블이나 정답과 같은 아무 말도하지 않습니다. 알고리즘은 데이터의 패턴을 자동으로 분석합니다. 예시: 구글 뉴스

나는 그것을 간단하게 유지하려고 노력할 것이다.

감독 학습 : 이 학습 기술에서 우리는 데이터 세트가 제공되며 시스템은 이미 데이터 세트의 올바른 출력을 알고 있습니다. 따라서 여기서 우리 시스템은 자체 가치를 예측하여 배웁니다. 그런 다음 비용 함수를 사용하여 실제 출력에 대한 예측이 얼마나 가까운 지 확인하여 정확도 검사를 수행합니다.

감독되지 않은 학습 : 이 접근법에서, 우리는 우리의 결과가 무엇인지에 대한 지식이 거의 없거나 전혀 없습니다. 대신, 우리는 변수의 영향을 모르는 데이터에서 구조를 도출합니다. 데이터의 변수 간의 관계를 기반으로 데이터를 클러스터링하여 구조를 만듭니다. 여기서는 예측을 바탕으로 피드백이 없습니다.

답변이있는 데이터가 감독하는 학습.

스팸/스팸이 아닌 이메일이 주어지면 스팸 필터를 배우십시오.

당뇨병이있는 것으로 진단 된 환자의 데이터 세트가 주어지면 새로운 환자를 당뇨병 환자로 분류하는 법을 배웁니다.

답변이없는 데이터를 고려할 때 감독되지 않은 학습은 PC를 그룹화하게합니다.

웹에서 발견 된 뉴스 기사 세트가 주어지면 같은 이야기에 관한 기사 세트로 그룹화하십시오.

사용자 정의 데이터 데이터베이스가 주어지면 시장 세그먼트 및 그룹 고객을 다른 시장 부문으로 자동 검색합니다.

참조

감독 학습

이에서 네트워크를 훈련시키는 데 사용되는 모든 입력 패턴은 대상 또는 원하는 패턴 인 출력 패턴과 관련이 있습니다. 교사는 학습 과정에서 네트워크의 계산 된 출력과 올바른 예상 출력을 비교하여 오류를 결정할 때 존재하는 것으로 가정합니다. 그런 다음 오류를 사용하여 네트워크 매개 변수를 변경하여 성능이 향상됩니다.

감독되지 않은 학습

이 학습 방법에서는 대상 출력이 네트워크에 제시되지 않습니다. 마치 원하는 패턴을 제시 할 교사가없는 것처럼, 따라서 시스템은 입력 패턴의 구조적 특징을 발견하고 적응시킴으로써 자체를 배웁니다.

감독 학습

입력 X와 대상 출력 t가 있습니다. 따라서 누락 된 부품으로 일반화하기 위해 알고리즘을 훈련시킵니다. 대상이 주어지기 때문에 감독됩니다. 당신은 알고리즘을 말하는 감독자입니다. 예제 X의 경우 t를 출력해야합니다!

감독되지 않은 학습

분할, 클러스터링 및 압축은 일반적 으로이 방향으로 계산되지만, 좋은 정의를 제시하기가 어렵습니다.

해 보자 압축을위한 자동 인코더 예로서. 입력 X 만 제공되지만 대상이 x임을 알고리즘에 알리는 방법은 인간 엔지니어입니다. 따라서 어떤 의미에서 이것은 감독 학습과 다르지 않습니다.

클러스터링 및 세분화의 경우 기계 학습의 정의에 실제로 적합한 지 확실하지 않습니다 ( 다른 질문).

감독 학습 : 아이가 Kinder-Garden에 간다고 말합니다. 여기에서 선생님은 그에게 장난감, 공, 자동차 3 명을 보여줍니다. 이제 선생님은 그에게 장난감 10 개를 준다. 그는 이전 경험을 바탕으로 3 상자의 집, 공 및 자동차로 분류 할 것입니다. 그래서 Kid는 몇 가지 세트에 대한 정답을 얻은 교사들에 의해 처음으로 감독되었습니다. 그런 다음 그는 알려지지 않은 장난감에서 테스트를 받았습니다.

감독되지 않은 학습 : 다시 유치원 예. 어린이에게 10 개의 장난감이 주어집니다. 그는 비슷한 것을 분류하라는 말을 들었다. 따라서 모양, 크기, 색상, 기능 등과 같은 기능을 기반으로 3 개의 그룹이 A, B, C라고 말하고 그룹화하려고합니다.

감독이라는 단어는 대답을 찾는 데 도움이되는 기계에 감독/교육을 제공한다는 것을 의미합니다. 지침을 배우면 새로운 사례를 쉽게 예측할 수 있습니다.

감독되지 않은 것은 감독 또는 지시 사항이 없다는 것을 의미합니다. 답변/레이블 및 기계를 찾는 방법은 지능을 사용하여 데이터에서 일부 패턴을 찾습니다. 여기서는 예측하지 않고 유사한 데이터가있는 클러스터를 찾으려고 노력할 것입니다.

감독 학습 : 당신은 데이터를 표시했으며 그로부터 배워야합니다. 예를 들어 주택 데이터와 가격과 함께 가격을 예측하는 법을 배웁니다.

감독되지 않은 학습 : 트렌드를 찾은 다음 사전 라벨이 제공되지 않음을 예측해야합니다. 예를 들어, 수업 시간에 다른 사람들과 새로운 사람이 온다.

~ 안에 감독 학습 우리는 입력과 출력이 무엇인지 알고 있습니다. 예를 들어, 자동차 세트가 주어졌습니다. 우리는 어떤 빨간색과 파란색을 찾아야합니다.

반면, 감독되지 않은 학습 출력이 어떻게되어야하는지에 대한 전혀 또는 아무것도없이 답을 찾아야하는 곳입니다. 예를 들어, 학습자는 얼굴 패턴의 상관 관계와 "무엇에 대해 웃고 있습니까?"와 같은 단어에 따라 사람들이 웃을 때 감지하는 모델을 구축 할 수 있습니다.

감독 학습은 새로운 항목을 훈련 중 학습을 기반으로 훈련 된 레이블 중 하나에 레이블을 지정할 수 있습니다. 많은 수의 교육 데이터 세트, 검증 데이터 세트 및 테스트 데이터 세트를 제공해야합니다. 라벨이 포함 된 교육 데이터와 함께 숫자의 픽셀 이미지 벡터를 제공하는 경우 숫자를 식별 할 수 있습니다.

감독되지 않은 학습에는 교육 데이터 세트가 필요하지 않습니다. 감독되지 않은 학습에서는 입력 벡터의 차이에 따라 항목을 다른 클러스터로 그룹화 할 수 있습니다. 숫자의 픽셀 이미지 벡터를 제공하고 10 개의 범주로 분류하도록 요청하면 그렇게 할 수 있습니다. 그러나 훈련 라벨을 제공하지 않았기 때문에 레이블을 지정하는 방법을 알고 있습니다.

감독 학습은 기본적으로 입력 변수 (x) 및 출력 변수 (y)가있는 곳이며 알고리즘을 사용하여 입력에서 출력까지 매핑 함수를 학습합니다. 우리가 이것을 감독 한 것으로 부르는 이유는 알고리즘이 훈련 데이터 세트에서 배우기 때문에 알고리즘은 트레이닝 데이터에 대해 반복적으로 예측하기 때문입니다. 감독은 두 가지 유형의 클래스 화와 회귀를 가지고 있습니다. 분류는 출력 변수가 예/아니오, true/false와 같은 범주 일 때입니다. 회귀는 출력이 사람의 높이, 온도 등과 같은 실제 값 일 때입니다.

UN 감독 학습은 입력 데이터 (x) 만있는 곳과 출력 변수가없는 곳입니다. 위의 감독 학습과 달리 정답이없고 교사가 없기 때문에이를 감독되지 않은 학습이라고합니다. 알고리즘은 데이터에서 흥미로운 구조를 발견하고 제시하기 위해 자체 고안에 남아 있습니다.

감독되지 않은 학습의 유형은 클러스터링 및 연관성입니다.

감독 학습은 기본적으로 기계가 배우는 교육 데이터가 이미 레이블이 지정된 기술로, 훈련 중에 이미 데이터를 분류 한 간단한 홀수 분류기라고 가정합니다. 따라서 "레이블이있는"데이터를 사용합니다.

반대로 감독되지 않은 학습은 기계 자체가 데이터에 라벨을 붙이는 기술입니다. 또는 기계가 처음부터 스스로 배울 때 사건을 말할 수 있습니다.

단순하게 감독 학습 레이블이있는 기계 학습 문제의 유형이며 해당 레이블을 사용하여 회귀 및 분류와 같은 알고리즘을 구현합니다. 출력이 0 또는 1, true/false, yes/no의 형태 인 경우에 클래식이 적용됩니다. 그리고 그와 같은 실제 가치를 부여하는 곳에 회귀가 적용됩니다.

감독되지 않은 학습 라벨이없는 기계 학습 문제의 유형으로, 데이터 만, 구조화되지 않은 데이터 만 가지고 있으며 다양한 비 감독 알고리즘을 사용하여 데이터 (데이터 그룹)를 클러스터링해야합니다.

감독 된 기계 학습

"교육 데이터 세트에서 학습하고 출력을 예측하는 알고리즘 학습 프로세스."

훈련 데이터에 직접 비례하는 예측 된 출력의 정확도 (길이)

감독 학습은 입력 변수 (X) (교육 데이터 세트) 및 출력 변수 (y) (테스트 데이터 세트)가있는 곳이며 알고리즘을 사용하여 입력에서 출력까지 매핑 함수를 학습합니다.

Y = f(X)

주요 유형 :

분류 (이산 Y 축)
예측 (연속 Y 축)

알고리즘 :

분류 알고리즘 :

Neural Networks  
Naïve Bayes classifiers  
Fisher linear discriminant  
KNN 
Decision Tree 
Super Vector Machines

예측 알고리즘 :

Nearest  neighbor  
Linear Regression,Multi Regression

신청 영역 :

이메일을 스팸으로 분류합니다
환자가 질병이 있는지 여부를 분류합니다
음성 인식
HR 선택 특정 후보를 예측하십시오
주식 시장 가격을 예측하십시오

감독 학습:

감독 된 학습 알고리즘은 교육 데이터를 분석하고 추론 된 기능을 생성하며, 이는 새로운 예제를 매핑하는 데 사용할 수 있습니다.

우리는 교육 데이터를 제공하고 특정 입력에 대한 올바른 출력을 알고 있습니다.
우리는 입력과 출력 사이의 관계를 알고 있습니다

문제의 범주 :

회귀 : 연속 출력 => 맵 입력 변수 내에서 일부 연속 기능으로 결과를 예측하십시오.

예시:

사람의 사진이 주어지면 나이를 예측

분류: 이산 출력의 결과 예측 => 맵 입력 변수는 개별 범주로 예측합니다.

예시:

이 적지 암은 암이 있습니까?

감독되지 않은 학습 :

감독되지 않은 학습은 라벨링, 분류 또는 분류되지 않은 테스트 데이터에서 학습합니다. 감독되지 않은 학습은 데이터의 공통성을 식별하고 각각의 새로운 데이터에서 그러한 공통점의 존재 또는 부재에 따라 반응합니다.

데이터의 변수 간의 관계를 기반으로 데이터를 클러스터링 하여이 구조를 도출 할 수 있습니다.
예측 결과를 기반으로 한 피드백이 없습니다.

문제의 범주 :

클러스터링 : 동일한 그룹의 객체 (클러스터라고 함)가 다른 그룹 (클러스터)보다 서로 유사한 (어떤 의미에서) 더 유사한 방식으로 객체 세트를 그룹화하는 작업이 있습니다.

예시:

1,000,000 개의 다른 유전자를 모으고 수명, 위치, 역할 등과 같은 다른 변수와 어떻게 유사하거나 관련된 그룹으로 이러한 유전자를 자동으로 그룹화하는 방법을 찾으십시오..

인기있는 유스 케이스가 여기에 나열되어 있습니다.

데이터 마이닝에서 분류와 클러스터링의 차이?

참조 :

감독 학습

감독되지 않은 학습

예시:

감독 학습 :

사과 한 가방
오렌지가 달린 가방 1 개

=> 빌드 모델
사과와 오렌지의 혼합 가방.

=> 분류하십시오

감독되지 않은 학습 :

사과와 오렌지의 혼합 가방.

=> 빌드 모델
또 다른 혼합 가방

=> 분류하십시오

간단한 말로 .. :) 그것은 나의 이해입니다. 자유롭게 수정하십시오.감독 학습 우리는 제공된 데이터에 기초하여 무엇을 예측하고 있는지 알고 있습니다. 따라서 데이터 세트에 열이 있어야합니다.감독되지 않은 학습 IS, 우리는 제공된 데이터 세트에서 의미를 추출하려고 노력합니다. 우리는 무엇을 예측 해야할지 명확하지 않습니다. 질문은 우리가 왜 그렇게 하는가? .. :) 답은 - 감독되지 않은 학습의 결과는 그룹/클러스터 (유사한 데이터)입니다. 따라서 새로운 데이터를 받으면 식별 된 클러스터/그룹과 연결하여 기능을 이해합니다.

도움이되기를 바랍니다.

도 학습

감독 학습을 우리는 알아 출력의 원 입력합니다.전자 데이터가 표시되도록 동안 훈련의 기계 학습 모델을 것이 무엇인지 이해해야에서 검출하게 출력,그리고 가이드 시스템 동안 훈련을 감지하 pre-로 표시된 개체는 기초가 그것이 검색 유사한 물체를 우리가 제공됩니다.

여기 알고리즘은 무엇을 알 수 있는 구조의 패턴이다.도 학습 사용에 대한 분류

예를 들어,우리는 서로 다를 수 있는 객체의 모양을 정사각형,원,trianle 우리의 작업을 준비하는 동일한 유형의 모양 라벨 dataset 모든 형태 표시입니다,우리는 기차의 기계 학습은 모델에는 데이터 집합에 기반의 교육 dateset 시작 검출하는 모양입니다.

Un-도 학습

자율학습은 영향을 미칠 학습하는 결과가 알려지지 않은 것,클러스터 데이터 집합에 따라 유사한 객체의 특성을 것이 나누는 객체에 다른 움큼과 감지 개체입니다.

여기 알고리즘을 검색에 대한 다양한 패턴에 원시 데이터에 기반하는 클러스터는 데이터입니다.Un-감독 학습에 사용되는 클러스터링.

예를 들어,우리가 할 수 있습 다른 객체를 여러 모양 사각형,원,삼각형,그래서 그것을 만들 것입니다 송에 기반한 객체 속성을 경우 객체에는 네 가지 측면 그것은 그것을 고려 광장,그리고 만약 그것은 세 가지 측면 삼각지 않으면 측면보다 원,여기에서 데이터는 라벨이 없다,배울 것 자체를 검출하는 다양한 모양

차이점을 자세히 설명하는 많은 답이 있습니다. 나는이 GIF를 발견했다 Codeacademy 그리고 그들은 종종 차이점을 효과적으로 설명하는 데 도움이됩니다.

감독 학습

교육 이미지에는 여기에 레이블이 있으며 모델이 이미지 이름을 배우고 있음을 주목하십시오.

감독되지 않은 학습

여기서 수행되는 일은 단지 그룹화 (클러스터링)이며 모델은 이미지에 대해 아무것도 모릅니다.

기계 학습은 기계를 만들기 위해 기계를 만들려고하는 분야입니다.

당신은 아기처럼 기계를 훈련시킵니다. 인간은 다양한 기능으로 데이터를 공급하여 기계를 훈련시키는 것과 같은 방식으로 배우고, 기능을 식별하고, 패턴을 인식하고 스스로 훈련하는 방식입니다. 기계 알고리즘 데이터 내 패턴을 식별하고 특정 범주로 분류합니다.

기계 학습은 광범위하게 감독 및 감독되지 않은 학습의 두 가지 범주로 나뉩니다.

감독 학습은 해당 대상 값 (출력)을 가진 입력 벡터 / 데이터를 갖는 개념입니다. 반면에 감독되지 않은 학습은 해당 대상 값이없는 입력 벡터 / 데이터 만있는 개념입니다.

감독 된 학습의 예는 해당 숫자 [0-9]가있는 숫자 이미지를 가진 필기 자리 인식이며, 감독되지 않은 학습의 예는 행동을 구매하여 고객을 그룹화하는 것입니다.

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow