본문 바로가기

머신러닝 이론 입문4

5장 로지스틱 회귀와 ROC 곡선 : 학습모델을 평가하는 방법 1. 로지스틱 회귀 로지스틱 회귀는 최우추정법을 사용하여 모델과 판단기준을 만들고 뉴튼-랩슨법을 사용하여 최적의 결과값을 찾는 방법 1. 분류 문제에 likelihood estimation method(최우추정법)을 사용한다. 로지스틱 회귀를 사용하여 두 속성을 가지는 집합의 경계선을 긋는 예제를 설명 이 직선 최적의 W 벡터 = {w0, w1, w2}를 구하면 됩니다. x로 표시되는 점의 속성값이 t=1, 그리고 o로 표시되는 점의 속성값이 t=1로 정의될 때 아래 두 새로운 점 중 어떤 것이 t=1일 확률이 높을까요? - 직관적으로 오른쪽에 있는 새로운 점의 속성값이 t=1일 확률이 더 높을 것이라 생각할 수 있을 것 다르게 표현하면 그림에 나타내어져 있는 직선은 f(x, y) =0이고 새로운 점이 .. 2019. 8. 20.
04. 퍼셉트론: 분류 알고리즘 기초 1. 퍼셉트론이란 퍼셉트론은 다수의 신호(Input)을 입력받아서 하나의 신호(Output)을 출력하며, 수치계산을 사용하여 파라미터를 반복해서 수정해가는 '확률 기울기 하강법' 퍼펙트론은 오차함수를 사용한 계산법으로 파라메트릭 모델의 3단계를 걸쳐 구현됨 2. 퍼셉트론의 활성함수 활성함수란 퍼셉트론이 입력을 처리하는 규칙을 수학적으로 모델링 한 것을 말한다. 즉 퍼셉트론이 입력값을 받아 뉴런을 작동할지 말지 결정하는 규칙인 것이다. 활성함수에는 임계치(threshold) 가 존재한다. 계단함수에서는 임계치가 0으로 입력값의 합이 0보다 크면 1을 0보다 작으면 0을 반환한다. 예를 들어 3이 입력으로 들어올 경우 3은 0보다 크기 때문에 활성함수는 1을 반환하며, -3이 입력될 경우 임계치인 0보다 작.. 2019. 8. 15.
3장 최우추정법: 확률을 사용한 추정이론 최우추정법은 '어떤 데이터를 얻을수 있는 확률'을 설정하여 그 확률을 통해 가장 적합한 파리머터를 찾아낸다. ex) 만일 동전 던지기에서 10번 던져서 앞앞앞앞앞뒤뒤뒤뒤뒤(원하는 결과) 가 나왔다고 하면 동전 던지기라는 행위는 1/2 확률(모수)이라고 생각할수 있음 하지만 만약 10번 다 앞면만 나왔다면 동전 던지기라는 행위가 1/2 확률이 아니라 다를 것이라고 생각하는 것 즉, 10번 다 앞면이 나오려면 동전 던지기의 확률이 어떨 때 가능성이 제일 높을까?를 구하는 것 파라메트릭의 3 단계 (1) 파라미터를 포함한 모델(수식)을 설정한다. (2) 파리미터를 평가할 기준을 정한다. (3) 가장 적합하다고 평가할수 있는 파리미터를 결정한다. 3.11 데이터 발생 활률 설정 - 데이터 의 배경에 있는 함수관.. 2019. 8. 13.
1장 데이터 과학과 머신러닝 1장 데이터 과학과 머신러닝 1. 데이터 과학의 목적 - 데이터를 사용해서 더욱 정교한 판단이 이루지도록 하는 것, 과거의 데이터를 토대로 미래를 예측 ex) 생수의 매출이 보통보다 30% 늘었다 -> 어느점포에 얼만큼의 재고를 늘려두면 이익이 얼만큼 오를 것인지 예측 머싱러닝 분야 - '휴대폰 통신회사 갈아타기 문제' * 잘못 된 방향 1. 과거에 계약연장 시점에 고객이 통신사를 바뀌었는지 정보 수집 2. 몇가지 질문을 통해 데이터가 어느 그룹에 속할지 판정하는 기법인 '결정트리'를 통해 판정 프로그램 작성 * 제대로 된 방향 1. 분석할 가치가 있는 데이터 선별(특징 벡터) 2. 분석에 적합한 머신러닝 알고리즘 생각하여 적용 2. 머신러닝 알고리즘 종류 * 클래스 판정을 산출하는 알고리즘 ex) '통.. 2019. 7. 17.