Input/AD(s)P 빅데이터(준)전문가 3

비지도학습(자율학습) 연관규칙 : 지지도, 신뢰도, 향상도 계산식 / 장단점

* 연관 규칙 (Association Rule)_ 상호 관련성 분석 _ 사건 A 발생 시 사건 B 발생 확률 _ ex) 장바구니 분석(Market Basket Analysis), 친화성 분석 (Affinity Analysis), 보험 사기 등 * 연관규칙 장점 & 단점 * 지지도 (Support)_ 전체 거래 중 사건 A와 사건 B 동시 발생할 확률. _ 가지치기(Prunning)의 기준으로 사용 * 신뢰도 (Confidence)_ 사건 A가 발생했을 때 사건 B도 발행할 조건부확률. _ 신뢰도가 높다 = 연관성이 높다 * 향상도 (Lift)_ 사건 A와 B의 상관성 확인 _ 향상도 값이 1보다 크면 상관관계 있음 Further _ 예시 Reference임호진, 송지섭, 임준혁 공저, 2022, , 영진닷컴

유사성 판단을 위한 거리 척도 : 유클라디안 거리, 민코프스키 거리, 마할라노비스 거리, 맨하튼 거리

1. 유클라디안 거리 (Euclidean Distance) _ 익숙한 거리 계산법 _ 'L2 Distance' 라고도 함. 2. 민코프스키 거리 (Minkouski Distance) _ m = 2일 때, 유클라디안 거리와 동일. 민코프스키 공간 - 위키백과, 우리 모두의 백과사전 위키백과, 우리 모두의 백과사전. 수리물리학에서 민코프스키 시공간(영어: Minkowski spacetime)은 아인슈타인의 특수 상대성 이론을 잘 기술하는 시공간의 수학적 모델이다. 이 공간에서는 일반적 ko.wikipedia.org 3. 마할라노비스 거리 (Mahalanobis Distance) _ 변수 간 상관관계가 있는 경우 사용 기준 표본까지의 마할라노비스 거리 - MATLAB mahal - MathWorks 한국 이 ..

활성화 함수 Activation Function : Step function, Sigmoid function, ReLU function

Step Function 경계에서 불연속인 함수, 경계를 기준으로 결과값이 0 또는 1. >> 미분 불가 스위치처럼 On 이거나, Off 이거나. Sigmoid Function 비선형 함수 0과 1사이의 값. 즉, 최댓값은 1, 최솟값은 0. Step function에서 부드러워진 형태 Exploding Gradient 문제 방지 로지스틱 회귀분석에 사용. >> Gradient Vanishing 문제 발생 * Gradient Vanishing : 출력값이 0에 매우 가까워짐. Back-propagation 할 때, layer 많이 통과하면 결국 0으로 수렴. ReLU (Rectified Linear Unit) Function 선형함수 Gradient Vanishing 문제 해결 목적으로 사용. Deep ..