선형대수 2

선형대수 - 공분산, 상관계수, 단위벡터 등

분산(Variance) 분산은, 데이터가 얼마나 퍼져있는지를 측정하는 방법 이는 각 값들의 평균으로부터 차이의 제곱 평균 분산을 구하기 위해서는 평균부터 계산 # 분산 쉽게 계산하기 with Python print(df.컬럼명.var(ddof = 0) # ddof 자유도 주의해야 할 것은 샘플의 분산은 모집단의 분산의 추정치 이며, 일반적으로 샘플의 분산을 계산할 때 N - 1 로 나누어야 합니다. N-1로 나누는 것은 표본의 분산이나 표준편차를 모집단의 분산이나 표준편차를 예측하는 추정치로 사용하려는 의도 때문이다. 표본의 크기가 큰 경우는 n-1이나 n의 큰차이가 없지만, 표본의 크기가 작은 경우 실제적인 차이가 발생한다. 표본의 크기가 작은경우 표본의 분산이나 표준 편차를 n을 사용하는 경우 모집단..

선형대수 2021.07.31

선형대수 - 벡터와 매트릭스

Determinant 스칼라와 벡터 스칼라와 벡터는 선형 대수를 구성하는 기본단위 스칼라는 단순히 변수로 저장되어 있는 숫자이며, 벡터 혹은 매트릭스에 곱해지는 경우 해당 값에 곱한 값으로 결정 벡터는 파이썬에서 주로 list로 사용되며, 이전에 다뤘던 것처럼 데이터셋을 구성하고 있는 데이터프레임의 행과 열로 사용되기도 한다. 매트릭스는 벡터의 모음으로 간주될 수도 있 수도 있다. 스칼라 : 크기만을 나타내는 것, 방향이 없음. 벡터 : 크기와 방향을 동시에 나타낸다, 사칙연산이 가능하다. 벡터의 크기(Magnitude, Norm, Length) 벡터의 Norm은 단순히 길이 모든 값을 제곱하여, 루트 씌운 값이 벡터의 크기이다. 벡터는 선이기 때문에, 피타고라스를 통해 길이를 구할 수 있는 것 벡터의 ..

선형대수 2021.07.31