반응형

이상점 4

[Geometry] 이상점(Ideal points)와 무한대 선(line at infinity)

평행한 선의 교점(Intersection of parallel lines) 두 평행한 직선은 유클리드 공간에서는 만나지 않지만, 사영 공간 $P^2$에서는 만납니다. 두 선 ax + by + c = 0과 ax + by + c' = 0을 고려하겠습니다. 이 둘은 l = (a, b, c)^T 와 l' = (a, b, c')^T로 나타낼 수 있습니다. 이 둘의 교점을 구하는 것은 어렵지 않습니다. 이전 포스팅에서 배웠던 것 처럼 두 선을 외적하면 됩니다. 여기서 scale factor (c' - c)를 무시하면, 아래와 같은 교점이 됩니다. 이 점을 inhomogeneous로 표현하면, 아래와 같습니다. 이는 2 차원 euclidean 공간에서 유한한 점에 해당하지 않습니다. 이를 homogeneous coo..

[통계학] 02-6. 기술통계 (6) - 수치자표 분포의 산포1 (범위, 사분위범위, 상자그림)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 수치자료의 퍼져있는 정도인 산포도를 나타내는 값 중 두 특정 위치의 정보를 활용한 통계값(범위, 사분위 범위)을 알아보겠습니다. 자료의 주요 위치를 파악하고 이상점 유무를 확인하는 데 사용되는 상자그림에 대해 알아보겠습니다. 7.2 산포 - dispersion, 퍼짐 대부분의 경우 중심위치만으로 자료의 특성을 파악하기에는 한계가 있습니다.. 중심위치만큼 중요한 통계값이 산포입니다. 산포는 자료들이 얼마나 퍼져 있는지를 나타내는 측도이며, 중심위치가 얼마나 안정적인지에 대한 중요한 정보를 제공합니다. 자료가 조밀하게 모여 있는 경우 중심위치(평균)의 변동성이 작아져 신뢰도는..

[통계학] 02-5. 기술통계 (5) - 수치자료의 대체중심위치(중앙값, 절사평균, 최빈값)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 평균이 갖고 있는 단점은 이상점에 민감하다(이상점에 로보스트하지 않다)는 것이었습니다. 평균이 갖고 있는 단점을 해결할 수 있는 대체 통계값을 계산하는 방법(중앙값, 절사평균, 최빈값)과 성질을 알아보겠습니다. (6) 표본중앙값(sample median, 표본중위수) 표본중앙값은 자료를 크기순서대로 나열했을 때 가운데 위치에 있는 값으로 표본중위수라고도 합니다. 표본을 오름차순으로 정렬한 것을 순서통계량(order statistics)라고 합니다. ($x_1 < x_2 < ... < x_n$) 표본중앙값을 일반식으로 나타내면 다음과 같습니다. 여기서 $k_1 = (n+1)..

[통계학] 02-4. 기술통계 (4) - 수치자료 분포의 중심위치(평균, 표본비율, 기하평균, 조화평균, 가중평균)

(통계학-기본개념과 원리, 여인권)을 바탕으로 제작하였습니다. (k-mooc 통계학의 이해1, 여인권)을 수강하면서 정리해보았습니다. 7. 수치를 이용한 자료 정리 그래프 같은 시각적 기법은 자료의 특성을 파악하는데 있어 중요한 정보를 제공하지만 그것을 보는 사람에 따라 주관적으로 해석될 수 있습니다. 그렇기 때문에 일반적으로 자료분석의 최종 결과는 자료의 특성을 객관적으로 나타내는 수치로 제시됩니다. 일반적으로 자료의 특성은 자료를 대표할 수 있는 중심위치(central location)와 자료들이 얼마나 퍼져 있는지를 나타내는 산포(dispersion)로 표시된됩니다. 이번 포스팅에서는 수치자료 분포의 중심위치(평균, 표본비율, 가중평균, 기하평균, 조화평균)에 대해서 알아보겠습니다. 7.1 중심위치..

반응형