반응형

통계 4

[BOJ][2108번] 통계학

안녕하세요 Dibrary입니다. 이번에는 시간초과때문에 온갖 머리를 쥐어짰던 문제를 정리해보고자 합니다. 어휴 =_=;; (뭐 덕분에 Counter를 알게 되었으니까 다행이죠) 2108번: 통계학 첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다. 입력되는 정수의 절댓값은 4,000을 넘지 않는다. www.acmicpc.net 문제는 간단합니다. 그저 평균, 중앙값, 최빈값, 범위 만 구하면 됩니다. 그 와중에 혹시라도 시간초과 걸릴까봐 (너무 쉬운거 같은 문제는 꼭 이런게 걸려있곤 해서 말이죠) 미리 아이디어를 좀 짰었습니다. 값 받으면서 미리 정할 수 있는게 뭐 없을까? 최대값, 최소값은 값을 받으면서 미리 확인해 나갈 ..

Dixon Q test - 특이치 식별 및 제거, 파이썬으로 구현

안녕하세요 Dibrary입니다. 이번 시간에는 데이터 분석을 하기 전에 데이터의 이상치(outlier)를 제거하는 Dixon Q test를 파이썬으로 구현 해 보겠습니다. 먼저, Dixon Q test에 대해 알아보겠습니다. Dixon Q test는 이상치를 제거할 때 사용할 수 있습니다. 식은 간단하게 아래와 같이 나타낼 수 있고, 여기서 gap은 이상치(outlier)로 추정되는 값, 그리고 그 값과 가장 가까운 숫자간의 절대값 '차이' 입니다. range는 전체 데이터의 (최대값 - 최소값) 차이 입니다. 이렇게 계산된 Q값이 table의 Q값보다 크다면 이상치(outlier)로 추정되는 값이 이상치가 맞다는 결론을 내립니다. 신뢰도를 90, 95, 99로 다르게 적용 할 수록, table의 Q값은..

Anderson-Darling 통계 - 정규성 검정, 파이썬으로 확인하기

안녕하세요 Dibrary입니다. 이번 시간에는 파이썬으로 Anderson-Darling 통계량을 확인해 보는 방법을 소개하겠습니다. 먼저, Anderson-Darling 통계를 보기전에, 먼저 알아야 할 사전 지식은 3가지가 있습니다. 귀무가설 대립가설 P-value 통계를 공부 해 보신 분이라면 당연히 알 수 있겠지만, 모르는 분들을 위해 간략히 소개만 해 보겠습니다. 귀무가설(H0) 쉽게 표현하자면 '차이가 없다'라고 주장하는 가설이라고 보시면 됩니다. 그리고, 이 가설이 맞지 않음을 즉, '차이가 있음'을 통계학적 증거로 증명하면 됩니다. 대립가설(H1) 귀무가설의 반대입니다. '차이가 있다' 라고 보통 주장하는 가설입니다. 귀무가설의 기각 여부가 대립가설의 통계학적 결과로 판별 됩니다. P-val..

사회조사분석사 자격증은 빅데이터랑 관련이 있을까?

안녕하세요. Dibrary입니다. 이번에는 제가 취득한 자격증 중에 '사회조사분석사2급'에 대한 내용입니다. 최근에 자격증을 따면 좋을 것이라는 막연한 기대감에 조금이라도 관련이 있다 싶으면 자격증을 취득하려는 사람들이 늘고 있습니다. 미래가 더 불안하기에 그런 경향이 많아지는 것도 같네요. 빅데이터가 큰 화두가 되면서 이 자격증 역시 나름? 관심을 받고 있습니다. 사실 원래는 통계직 공무원에 갈 사람이 따는 기본 자격증 취급이었는데, 요즘은 개발자들도 꽤나 관심을 가지고 있죠. 저는 취득한지는 좀 되었네요. (밑에껀 관련이 없습니다.) 우선 제가 '사회조사분석사2급'자격증을 시험 본 계기는 단순합니다. 대학교 다니면서 '졸업 전에 반드시 배우고 나가야 겠다' 싶은 과목은 타과 전공들을 추가신청해서 수강..

반응형