데이터에 대해서 두 가지 접근법이 존재한다. CDA와 EDA다. CDA 는 확증적 데이터 분석으로 (confirmatory data analysis) 가설을 수립하고 데이터를 통해 통계적 유의성을 검정하는 전통적 분석 기법이다. 로널드 피셔(Ronald Fisher)는 모집단과 표본을 구별하고 모집단에 관한 지식을 정밀한 소표본에 의하여 추정하는 방법을 수립해, 추계 통계학을 창시했다. 가설검정, 신뢰구간(=유의 수준), 유의확률(p-value) 등의 관련 용어들도 존재한다. 그와 다른 EDA, 탐색적 데이터 분석이 존재한다. (exploratory data analysis) 정해진 가설과 모형없이 데이터의 구조와 특성을 통해 통찰을 얻는 분석 기법이다. 존 튜키(John Tukey)는 "EDA는 우리가..