Kaggle - EDA guideline ( pandas, numpy, seaborn, matplotlib ) - part 1
Kaggle 에서 최대한 많은 데이터 세트로 EDA 를 연습하고 있습니다. pandas , numpy , matplotlib, seaborn 등 데이터 분석에 기본이 되는 라이브러리들을 체화시키기 위해 노력하고 있지만 확실히 자유자재로 활용하려면 매일 해야할 것 같네요. 매주 주말에는 제가 분석하면서 어렵거나 헷갈릴만한 부분을 정리해볼까 합니다. Dataset : Kaggle에서 가져온 carclaims.csv 당연히 데이터 분석을 할 때의 시작은 데이터세트를 가져오는 것이죠 . df 변수에 "carclaims.csv"를 담아줍니다. pandas 라이브러리의 read_csv 메서드를 통해 다운받은 csv 파일을 가져올게요. 가져온 데이터 파일 ( 이하 df ) 는 df.head() 처럼 상위 몇 개의 데..