'pandas' 태그의 글 목록

EDA - 결측치 처리 ( pandas, matplotlib, seaborn etc )

Kaggle 로 데이터 분석 혹은 머신러닝 실습을 하다 보면 자주 쓰이는 파이썬의 라이브러리들을 정리하려고 합니다. 캐글에서 여러 사람들의 노트를 보면 쉬운 문법으로 정말 인터렉티브한 분석을 합니다. 그런 부분들을 하나씩 모아서 저도 써볼 수 있도록 노력하겠습니다. 데이터 세트 하나를 정해놓고 쭉 분석을 하는 포스팅은 Kaggle 카테고리에서 진행하도록 하고 여기에서는 제가 실습했었던 부분들 중 정말 유용하게 쓰일 수 있는 테크닉이나 plotting 기법등을 리뷰하고 다른 캐글 랭커들의 테크닉도 발췌해서 같이 공부하면 좋을 듯 합니다 :0 결측치 처리 결측치를 확인할 때는 info() 메서드를 통해 가장 심플하게 확인이 가능합니다. 뿐만 아니라 데이터의 형태, 칼럼의 개수등을 파악하기에 정말 좋습니다. ..

format_list_bulleted 카테고리 없음
· 2022. 9. 27.

Kaggle - EDA guideline ( pandas, numpy, seaborn, matplotlib ) - part 1

Kaggle 에서 최대한 많은 데이터 세트로 EDA 를 연습하고 있습니다. pandas , numpy , matplotlib, seaborn 등 데이터 분석에 기본이 되는 라이브러리들을 체화시키기 위해 노력하고 있지만 확실히 자유자재로 활용하려면 매일 해야할 것 같네요. 매주 주말에는 제가 분석하면서 어렵거나 헷갈릴만한 부분을 정리해볼까 합니다. Dataset : Kaggle에서 가져온 carclaims.csv 당연히 데이터 분석을 할 때의 시작은 데이터세트를 가져오는 것이죠 . df 변수에 "carclaims.csv"를 담아줍니다. pandas 라이브러리의 read_csv 메서드를 통해 다운받은 csv 파일을 가져올게요. 가져온 데이터 파일 ( 이하 df ) 는 df.head() 처럼 상위 몇 개의 데..

format_list_bulleted Data science
· 2022. 9. 17.

LIST

navigate_before
1
navigate_next

EDA - 결측치 처리 ( pandas, matplotlib, seaborn etc )

Kaggle - EDA guideline ( pandas, numpy, seaborn, matplotlib ) - part 1

티스토리툴바

EDA - 결측치 처리 ( pandas, matplotlib, seaborn etc )