[Kaggle] - spaceship titanic - 2912년에 오신걸 환영합니다.
https://www.kaggle.com/search Search | Kaggle www.kaggle.com 안녕하세요 ! 오늘은 Kaggle의 spaceship titanic 데이터로 머신러닝 End to End를 진행했습니다. 총 3시간정도 소요됐고 머신러닝의 전체적인 workflow를 연습하는 과정삼아 처음부터 끝까지 한 번에 했습니다. 위의 링크로 들어가시면 kaggle 대회의 overview 와 데이터셋을 다운받으실 수 있습니다. Data 다운받는 방법 kaggle에 등록된 데이터를 다운받는 방법은 두 가지가 있습니다. 우선 그냥 링크에 들어가서 파일로 올라온 데이터들을 다운 받으신 후 실습할 디렉토리에 저장하는 방법입니다. 이건 너무 쉽죠 ?! 하지만 저는 데이터 셋을 하나씩 다 다운 받은 후..
- Data science/Machine Learning Kaggle
- · 2023. 6. 28.
[Data Visualization] 시각화 연습 - Netflix Data Visualization
Dataset - Kaggle 의 netflix_titles.csv 데이터 세트 https://www.kaggle.com/code/joshuaswords/netflix-data-visualization Netflix Data Visualization Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources www.kaggle.com EDA 사실 여기까지는 뭐,.. 애초에 데이터 시각화를 연습하기 위해서 이 데이터 셋을 선택했기에. 데이터 시각화를 요즘 하도 안해서 코드를 작성하는 피지컬이 많이 죽었다고 해야하나 ㅜㅜ 사용해야 하는 파라미터 값이나 문법도 많이 까먹어서 다시 매일 하나씩..
- Data science/Machine Learning basic
- · 2023. 1. 20.
머신러닝 프로세스 이해하기 - Machine Learning Process & Pipeline
항상 헷갈리는 머신러닝 나만 그런건지 모르겠지만... 주기적으로 캐글 문제들을 풀지 않아서 그런걸까. 머신러닝의 프로세스를 대충 알고 있지만 어느 단계에서 어떤 방법을 사용해야 하는지 자꾸 까먹거나 헷갈릴 때가 많다. 중간 고사도 끝났고 kaggle 문제들을 본격적으로 풀기 전에 다시 한 번 머신러닝의 전체적인 프로세스를 쭉 학습하며 정리했다. 구글링을 해보면 정말 많은 레퍼런스가 있는데, 사실 사용하는 사람들마다 용어가 조금씩 다르기도 하고 순서도 제각각 다른 경우도 많다. 하지만 사용하는 사이킷런 코드나 큰 틀은 일관된 방향성을 갖는다. 이번 포스팅에서는 데이터 전처리에 대해 다룬다. 데이터 전처리는 주로 데이터 클리닝(Data cleaning) , 데이터 변형(Data Transformation),..
- Data science/Machine Learning basic
- · 2022. 10. 28.