[팀프로젝트] 이미지의 경로와 json 소분류 카테고리를 따로 저장해보자
라벨링 파일 JSON -> numpy array 지난번에 다운받은 데이터들 중에서 sketch 데이터만 사용하기로 했다. 데이터의 크기가 너무 크기 때문에 카테고리가 '동식물'인 스케치 데이터로 범위를 축소했다. training 이미지 데이터(.jpg), training 라벨링 데이터(.json), validation 이미지 데이터 , validation 라벨링 데이터 각 폴더에는 중분류 , 소분류로 나눠진 폴더가 세 겹으로 쌓여있다. 각 폴더들을 모두 탐색하여 json 파일의 소분류만 추출하여 데이터 프레임으로 만들었다. 이후에 모델링을 할 때 사용해야 하므로 데이터 프레임을 넘파이 배열로 저장했다. import os import json import pandas as pd # define the ro..
- Data science/Deep Learning Toy Project
- · 2023. 3. 25.
반응형
LIST