데이터 불러올 때 유용한 정보 (read_csv)
2021. 4. 24. 04:11ㆍ데이터 사이언스/데이터셋 불러오기
1) index_col 지정하기
EX) movies_df = pd.read_csv(os.path.join(path, 'movies.csv'), index_col='movieId', encoding='utf-8')
'movield'라는 변수가 있고 데이터가 1,3,5,6 이렇게 띄엄 띄엄 돼 있을 때 index_col 을 지정하게 되면 1,2,3,4 로 인덱스
를 재구성해줌.
2) thousand = ',' 지정하기
EX) train_qual = pd.read_csv(PATH+'train_quality_data.csv', thousands=',')
thousands=',' 를 지정해주면 처음 받은 csv 파일에서 10,000 와 같이 쉼표로 구분 돼 있을 경우 ',' 를 제거하고 데이터
프레임 출력
'데이터 사이언스 > 데이터셋 불러오기' 카테고리의 다른 글
원하는 형태의 변수만 있는 데이터 프레임 출력 (0) | 2021.05.05 |
---|