데이터 사이언스/데이터셋 불러오기

데이터 불러올 때 유용한 정보 (read_csv)

주인장 아저씨 2021. 4. 24. 04:11

1) index_col 지정하기

  EX)  movies_df = pd.read_csv(os.path.join(path, 'movies.csv'), index_col='movieId', encoding='utf-8')

  'movield'라는 변수가 있고 데이터가 1,3,5,6 이렇게 띄엄 띄엄 돼 있을 때 index_col 을 지정하게 되면 1,2,3,4 로 인덱스

  를 재구성해줌. 

 

2) thousand = ',' 지정하기

  EX) train_qual = pd.read_csv(PATH+'train_quality_data.csv', thousands=',')

  thousands=',' 를 지정해주면 처음 받은 csv 파일에서 10,000 와 같이 쉼표로 구분 돼 있을 경우 ',' 를 제거하고 데이터

  프레임 출력