본문 바로가기
Python/데이터 분석

[DataFrame] DataFrame - 컬럼 다루기 & 컬럼명 변경 및 추가, 삭제하기

by snow_white 2022. 4. 2.

◾ Column 다루기

  • DataFrame에 key 값으로 column의 이름을 지정하여 column을 선택할 수 있음
  • 1개의 column을 가져올 수 있으며, 1개의 column 선택 시 Series가 옴
df2['python']
'''
a    59
b    11
c    35
d    68
Name: python, dtype: int32
'''

type(df2['python']) # pandas.core.series.Series
  • 2개 이상의 column 선택은 팬시 인덱싱으로 가능!
df2[['python', 'da']]
'''
	python	da
a	  59	 60
b	  11	 20
c	  35	 73
d 	68	 16
'''

컬럼명 수정

  • columns원본이 바로 변경됨, 한꺼번에 전체 수정할 때 사용
  • rename원본변경 안됨, inplace = True옵션 지정, 부분 수정할 때 사용
    1. 재대입
    2. 재대입하지 않고, inplace=Ture 사용
    pandas comunity에서는 2번을 권장함. 확실하게 확인 후 재대입
  • 기존의 이름을 수정할 때 사용
# 컬럼 한 번에 수정
df2. columns = ['python', 'da', 'deep', 'django']
df2

(좌) df2 / (우) 칼럼명 변경 후

# address 컬럼명을 addr로 변경
# 딕셔너리 인자로 이전 칼럼명:변경할 칼럼명
# 변경 후 재대입 필수
# 신중하게 사용하는 방법!
df1_new = df1.rename(columns={'address':'addr'})
df1_new

(좌) df1 / (우) df1_new 칼럼명 변경 후

 

# inplace = True

df1.rename(columns={'address':'addr'}, inplace=True)

# 컬럼 추가하기
# 컬럼 추가 후 값 대입, 데이터 하나로 통일해서 입력 가능
df1['phone'] = np.nan

 

댓글