컬럼명 또는 인덱스로 데이터프레임 coulmn 삭제하기

 

아래와 같은 데이터 프레임이 있다고 가정하자.

Iris dataset

이때, 특정 컬럼을 추가하거나 삭제하고 싶다면?

 

컬럼명으로 삭제


'sepal width (cm)' 컬럼을 삭제하고 싶다면, 아래와 같이 코드를 구현하면 된다.

df.drop(columns=['sepal width (cm)'])

 

또는, columns= 을 쓰지 않는 대신, axis=1을 추가하면 된다.

참고로, axis=1은 column을 기준으로 연산하는 것, axis=0은 row를 기준으로 연산하는 것이다.

df.drop(['sepal width (cm)'], axis=1)

여러개의 컬럼을 한번에 삭제하고 싶을 땐 [] 안에 여러개의 컬럼을 입력하면 된다.

df.drop(['sepal length (cm)', 'petal width (cm)'],axis=1)

 

인덱스로 삭제


컬럼명을 일일이 작성하기 어렵거나, 쉽게 여러개의 column을 처리하고 싶다면 인덱스를 활용하면 된다.

df.drop(columns=df.columns[[1]])

데이터프레임.columns() 를 실행하면 해당 데이터프레임의 컬럼명 리스트를 확인할 수 있는데, 그걸 활용해서 몇번째 컬럼을 삭제할 지 선택할 수 있다. 

여러개의 컬럼을 한번에 삭제하고 싶을 땐 여러 인덱를 입력하면 된다.

df.drop(columns=df.columns[[0,2]])

+ Recent posts