✳️ index
: 데이터프레임 또는 시리즈의 각 행 또는 각 요소에 대한 식별자
- 특징
- 고유성(Uniqueness) : 각 행은 유일한 인덱스 값을 가져야함. 중복된 인덱스 값을 가질 수 없음
- 불변성(Immutability) : 불변성을 가짐. 즉, 한 번 생성된 인덱스는 변경(수정)할 수 없음
단, 새로운 값을 할당하여 기존 인덱스를 대체하는 것은 가능 - 조작 및 탐색(Manipulation and Retrieval) : 인덱스를 사용하여 데이터프레임 또는 시리즈의 특정 행을 선택하거나 탐색할 수 있음
- 정렬(Sorting) : 인덱스를 기준으로 데이터프레임 또는 시리즈의 행을 정렬할 수 있음
예시) 다음과 같은 데이터프레임을 생성하였다.
df = pd.DataFrame({
'A' : [5, 6, 1],
'B' : ['변준형', '이정현', '유기상']
})
df
🔹 기본 인덱스
판다스는 기본적으로 0부터 시작하는 정수 인덱스를 제공한다.
데이터프레임을 생성할 때 자동을 부여되는 것이다.
그래서 예시와 같이 인덱스가 0, 1, 2로 지정되어 있다.
🔹 사용자 지정 인덱스
사용자가 직접 인덱스를 설정할 수 있다.
index=[원하는 인덱스 리스트]
df = pd.DataFrame({
'A' : [5, 6, 1],
'B' : ['변준형', '이정현', '유기상']
}, index=['정관장', '소노', '엘지'])
df
🔹 인덱스 활용하기
인덱스를 활용하여 데이터에 접근하거나 조작이 가능하다.
- 특정 인덱스의 행에 접근
df.loc['정관장']
'정관장' 이라는 인덱스에 해당하는 값을 볼 수 있다.
- .sort_index() 를 이용하여 인덱스를 기준으로 정렬
df.sort_index()
- .set_index
특정 컬럼에 들어있는 값을 인덱스로 활용하기
a = df.set_index('A')
a
'A'라는 컬럼의 값을 인덱스로 설정하였다.
- .index로 인덱스 확인하기
a.index
df.index
- .reset_index()를 활용하여 현재 인덱스를 0부터 시작하는 정수로 변경하기
df.reset_index()
df.reset_index(drop=True)
drop=True를 해주면 'index' 열이 생긴 것이 사라진다.
- 인덱스 변경(대체)
df.index = ['1', '2', '3']
df
인덱스를 내가 원하는 인덱스로 대체할 수 있는 방법이다.
✳️ column
: 데이터프레임의 열로, 세로 방향에 있는 데이터들이다.
- 특징
- 고유한 이름(라벨)을 가지고 해당 컬럼의 데이터를 식별하는 데 사용
- 특정한 종류의 데이터를 담고 숫자, 문자열, 날짜 등 다양한 유형의 데이터 포함
- 시리즈 객체로 구성되어 있음
- 데이터프레임의 일부로 간주되며 해당 열의 데이터를 조작하고 접근할 수 있는 인터페이스를 제공
예시)
data = {
'name' : ['변준형', '이정현', '문성곤'],
'backnumber' : [5, 6, 10],
'team' : ['정관장', '소노', 'KT']
}
df = pd.DataFrame(data)
df
🔹 컬럼명으로 데이터 접근하기
df['name']
컬럼명을 제시해주면 해당하는 값을 불러와준다.
🔹 컬럼의 종류 파악하기
df.columns
.columns 를 해주면 어떤 컬럼들이 있는지 출력해준다.
🔹 컬럼명 변경하기
- 영어로 되어 있던 컬럼명을 한국어로 바꿔보기!
df.columns = ['이름', '등번호', '소속팀']
df
일괄로 컬럼명을 변경할 수 있다.
- 딕셔너리 형태를 이용하여 컬럼명 따로 따로 바꿔보기
df = df.rename(columns={'이름' : 'name'})
df
df = df.rename(columns={'등번호' : 'backnumber', '소속팀' : 'hometeam'})
df
🔹 컬럼 추가 & 삭제
- 추가
df['스포츠'] = '농구'
df
새로운 컬럼을 지정하고 값을 할당해주면 일괄로 컬럼의 값이 채워지며 생성된다.
- 제거
del df['스포츠']
df
생성 시켰던 컬럼을 del 을 이용하여 다시 제거하였다.
'📒 Today I Learn > 🐼 Pandas' 카테고리의 다른 글
[Pandas] 데이터 타입 확인과 변경 (0) | 2024.07.19 |
---|---|
[Pandas] 데이터 확인 (0) | 2024.07.19 |
[Pandas] 데이터 불러오기 / 저장하기 (0) | 2024.07.18 |
[Pandas] Apply & Map (0) | 2024.07.17 |
[Pandas] Pandas? (0) | 2024.07.17 |