✳️sort
- sql의 order by처럼 정렬을 하는 method가 존재
- sort_value() : 값을 기준으로 정렬
- sort_index() : 인덱스를 기준으로 정렬
- by= : 어떤 컬럼의 값을 기준으로 할지 정할 수 있음(by='컬럼명')
- ascending=True or False : 오름차순 (True)이 기본이며 내림차순(False)도 설정 가능
예시)
예시들을 내 입맛에 맞춰 변경해서 실습해봤다 😝
df = pd.DataFrame({
'Name': ['변준형', '이정현', '문성곤', '최성원', '박지훈'],
'Backnumber': [5, 6, 10, 19, 6],
'Score': [32, 37, 21, 27, 30]
})
df
- 인덱스로 정렬하기
- 기본 값으로는 오름차순이지만 인덱스를 기준으로 내림차순 정렬을 할 수 있다.
df.sort_index(ascending=False)
- 값으로 정렬하기
Backnumber 라는 컬럼 기준으로 정렬해보기
df.sort_values(by='Backnumber')
Backnumber 라는 컬럼 기준으로 내림차순 정렬해보기
df.sort_values(by='Backnumber', ascending=False)
Backnumber와 Score라는 컬럼 기준으로 내림차순 정렬해보기
df.sort_values(by=['Backnumber', 'Score'], ascending=False)
Backnumber 기준 오름차순, Score 기준으로 내림차순 정렬해보기
df.sort_values(by=['Backnumber', 'Score'], ascending=[True, False])
✳️ pickle
- pickle 활용하기
- python 의 변수, 함수, 객체를 파일로 저장하고 불러올 수 있는 라이브러리
- list, dictionary등을 파일 그대로 저장하면 용량이 매우 커지는데 pickle을 사용하면 binary형태로 저장되기 때문에 용량이 매우 작아짐
- 추가적으로 gzip을 이용하여 pickle로 저장된 데이터를 압축할 수 있음 → pandas에서는to_pickle()및read_pickle() 메서드를 통해 pickle을 사용할 수 있음
- 머신러닝 모델 등을 저장하고 불러올때도 활용함
- pickle 저장하기
import pandas as pd
# 샘플 데이터프레임 생성
data = {
'Column1': [1, 2, 3, 4, 5],
'Column2': ['A', 'B', 'C', 'D', 'E']
}
df = pd.DataFrame(data)
# 데이터프레임을 pickle 파일로 저장
df.to_pickle('dataframe.pkl') # 데이터프레임을 'dataframe.pkl' 파일로 저장
- pickle 불러오기
import pandas as pd
# pickle 파일에서 데이터프레임 불러오기
loaded_df = pd.read_pickle('dataframe.pkl') # 'dataframe.pkl' 파일에서 데이터프레임 불러오기
print(loaded_df)
'📒 Today I Learn > 🐼 Pandas' 카테고리의 다른 글
[Pandas] 데이터 집계 (0) | 2024.07.23 |
---|---|
[Pandas] 데이터 병합 (0) | 2024.07.23 |
[Pandas] 데이터 추가하기 (0) | 2024.07.23 |
[Pandas] Boolean indexing (0) | 2024.07.23 |
[Pandas] 데이터 선택 (0) | 2024.07.23 |