2024.07.15
✳️ .drop_duplicates( )
데이터프레임에서 중복되는 행을 제거하고 고유한 값만 남기고 싶을 때 쓰는 method
<기본 구조>
import pandas as pd
df.drop_duplicates()
🔹 중복제거
df.drop_duplicates()
아무것도 지정하지 않으면 모든 컬럼을 기준으로 중복을 제거한다.
🔹 열 지정 중복 제거
파라미터로 열을 지정하면 지정된 열을 기준으로 중복 제거한다.
▶ 단일
df.drop_duplicates(['컬럼명'])
▶ 여러 개
df.drop_duplicates(['컬럼명1', '컬럼명2'])
🔹 남길 대상 지정
중복되는 데이터 중, 어떤 행을 남길지 지정할 수 있다.
1. 첫 번째 남기기 : 인덱스 기준으로 가장 앞에 있는 행을 남김
df.drop_duplicates(['컬럼명'], keep = 'first')
2. 마지막 남기기 : 인덱스 기준으로 가장 마지막에 있는 행을 남김
df.drop_duplicates(['컬럼명'], keep = 'first')
3. 모두 제거 : 중복되는 데이터가 있는 행은 제거
df.drop_duplicates(['컬럼명'], keep = False)
<참고 자료>
[Python] 데이터프레임 중복 제거 :: drop_duplicates
데이터프레임에서 중복되는 행을 제거하고 고유한 값만 남기고 싶을 때 Pandas의 drop_duplicates를 활용하면 된다. import pandas as pd # 중복제거 df.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=F
mizykk.tistory.com
'📒 Today I Learn > 🐍 Python' 카테고리의 다른 글
[Python] 파이썬에서 like 검색 - .str.startswith() & .str.contains() (0) | 2024.07.15 |
---|---|
[Pandas] 데이터프레임 값 바꾸기 (변경, replace) (0) | 2024.07.15 |
[Pandas] .loc[ ] & .iloc[ ] (0) | 2024.07.15 |
[Python] 할당과 복사 (0) | 2024.07.12 |
[Python] While 문 (0) | 2024.07.09 |