📒 Today I Learn/🐍 Python

[Pandas] count & size

se0ehe 2024. 7. 16. 18:39

 

 

2024.07.16

 

 

 

 

데이터의 개수를 계산해주는 method인 두 함수의 차이와 기능에 대해서 정리하였다.

 

 

✳️ .count( )

🔹 각 컬럼에 몇 개의 데이터가 있는지 계산해주며, NaN 값은 포함하지 않는다.
🔹 count()의 결과는 데이터프레임을 반환한다.

<기본 구조>

df.count()
df.groupby().count()

 

 

 

 

✳️ .size

🔹 각 컬럼에 몇 개의 데이터가 있는지 계산해주며, NaN 값 포함한다.
🔹 groupby.size()의 경우에는 시리즈를 반환한다.

<기본 구조>
기본적으로 size는 numpy의 함수로 괄호를 붙이지 않는다.

df.size


groupby와 한께 쓰는 경우는 pandas method에 속하고  괄호를 붙이며 사용해야 한다.

df.groupby().size()

 

 

 

 

 

<참고자료>

https://blog.naver.com/PostView.naver?blogId=youji4ever&logNo=222405683851

 

[파이썬] 판다스(pandas) 팁42. count()와 size()의 차이점을 알아보자

주의깊게 살펴보지 않으면 판다스에서 size와 count의 역할이 굉장히 똑같다고 생각할 수 있다. 나도 처음...

blog.naver.com

 

https://bigdaheta.tistory.com/46

 

[pandas] 5. 데이터 세기 (count , size, value_counts)

01. 데이터 개수 세기 : count( ) 위의 데이터 프레임(df1)에서 각 columns별로 몇 개의 데이터가 들어있는지 확인하는 방법에 대해 알아보자. 〰️ 데이터 프레임에 count( )적용하기 df1.count() 위의 코드

bigdaheta.tistory.com