Python
[Pandas] 데이터프레임의 행/열/데이터 개수 세기
주댕이
2024. 11. 18. 18:28
# 행 개수 세기
## len()
- len() 함수는 데이터프레임의 행 개수를 반환한다.
- 코드
df = pd.DataFrame({
"A": [1, 2, None, 4],
"B": [None, 2, 3, 4],
"C": [1, 1, 1, None]
})
len(df)
- 출력
4
## shape
- shape 속성의 첫 번째 값은 행의 개수를 나타낸다.
- 코드
df.shape[0]
- 출력
4
# 열 개수 세기
## columns
- columns 속성은 데이터프레임의 열 이름을 반환하며, 이를 len()으로 감싸면 열 개수를 구할 수 있다.
- 코드
len(df.columns)
- 출력
3
## shape
- shape 속성의 두 번째 값은 열의 개수를 나타낸다.
- 코드
df.shape[1]
- 출력
3
# 전체 데이터 개수 세기
## size
- size 속성은 데이터프레임의 전체 셀 개수 (행 x 열)을 반환한다.
- 코드
df.size
- 출력
12
## shape
- shape 속성을 이용하여 직접 계산할 수 있다.
- 코드
df.shape[0] * df.shape[1]
- 출력
12
# 결측치를 제외한 데이터 개수 세기
## 각 열의 데이터 개수
- count() 메서드는 각 열의 결측치가 아닌 데이터의 개수를 반환한다.
- 코드
df.count()
- 출력
A 3
B 3
C 3
dtype: int64
## 전체 데이터 개수
- count() 결과를 합산하면 결측치를 제외한 전체 데이터 개수를 구할 수 있다.
- 코드
df.count().sum()
- 출력
9
# 특정 값 개수 세기
- 조건 필터링과 sum()을 사용하여 데이터프레임 전체에서 특정 값이 몇 개인지 구할 수 있다.
- 코드
(df == 1).sum().sum()
- 출력
4
728x90