# 행 개수 세기
## len()
- len() 함수는 데이터프레임의 행 개수를 반환한다.
- 코드
df = pd.DataFrame({
"A": [1, 2, None, 4],
"B": [None, 2, 3, 4],
"C": [1, 1, 1, None]
})
len(df)
- 출력
4
## shape
- shape 속성의 첫 번째 값은 행의 개수를 나타낸다.
- 코드
df.shape[0]
- 출력
4
# 열 개수 세기
## columns
- columns 속성은 데이터프레임의 열 이름을 반환하며, 이를 len()으로 감싸면 열 개수를 구할 수 있다.
- 코드
len(df.columns)
- 출력
3
## shape
- shape 속성의 두 번째 값은 열의 개수를 나타낸다.
- 코드
df.shape[1]
- 출력
3
# 전체 데이터 개수 세기
## size
- size 속성은 데이터프레임의 전체 셀 개수 (행 x 열)을 반환한다.
- 코드
df.size
- 출력
12
## shape
- shape 속성을 이용하여 직접 계산할 수 있다.
- 코드
df.shape[0] * df.shape[1]
- 출력
12
# 결측치를 제외한 데이터 개수 세기
## 각 열의 데이터 개수
- count() 메서드는 각 열의 결측치가 아닌 데이터의 개수를 반환한다.
- 코드
df.count()
- 출력
A 3
B 3
C 3
dtype: int64
## 전체 데이터 개수
- count() 결과를 합산하면 결측치를 제외한 전체 데이터 개수를 구할 수 있다.
- 코드
df.count().sum()
- 출력
9
# 특정 값 개수 세기
- 조건 필터링과 sum()을 사용하여 데이터프레임 전체에서 특정 값이 몇 개인지 구할 수 있다.
- 코드
(df == 1).sum().sum()
- 출력
4
728x90
'Python' 카테고리의 다른 글
[Pandas] 날짜/시간의 차이 (timedelta) (0) | 2024.11.18 |
---|---|
[Pandas] 날짜/시간 데이터 처리하기(to_datetime(), .dt, to_period) (0) | 2024.11.18 |
[Python] enumerate() (4) | 2024.11.14 |
[Pandas] apply lambda 식으로 데이터 가공하기 (0) | 2024.02.19 |
[Matplotlib] 데이터 시각화 (0) | 2024.02.03 |