Python

[Pandas] 데이터프레임의 행/열/데이터 개수 세기

주댕이 2024. 11. 18. 18:28

# 행 개수 세기

## len()

  • len() 함수는 데이터프레임의 행 개수를 반환한다.
  • 코드
df = pd.DataFrame({
    "A": [1, 2, None, 4],
    "B": [None, 2, 3, 4],
    "C": [1, 1, 1, None]
})

len(df)
  • 출력
4

 

## shape

  • shape 속성의 첫 번째 값은 행의 개수를 나타낸다.
  • 코드
df.shape[0]
  • 출력
4

 

 

# 열 개수 세기

## columns

  • columns 속성은 데이터프레임의 열 이름을 반환하며, 이를 len()으로 감싸면 열 개수를 구할 수 있다.
  • 코드
len(df.columns)
  • 출력
3

 

## shape

  • shape 속성의 두 번째 값은 열의 개수를 나타낸다.
  • 코드
df.shape[1]
  • 출력
3

 

 

# 전체 데이터 개수 세기

## size

  • size 속성은 데이터프레임의 전체 셀 개수 (행 x 열)을 반환한다.
  • 코드
df.size
  • 출력
12

 

## shape

  • shape 속성을 이용하여 직접 계산할 수 있다.
  • 코드
df.shape[0] * df.shape[1]
  • 출력
12

 

 

# 결측치를 제외한 데이터 개수 세기

## 각 열의 데이터 개수

  • count() 메서드는 각 열의 결측치가 아닌 데이터의 개수를 반환한다.
  • 코드
df.count()
  • 출력
A    3
B    3
C    3
dtype: int64

 

## 전체 데이터 개수

  • count() 결과를 합산하면 결측치를 제외한 전체 데이터 개수를 구할 수 있다.
  • 코드
df.count().sum()
  • 출력
9

 

 

# 특정 값 개수 세기

  • 조건 필터링과 sum()을 사용하여 데이터프레임 전체에서 특정 값이 몇 개인지 구할 수 있다.
  • 코드
(df == 1).sum().sum()
  • 출력
4

 

728x90