반응형
질문
나는 각 열이 다른 값 범위를 가진 판다스 데이터프레임을 가지고 있습니다. 예를 들면:
df:
A B C
1000 10 0.5
765 5 0.35
800 7 0.09
이 데이터프레임의 열을 정규화하여 각 값이 0과 1 사이에 있도록 하는 방법이 있을까요?
원하는 출력은 다음과 같습니다:
A B C
1 1 1
0.765 0.5 0.7
0.8 0.7 0.18(즉, 0.09/0.5)
답변
하나의 쉬운 방법은 Pandas를 사용하는 것입니다: (여기에서 평균 정규화를 사용하고 싶습니다)
normalized_df=(df-df.mean())/df.std()
min-max 정규화를 사용하려면:
normalized_df=(df-df.min())/(df.max()-df.min())
편집: 일부 우려 사항을 해결하기 위해, 위의 코드에서 Pandas가 자동으로 열별 함수를 적용한다고 말해야 합니다.
반응형
댓글