본문 바로가기
Python/Python FAQ

Python 판다스에서 map, applymap 및 apply 메서드의 차이점은 무엇인가요?, Difference between map, applymap and apply methods in Pandas

by 베타코드 2023. 7. 26.
반응형

질문


이 벡터화 방법들을 언제 사용해야 하는지와 기본적인 예시를 알려주실 수 있나요?

mapSeries 메소드인 반면 나머지는 DataFrame 메소드입니다. 하지만 applyapplymap 메소드에 대해서는 헷갈립니다. 왜 DataFrame에 함수를 적용하는 두 가지 메소드가 있는 건가요? 다시 한번, 사용법을 보여주는 간단한 예시가 있다면 좋을 것 같습니다!


답변


apply은 DataFrame의 행 / 열 기반으로 작동합니다.
applymap은 DataFrame의 요소별로 작동합니다.
map은 Series의 요소별로 작동합니다.


Wes McKinney의 Python for Data Analysis 책에서 가져온 내용입니다. 132쪽 (이 책을 강력히 추천합니다):

또 다른 빈번한 작업은 함수를 1차원 배열에 적용하여 각 열 또는 행에 대해 수행하는 것입니다. DataFrame의 apply 메서드는 정확히 이 작업을 수행합니다:

In [116]: frame = DataFrame(np.random.randn(4, 3), columns=list('bde'), index=['Utah', 'Ohio', 'Texas', 'Oregon'])

In [117]: frame
Out[117]: 
               b         d         e
Utah   -0.029638  1.081563  1.280300
Ohio    0.647747  0.831136 -1.549481
Texas   0.513416 -0.884417  0.195343
Oregon -0.485454 -0.477388 -0.309548

In [118]: f = lambda x: x.max() - x.min()

In [119]: frame.apply(f)
Out[119]: 
b    1.133201
d    1.965980
e    2.829781
dtype: float64

가장 일반적인 배열 통계량 (예: 합계와 평균)은 DataFrame 메서드로 제공되므로 apply를 사용할 필요가 없습니다.

요소별 Python 함수도 사용할 수 있습니다. frame의 각 부동 소수점 값에서 서식이 있는 문자열을 계산하려는 경우 applymap을 사용할 수 있습니다:

In [120]: format = lambda x: '%.2f' % x

In [121]: frame.applymap(format)
Out[121]: 
            b      d      e
Utah    -0.03   1.08   1.28
Ohio     0.65   0.83  -1.55
Texas    0.51  -0.88   0.20
Oregon  -0.49  -0.48  -0.31

applymap의 이름이 지어진 이유는 Series에는 요소별 함수를 적용하는 map 메서드가 있기 때문입니다:

In [122]: frame['e'].map(format)
Out[122]: 
Utah       1.28
Ohio      -1.55
Texas      0.20
Oregon    -0.31
Name: e, dtype: object
반응형

댓글