본문 바로가기
Python/Python FAQ

Python 정수 인덱스로 판다스 시리즈/데이터프레임의 행 선택, Selecting a row of pandas series/dataframe by integer index

by 베타코드 2023. 9. 18.
반응형

질문


나는 df[2]가 지원되지 않는 이유에 대해 궁금합니다. 반면에 df.ix[2]df[2:3]는 모두 작동합니다.

In [26]: df.ix[2]
Out[26]: 
A    1.027680
B    1.514210
C   -1.466963
D   -0.162339
Name: 2000-01-03 00:00:00

In [27]: df[2:3]
Out[27]: 
                  A        B         C         D
2000-01-03  1.02768  1.51421 -1.466963 -0.162339

나는 df[2]가 Python 인덱싱 규칙과 일관되도록 df[2:3]와 동일하게 작동할 것으로 예상합니다. 단일 정수로 행을 인덱싱하는 것을 지원하지 않는 설계적인 이유가 있을까요?


답변


echoing @HYRY, see the new docs in 0.11

http://pandas.pydata.org/pandas-docs/stable/indexing.html

Here we have new operators, .iloc to explicity support only integer indexing, and .loc to explicity support only label indexing

e.g. imagine this scenario

In [1]: df = pd.DataFrame(np.random.rand(5,2),index=range(0,10,2),columns=list('AB'))

In [2]: df
Out[2]: 
          A         B
0  1.068932 -0.794307
2 -0.470056  1.192211
4 -0.284561  0.756029
6  1.037563 -0.267820
8 -0.538478 -0.800654

In [5]: df.iloc[[2]]
Out[5]: 
          A         B
4 -0.284561  0.756029

In [6]: df.loc[[2]]
Out[6]: 
          A         B
2 -0.470056  1.192211

[] slices the rows (by label location) only

반응형

댓글