#몇 번째 중복된 데이터인지 확인하기 - cumcount가 0인 경우 중복이 없는 데이터

df.groupby('이름').cumcount()

 

df = pd.DataFrame([['a'], ['a'], ['a'], ['b'], ['b'], ['a']],
                 columns=['A'])
df

중복된 속성이 있는 데이터프레임을 만들었다. 이를 groupby하여 cumcount()하면 결과가 어떻게 될까?

df.groupby('A').cumcount()

중복 데이터마다 몇번째인지 값을 나타낸다.

+ Recent posts