df.groupby(['target']).count()
대상 | 데이터 |
---|---|
정 | 103210 |
긍정 | 211082 |
지금,나는 긍정적인 데이터는 것은 너무 큽니다. 을 삭제하고 싶 50%의 행 값에 Target
열 Positive
. 어떻게 할 수 있습니다?
df.groupby(['target']).count()
대상 | 데이터 |
---|---|
정 | 103210 |
긍정 | 211082 |
지금,나는 긍정적인 데이터는 것은 너무 큽니다. 을 삭제하고 싶 50%의 행 값에 Target
열 Positive
. 어떻게 할 수 있습니다?
의 절반을 유지하 Positive
행 sample
의 50% Positive
행 사용 frac=0.5
고 drop
그러 인덱스:
indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)
지 정확히 100K Positive
행 sample
100K Positive
행 사용 n=100_000
고 concat
그들과 함께 Negative
rows:
df = pd.concat([
df[df.target == 'Negative'],
df[df.target == 'Positive'].sample(n=100_000)
])