를 삭제하는 방법의 50%행을 공유하는 특정 열 값

Question 1

df.groupby(['target']).count()

대상	데이터
정	103210
긍정	211082

지금,나는 긍정적인 데이터는 것은 너무 큽니다. 을 삭제하고 싶 50%의 행 값에 Target 열 Positive. 어떻게 할 수 있습니다?

Question 2

의 절반을 유지하 Positive 행 sample 의 50% Positive 행 사용 frac=0.5 고 drop 그러 인덱스:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

지 정확히 100K Positive 행 sample 100K Positive 행 사용 n=100_000 고 concat 그들과 함께 Negative rows:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])

tdy · Answer 1 · 2021-11-24T04:27:20

의 절반을 유지하 Positive 행 sample 의 50% Positive 행 사용 frac=0.5 고 drop 그러 인덱스:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

지 정확히 100K Positive 행 sample 100K Positive 행 사용 n=100_000 고 concat 그들과 함께 Negative rows:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])

질문