재교육 BERT 모델

0

질문

저는 훈련을 버트를 사용하여 모델 pytorch 대만 텍스트 데이터에 대한 분류하는 작업입니다. 이 테스트는 모델으로 새로운 데이터를 얻을 틀린 확실성 및 틀린 네거티브. 지금 내가 원하는 재교육의 기존의 모델로는 FN 및 FP. 내가 원하지 않을 추가 FN 및 FP 을 기존 데이터 집합 및 그런 다음 전체 모델을 다시합니다. 나는 어떻게 재교육에 이 버트는 모델으로만 이러한 FN 및 Fp 통해 previosuly 훈련된 모델입니다.

1

최고의 응답

0

없이 알고 코드를 기차 루프 아이디어는 다음과 같아야 합니다 이후 훈련:

results = model(data)
wrong_datapoints = []
for i, result in enumerate(results)

    if result != labels[i]:
        wrong_datapoints.append((data[i],labels[i]))


(data_new, labels_new) = list(zip(*wrong_datapoints))

model.train(data_new, labels_new)

당신이 원하는 무언가가 더욱 특정,당신은 당신을해야 할 것을 제공하는 코드로의 현재 기차 loop.

2021-11-23 12:46:43

감사합니다. 하지만 난을 유지하려는 모델의 이후,우리는 기차는 그것의 모든 주,우리 모델 버전니다. 또한 반복만을 기록 것입니다 시간이 많이 걸릴. 나는 생각하고 선적 이전 버전의 bin 파일(v1.0)그리고 다음 재교육에 이것만 새로운 데이터 포인트를 만들의 또 다른 버전 v2.0
Patricia

할 수 있습을 명확하게 질문하는 상태입니다. 그러나,하의 버전 관리를 제거하지 않습 추적하는 필요의 결과 데이터 포인트는 후에는 교육이 필요한 하나의 반복을 통해 훈련한 후 데이터 교육이 완료됩니다. 이 무엇인지를 결정해야"새로운 데이터 포인트는"수 있다.
Kroshtan

다른 언어로

이 페이지는 다른 언어로되어 있습니다

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................