을 제거하는 방법을 줄 경우에 포함되지 않은 편지에서는 파이썬

0

질문

를 제거하려줄에서하는 경우 문자열이 포함되어 있지 않은 어떤 편지하고 전달하는 경우 포함한 문자 또는 숫자입니다. 나는이 문제를 해결하기 위해 시도를 사용하여 정규 표현식 라이브러리는 모두 지원되며,하지만 할 수 없을 제거하는 라인입니다. 예

string='''हिरासत में ली गई महिला 36 वर्षीय नूर सजात कमरुज़्ज़मा थीं
          British High Commissioner Greets
          
          पत्ता आंबेडकर चौक, निमशीरगाव,
          निमिशरगाव, निरमशिरगाव, कोल्हापूर, NIMSHIRGAON, Nimshirgaon,
          Address: ambedkar chowk,
          महाराष्ट्र, 416101
          Nimshirgaon, Kolhapur, Maharashtra,
          416101
          1832
          1947'''

출력하고 싶

output=  '''British High Commissioner Greets
           Address: ambedkar chowk,
           Nimshirgaon, Kolhapur, Maharashtra,
           416101
           1832
           1947'''

저를 도와주세요!!!

data-structures pandas python python-3.x
2021-11-22 11:32:47
2

최고의 응답

2

당신이 사용할 수 있는 간단한 이해와 함께 정규 표현식을 매치 줄만으로 ascii 문자:

import re
out = '\n'.join(s for s in string.split('\n') if re.match(r'^[\x00-\x7F]+$', s))
print(out)

출력:

          British High Commissioner Greets
          
          Address: ambedkar chowk,
          Nimshirgaon, Kolhapur, Maharashtra,
          416101
          1832
          1947
2021-11-22 11:53:46
1

여기서 당신은 이동합니다. 중 라인을 따르지 않는 패턴(더 추가할 수 있습니다 캐릭터의 패턴에 따라 당신이 원하는 것),그것은 되지 않습니다 추가 출력됩니다.

나는 생각이 문제를 해결합니다.

import re

pattern = re.compile("[a-zA-Z0-9!@#$&()\\-`.+,/\"]+")

multilinestring = '''हिरासत में ली गई महिला 36 वर्षीय नूर सजात कमरुज़्ज़मा थीं
British High Commissioner Greets        
पत्ता आंबेडकर चौक, निमशीरगाव,
निमिशरगाव, निरमशिरगाव, कोल्हापूर, NIMSHIRGAON, Nimshirgaon,
Address: ambedkar chowk,
महाराष्ट्र, 416101
Nimshirgaon, Kolhapur, Maharashtra,
416101
1832
1947'''

split_list = multilinestring.splitlines()
output_list = []
for word in split_list:
    if pattern.match(word):
        output_list.append(word)

print(*output_list, sep = "\n")

마지막 줄은 인쇄의 각 문자열에는 목록 별도의 줄에. 출력은 다음과 같습니다.

British High Commissioner Greets        
Address: ambedkar chowk,
Nimshirgaon, Kolhapur, Maharashtra,
416101
1832
1947
2021-11-22 12:00:15

다른 언어로

이 페이지는 다른 언어로되어 있습니다

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Česk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................