나는 구문 분석하려고 하는 일부 사이트을 사용하는 로봇 탐지 알고리즘이 있습니다. 내가 사용하는 다음과 같은 크롬 옵션
chrome_options = Options()
chrome_options.add_argument("start-maximized")
chrome_options.add_experimental_option("detach", True)
chrome_options.add_experimental_option("excludeSwitches", ["enable-automation"])
chrome_options.add_experimental_option('useAutomationExtension', False)
chrome_options.add_argument("--disable-blink-features")
chrome_options.add_argument('--start-maximized')
chrome_options.add_argument('window-size=1920,1080')
chrome_options.add_argument("--disable-blink-features=AutomationControlled")
driver = webdriver.Chrome(executable_path='chromedriver.exe', chrome_options=chrome_options)
driver.get(url)
나는 또한 패치 chromedriver.exe 제 cdc_ 패턴이다.
브라우저 창을 시작하고 간 사이트는 사이트 감지 그것으로 로봇을 막을 로드 내용입니다. 그러면 브라우저에서 분리하고 수동으로 눌러"새로 고침"버튼 사이트에 내용을 로드하는 성공하였습니다. 시뮬레이션을 누르면"f5"도 작동하지 않 사이트는 여전히 차단 내용을 로드.