I 추출하려고 테이블에서 Pdf 파일을 적절한하지 않은 형식으로 나는 생각한다. 테이블에서 이 Pdf 테이블 형식의 그러나로 묶지 않으로 제대로 verical 테두리입니다. 나는 첨부하는 샘플 pdf 및 출력을 모두와 함께 라이브러리입니다. 을 사용하여 북한은 백을 위한 테이블 탐지,빈 datadrame 은 반환되는 모든 페이지에서 pdf 파일.
0 을 입력하는 단일 페이지 1 에 대한 모든 2 개,특정 페이지:2 페이지 번호를 입력합:25 테이블 페이지에서 찾아에 의해 북한은 백.
고 내가 사용하는 경우 카멜롯가 동일한 응답이 없을 때 사용 flovor='lattice'
0 을 입력하는 단일 페이지 1 위해 모든 페이지 2 페이지 테이블에서 감지에 의해 북한은 백,3 위한 특정 페이지:3 0 을 입력하는 격자 또는 1 스트림:0 페이지 번호를 입력합:25 테이블 페이지에서 찾아에 의해 카멜롯.
고 사용할 때 flovor='stream'
을 데이터 프레임 있는 각 라인을 읽을 줄과 탭으로 구분된 데이터지만,포함 할 것이 일반 텍스트에서뿐만 아니라는 것 데이터 프레임.
0 을 입력하는 단일 페이지 1 위해 모든 페이지 2 페이지 테이블에서 감지에 의해 북한은 백,3 위한 특정 페이지:3 0 을 입력하는 격자 또는 1 트:1 페이지 번호를 입력합:25
나는 그저 필요한 효율적인 방법을 감지하는 테이블과추출물이 동일한 경우 데이터 수직을 둘러싸 테이블 라인은 존재하지 않습니다. 모두 북한은 백 및 카멜롯 라이브러리는 작동하는 경우 테이블이에서 적절한 형식으로 묶여 수직 및 수평 라인입니다.