PDF 转 JSON
使用 PDF 转 JSON 工具,您可以将 PDF 文件转换为 JSON 文件。以下示例展示了如何使用 Java、Python 语言上传测试 PDF 文件并将其转换为 JSON 文件。
java
// Create a client
CPDFClient client = new CPDFClient(publicKey,secretKey);
// Create a task
// Create an example of a PDF TO Editable task
CPDFCreateTaskResult result = client.createTask(CPDFConversionEnum.PDF_TO_JSON);
// Get a task id
String taskId = result.getTaskId();
// Upload files
client.uploadFile(new File("test.pdf"), taskId);
// Execute Task
client.executeTask(taskId);
// Query TaskInfo
CPDFTaskInfoResult taskInfo = client.getTaskInfo(taskId);
Python
# Create a client
client = CPDFClient(public_key, secret_key)
# Create a task
# Create an example of a Image to Json task
create_task_result = client.create_task(CPDFConversionEnum.PDF_TO_JSON)
# Get a task id
task_id = create_task_result.task_id
# File handling parameter settings
file_parameter = PDFToJSONParameter()
file_parameter.is_allow_ocr = file_parameter.ALLOW_OCR
file_parameter.type = file_parameter.TYPE_TEXT
# Upload files
client.upload_file('test.pdf', task_id, file_parameter)
# Execute task
client.execute_task(task_id)
# Query TaskInfo
task_info = client.get_task_info(task_id)
所需参数
type
:提取内容的选项(0:文本,1:表格)默认0。
isAllowOcr
:是否允许开启OCR(1:是,0:否),默认0。
isOnlyAiTable
:是否开启AI识别表格(1:是,0:否)默认0。
结果:
文件类型 | 描述 |
---|---|
.json | 完成后的JSON文件。 |