Skip to content

PDF 转 JSON

使用 PDF 转 JSON 工具,您可以将 PDF 文件转换为 JSON 文件。以下示例展示了如何使用 Java、Python 语言上传测试 PDF 文件并将其转换为 JSON 文件。

java
// Create a client
CPDFClient client = new CPDFClient(publicKey,secretKey);

// Create a task
// Create an example of a PDF TO Editable task
CPDFCreateTaskResult result = client.createTask(CPDFConversionEnum.PDF_TO_JSON);

// Get a task id
String taskId = result.getTaskId();

// Upload files
client.uploadFile(new File("test.pdf"), taskId);

// Execute Task
client.executeTask(taskId);

// Query TaskInfo
CPDFTaskInfoResult taskInfo = client.getTaskInfo(taskId);
Python
# Create a client
client = CPDFClient(public_key, secret_key)

# Create a task
# Create an example of a Image to Json task
create_task_result = client.create_task(CPDFConversionEnum.PDF_TO_JSON)

# Get a task id
task_id = create_task_result.task_id

# File handling parameter settings
file_parameter = PDFToJSONParameter()
file_parameter.is_allow_ocr = file_parameter.ALLOW_OCR
file_parameter.type = file_parameter.TYPE_TEXT

# Upload files
client.upload_file('test.pdf', task_id, file_parameter)

# Execute task
client.execute_task(task_id)

# Query TaskInfo
task_info = client.get_task_info(task_id)

所需参数

type:提取内容的选项(0:文本,1:表格)默认0。

isAllowOcr:是否允许开启OCR(1:是,0:否),默认0。

isOnlyAiTable:是否开启AI识别表格(1:是,0:否)默认0。

结果:

文件类型描述
.json完成后的JSON文件。