文档内容抽取
标签:文件
请求说明
| 字段 | 值 |
|---|---|
请求地址 | https://openapi.wps.cn/v7/drives/{drive_id}/files/{file_id}/content |
HTTP 方法 | GET |
接口描述 | 文档内容抽取 |
签名方式 | KSO-1 |
限频策略 | 无 |
权限要求 | 查询和管理文件(应用授权) kso.file.readwrite查询文件(应用授权) kso.file.read查询和管理文件(用户授权) kso.file.readwrite查询文件(用户授权) kso.file.read |
路径参数 (Path)
| 属性名 | 类型 | 是否必填 | 描述 | 可选值 |
|---|---|---|---|---|
drive_id | string | 是 | - | |
file_id | string | 是 | - |
查询参数 (Query)
| 属性名 | 类型 | 是否必填 | 描述 | 可选值 |
|---|---|---|---|---|
format | string | 否 | 文档内容目标格式 | kdc, plain, markdown |
include_elements | array | 否 | 指定抽取元素。默认元素为para,且一定会被导出;其余附加元素根据请求参数选择性导出。 | para, table, component, textbox, all |
响应体(Response)
HTTP状态码: 200
响应体格式: application/json
没有可用的数据
响应体示例
json
{
"data": {
"doc": {
"comments": [
{
"blocks": [
{
"bounding_box": {
"x1": 0,
"x2": 0,
"y1": 0,
"y2": 0
},
"component": {
"media_id": "string",
"type": "image"
},
"id": "string",
"index": 0,
"page_index": 0,
"para": {
"prop": {
"alignment": "left",
"def_run_prop": {
"bold": true,
"color": "string",
"font_ascii": "string",
"font_east_asia": "string",
"size": 0
},
"list_string": "string",
"outline_level": 0
},
"runs": [
{
"id": "string",
"prop": {
"bold": true,
"color": "string",
"font_ascii": "string",
"font_east_asia": "string",
"size": 0
},
"text": "string"
}
]
},
"rotate": 0,
"table": {
"rows": [
{
"cells": [
{
"blocks": [
{}
],
"col_span": 0,
"id": "string",
"row_span": 0
}
]
}
]
},
"tags": [
{
"name": "string",
"value": "string"
}
],
"textbox": {
"blocks": [
{}
]
},
"type": "para"
}
],
"references": [
{
"id": "string",
"type": "run"
}
]
}
],
"medias": [
{
"data": "string",
"id": "string",
"url": "string"
}
],
"prop": {
"page_count": 0,
"page_props": [
{
"dpi": 0,
"offset_angle": 0,
"rotate": 0,
"size": {
"height": 0,
"width": 0
}
}
]
},
"tree": {
"blocks": [
{}
],
"children": [
{}
],
"outline_level": 0
}
},
"dst_format": "kdc",
"markdown": "string",
"plain": "string",
"src_format": "docx",
"version": "string"
},
"code": 0,
"msg": "string"
}