请问OCR中表格识别有没有直接转成这种json格式的示例呢,指定表头对应的key生成?[阿里云OCR]

请问OCR中表格识别有没有直接转成这种json格式的示例呢,指定表头对应的key生成{ “tableContent”: [ { “nighttime”: “52.8”, “site”: “厂界东”, “daytimeIsStandard”: “是”, “nighttimeStandardVal”: “55”, “daytime”: “58.6”, “daytimeStandardVal”: “65”, “nighttimeIsStandard”: “是” }, { “nighttime”: “53.6”, “site”: “厂界南”, “daytimeIsStandard”: “是”, “nighttimeStandardVal”: “55”, “daytime”: “59.0”, “daytimeStandardVal”: “65”, “nighttimeIsStandard”: “是” } ], “tail”: “噪声检测结果 单位:等效声级Leq[dB(A) 】”, “title”: “检测结果执行《工业企业厂界环境噪声排放标准》(GB12348-2008)表1三类标准限值” }?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
2 条回复 A 作者 M 管理员
  1. 阿里云OCR中的表格识别功能,可以将识别结果输出为JSON格式,但是需要对返回结果进行解析和处理才能得到您想要的格式。具体可以按照以下步骤进行操作:

    1. 调用表格识别接口,获取返回结果。
    2. 对返回结果进行解析和处理,将表格数据提取出来,并按照您需要的格式进行组织。
    3. 将处理后的数据输出为JSON格式。

    以下是一个示例代码,可以将阿里云OCR返回的表格识别结果转换成您需要的JSON格式:

    import json# 假设阿里云OCR返回的表格识别结果为table_resulttable_result = {    "result": {        "tables": [            {                "body": [                    ["52.8", "厂界东", "是", "55", "58.6", "65", "是"],                    ["53.6", "厂界南", "是", "55", "59.0", "65", "是"]                ],                "head": ["nighttime", "site", "daytimeIsStandard", "nighttimeStandardVal", "daytime", "daytimeStandardVal", "nighttimeIsStandard"],                "tail": ["噪声检测结果 单位:等效声级Leq[dB(A) 】"],                "title": ["检测结果执行《工业企业厂界环境噪声排放标准》(GB12348-2008)表1三类标准限值"]            }        ]    }}# 解析表格数据table_data = table_result["result"]["tables"][0]table_head = table_data["head"]table_body = table_data["body"]table_tail = table_data["tail"]table_title = table_data["title"]# 组织JSON格式数据json_data = {    "tableContent": [],    "tail": table_tail[0],    "title": table_title[0]}for row in table_body:    row_dict = {}    for i in range(len(table_head)):        row_dict[table_head[i]] = row[i]    json_data["tableContent"].append(row_dict)# 输出JSON格式数据print(json.dumps(json_data, ensure_ascii=False))

    以上代码将阿里云OCR返回的表格识别结果解析成了一个JSON格式的数据,其中包含了您需要的表头对应的key和表格数据。

  2. 不行 。需要自己根据识别的结果转成你需要的这种格式 ,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”