文字识别OCR长pdf文档识别(论文\财报等),适合开通通用文字识别中的哪种？[阿里云OCR]

文字识别OCR长pdf文档识别(论文\财报等),适合开通通用文字识别中的哪种？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

5 条回复 A 作者 M 管理员

算精通AM 2023-11-28 3:42:53 1

如果您需要识别长PDF文档，建议开通阿里云通用文字识别（OCR）中的“PDF识别”功能。PDF识别功能可以自动检测文档中的文本和表格，并进行结构化识别和提取。在处理长PDF文档时，PDF识别功能可以将多个PDF页合并成一个文档，并进行分页和排版处理，以便于后续的文本识别和分析。

在使用PDF识别功能时，建议您注意以下几点：

根据文档特点选择适当的识别模式：PDF识别功能支持多种识别模式，包括自动、表格、文本等模式。根据文档的特点和需求，选择适当的识别模式可以获得更好的识别效果。

根据文档大小和结构设置适当的参数：PDF识别功能提供了多种参数设置选项，包括页码范围、分辨率、语言、表格检测等。根据文档的大小和结构，设置适当的参数可以提高识别准确率和效率。

进行后续的文本清洗和分析：识别完成后，需要对识别结果进行后续的文本清洗和分析，以确保识别结果的准确性和可靠性。同时，需要根据具体需求和应用场景，进行相应的文本处理和分析，以获得更好的效果。

已喜欢已反对
魏红斌AM 2023-11-28 3:42:53 2

您好，可以使用文档智能。https://help.aliyun.com/document_detail/450017.html?spm=5176.smartservice_service_robot_chat_new.0.0.2c36709a1SM44D

已喜欢已反对
飞云觅宙AM 2023-11-28 3:42:53 3

阿里云全文识别高精版，是阿里云官方自研OCR文字识别产品，智能识别图片所包含的全部字段，集表格识别、旋转识别、生僻字识别等多功能为一体，提供高性价比的多场景文字识别体验。

在通用文字识别（标准版）的基础上，提供更高精度的识别服务，支持更多语种识别（丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语），并将字库从1w+扩展到2w+，能识别所有常用字和大部分生僻字。

标准版：

对图片中的文字进行检测和识别，支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等10种语言，并支持中、英、日、韩四语种的类型检测。

高精度含位置版：

在通用文字识别（高精度版）的基础上，返回文字在图片中的位置信息，方便进行版式的二次处理。

标准含位置版：

在通用文字识别（标准版）的基础上，返回文字在图片中的位置信息，方便进行版式的二次处理。

已喜欢已反对
祁符建AM 2023-11-28 3:42:53 4

通用文字识别服务支持识别多种文档类型，包括但不限于论文、财报、合同、报告、书籍等。如果您需要对长PDF文档进行文字识别，可以选择开通通用文字识别服务中的“高精度模型”或“超高精度模型”，这些模型针对长文档、表格、图片等场景进行了优化，识别精度更高。具体选择哪种模型，可以根据您的需求和预算进行选择。如果您对识别精度要求较高，可以选择“超高精度模型”，如果您对成本敏感，可以选择“高精度模型”。

已喜欢已反对
Star时光AM 2023-11-28 3:42:53 5
要识别长PDF文档中的文字，您可以考虑使用阿里云通用文字识别（General OCR）服务中的”OCR识别”功能。这个功能适用于各种类型的文字识别需求，包括论文、财报等。

通用文字识别（OCR）服务提供了多种API接口和SDK，以便您将PDF文档传输到阿里云进行文字识别。以下是一些步骤和注意事项：

开通通用文字识别服务：如果还没有开通通用文字识别服务，请登录到阿里云控制台，导航到通用文字识别（OCR）服务页面，并按照指引开通相应的服务。

获取API密钥：在阿里云控制台的”AccessKey管理”页面获取您的Access Key ID和Access Key Secret。这将用于向API进行身份验证。

选择合适的API或SDK：根据您的需求，选择适合的API或SDK来调用通用文字识别服务。您可以参考阿里云官方文档，了解如何使用API或SDK进行OCR识别操作。

提交长PDF文档进行识别：将您的长PDF文档上传到阿里云，并通过API或SDK提交识别请求。这可能需要分片处理或使用异步方式，以应对大型文档的处理。

解析识别结果：一旦识别请求完成，您将获得一个包含文本内容的识别结果。您可以根据需要进行后续处理，例如提取关键信息、导出到其他格式等。

请注意，长PDF文档的识别可能需要较长的时间和更复杂的处理步骤。您可能需要调整API参数、分片处理或使用异步方式来处理大型文档。
已喜欢已反对
三掌柜666AM 2023-11-28 3:42:53 6

楼主你好，阿里云通用文字识别可以识别多页PDF文档，但免费版只支持单页识别，需要开通付费版。对于长pdf文档的识别，推荐选择文档识别（Document Recognition）产品，因为它支持自动拆分PDF文档和识别表格等复杂结构，适用于论文、财报等格式复杂的文档识别。

已喜欢已反对

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

文字识别OCR长pdf文档识别(论文\财报等),适合开通通用文字识别中的哪种？[阿里云OCR] 暂停朗读为您朗读

文字识别OCR长pdf文档识别(论文\财报等),适合开通通用文字识别中的哪种？[阿里云OCR]