tanakahdaのプログラマ手帳

プログラミングとかソフトウェア開発とかの備忘録

PDFのテキストを読み込みとOCRでPDFを読み込むの使い分け@UiPath

[PDFのテキストを読み込み(Read PDF Text)]は、PDFドキュメントに文字情報が含まれている場合に、ファイルの内容を読み取り、個別に抽出できる。

[OCRでPDFを読み込む(Read PDF With OCR)]は、PDFドキュメントが、画像であるか、スキャンされているが、署名または手書きのフィールドが含まれている場合に、OCRエンジンを利用して抽出する場合に使う。

両方のアクティビティは、UiPath.PDF.Activitiesパッケージにある。

docs.uipath.com