docs
UAEN
Docs/Підтримувані типи файлів

Підтримувані типи файлів

Rekognita підтримує широкий спектр форматів документів. Кожен формат обробляється відповідним парсером для максимальної точності.

Документи

ФорматРозширенняПримітки
PDF.pdfЦифрові та скановані (OCR). Підтримка захищених PDF
Microsoft Word.docx, .docПовна підтримка таблиць, зображень, стилів
Microsoft Excel.xlsx, .xlsКонвертація таблиць зі збереженням структури
Microsoft PowerPoint.pptx, .pptВитягування тексту та зображень зі слайдів
OpenDocument.odt, .odsLibreOffice / OpenOffice документи
Rich Text.rtfБазова підтримка форматування
Plain Text.txtUTF-8, різні кодування

Зображення

ФорматРозширенняМакс. розмір
JPEG.jpg, .jpeg50 MB
PNG.png50 MB
TIFF.tiff, .tif100 MB (мульти-сторінковий)
WebP.webp50 MB
BMP.bmp50 MB
HEIC.heic50 MB

Підтримувані мови OCR

Rekognita підтримує OCR для 25+ мов, включаючи:

  • Латиниця: English, Deutsch, Français, Español, Italiano, Português, Nederlands, Polski
  • Кирилиця: Українська, Русский, Беларуская, Български, Српски
  • CJK: 中文 (Chinese), 日本語 (Japanese), 한국어 (Korean)
  • Арабська: العربية (Arabic), فارسی (Persian)
  • Інші: हिन्दी (Hindi), ภาษาไทย (Thai), Tiếng Việt (Vietnamese)

Рекомендації

  • Для скановних документів рекомендується роздільна здатність ≥ 300 DPI
  • PDF з вбудованим текстом обробляються швидше, ніж скановані
  • Для Excel/PowerPoint рекомендуємо конвертувати в PDF перед завантаженням для найкращого результату