Markdown & HTML
Найпопулярніші вихідні формати. Rekognita генерує чистий, структурований Markdown або HTML зі збереженою ієрархією заголовків, таблицями та списками.
Markdown вихід
Markdown — ідеальний формат для:
- RAG-пайплайнів та LLM-контексту
- Документації та Knowledge Base
- Git-репозиторіїв і README
Приклад
# Quarterly Report Q4 2024
## Executive Summary
The company achieved record revenue of **$4.5M** in Q4...
## Financial Results
| Quarter | Revenue | Expenses | Profit |
|---------|---------|----------|--------|
| Q1 | $2.4M | $1.8M | $600K |
| Q2 | $3.1M | $2.1M | $1.0M |
| Q3 | $3.8M | $2.4M | $1.4M |
| Q4 | $4.5M | $2.7M | $1.8M |
## Key Highlights
- Net profit increased by **67%** QoQ
- New product line launched in Q2
- Customer base grew to **12,000+**
> ¹ All figures are audited and in compliance with IFRS.HTML вихід
HTML зберігає повне форматування і підходить для:
- Вбудовування в веб-додатки
- Рендерингу з CSS-стилями
- Подальшої конвертації в PDF
Приклад
<h1>Quarterly Report Q4 2024</h1>
<h2>Executive Summary</h2>
<p>The company achieved record revenue of <strong>$4.5M</strong>...</p>
<h2>Financial Results</h2>
<table>
<thead>
<tr><th>Quarter</th><th>Revenue</th><th>Profit</th></tr>
</thead>
<tbody>
<tr><td>Q1</td><td>$2.4M</td><td>$600K</td></tr>
<tr><td>Q2</td><td>$3.1M</td><td>$1.0M</td></tr>
</tbody>
</table>API запит
POST /v1/documents/convert
Content-Type: multipart/form-data
Authorization: Bearer rk_sk_your_key
file=@document.pdf
output_format=markdown # або "html"
model=rekognita-balancedSDK приклад
from rekognita import RekognitaClient
client = RekognitaClient()
# Markdown
md_result = client.documents.convert(
file="report.pdf",
output_format="markdown"
)
print(md_result.content) # Markdown текст
# HTML
html_result = client.documents.convert(
file="report.pdf",
output_format="html"
)
print(html_result.content) # HTML текстRekognita vs конкуренти
| Можливість | Rekognita | Конкуренти |
|---|---|---|
| Ієрархія заголовків | ✅ H1-H6 | ❌ Плоский текст |
| Таблиці | ✅ Повні з заголовками | ❌ Текст без структури |
| Списки | ✅ Нумеровані + вкладені | ⚠️ Простий текст |
| Зноски | ✅ Пов'язані з текстом | ❌ Не підтримується |
| Зображення | ✅ Підписи та посилання | ❌ Ігноруються |