Universal AI: OCR Features

Extract text and structured data from documents using the Universal AI endpoint.

Available OCR Features

Subfeature	Model String Pattern	Description
OCR	`ocr/financial_parser/provider`	Extract financial information from images/PDFs
Identity Parser	`ocr/identity_parser/provider`	Parse ID documents and passports
Financial Parser	`ocr/financial_parser/provider`	Extract structured financial & invoice data
Resume Parser	`ocr/resume_parser/provider`	Parse CV and resume data

Text Extraction (OCR)

Extract text from documents:

import requests

# Step 1: Upload the file
upload_url = "https://api.edenai.run/v3/upload"
upload_headers = {"Authorization": "Bearer YOUR_API_KEY"}
    
files = {"file": open("document.pdf", "rb")}
upload_response = requests.post(upload_url, headers=upload_headers, files=files)
file_id = upload_response.json()["file_id"]

# Step 2: Process with OCR
url = "https://api.edenai.run/v3/universal-ai"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

payload = {
    "model": "ocr/financial_parser/google",
    "input": {
        "file": file_id,
        "language": "en"
    }
}

response = requests.post(url, headers=headers, json=payload)
result = response.json()

print(result["output"]["extracted_data"])

Identity Document Parsing

Extract structured data from IDs and passports:

import requests

url = "https://api.edenai.run/v3/universal-ai"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}
upload_url = "https://api.edenai.run/v3/upload"
upload_headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Upload ID document
files = {"file": open("passport.jpg", "rb")}
upload_response = requests.post(upload_url, headers=upload_headers, files=files)
file_id = upload_response.json()["file_id"]

# Parse identity document
payload = {
    "model": "ocr/identity_parser/amazon",
    "input": {
        "file": file_id
    }
}

response = requests.post(url, headers=headers, json=payload)
result = response.json()

identity = result["output"]
print(f"Name: {identity.get('given_names')} {identity.get('last_name')}")
print(f"Document Number: {identity.get('document_id')}")
print(f"Expiry Date: {identity.get('expire_date')}")

Invoice Parsing

Extract structured invoice data:

import requests

url = "https://api.edenai.run/v3/universal-ai"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}
upload_url = "https://api.edenai.run/v3/upload"
upload_headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Upload invoice
files = {"file": open("invoice.pdf", "rb")}
upload_response = requests.post(upload_url, headers=upload_headers, files=files)
file_id = upload_response.json()["file_id"]

# Parse invoice
payload = {
    "model": "ocr/financial_parser/microsoft",
    "input": {
        "file": file_id,
        "language": "en"
    }
}

response = requests.post(url, headers=headers, json=payload)
result = response.json()

print(result["output"]["extracted_data"])

Using File URLs

Instead of uploading, you can provide file URLs:

import requests

url = "https://api.edenai.run/v3/universal-ai"
headers = {
    "Authorization": "Bearer YOUR_API_KEY",
    "Content-Type": "application/json"
}

payload = {
    "model": "ocr/financial_parser/affinda",
    "input": {
        "file": "https://slicedinvoices.com/pdf/wordpress-pdf-invoice-plugin-sample.pdf",
        "language": "en"
    }
}

response = requests.post(url, headers=headers, json=payload)
result = response.json()
print(result["output"]["extracted_data"])

Next Steps

Upload Files - Learn about persistent file storage
Image Features - Image processing
Text Features - Text analysis

V3 Documentation

Ocr features

Universal AI: OCR Features

Available OCR Features

Text Extraction (OCR)

Identity Document Parsing

Invoice Parsing

Using File URLs

Next Steps

V3 Documentation

​Universal AI: OCR Features

​Available OCR Features

​Text Extraction (OCR)

​Identity Document Parsing

​Invoice Parsing

​Using File URLs

​Next Steps

Universal AI: OCR Features

Available OCR Features

Text Extraction (OCR)

Identity Document Parsing

Invoice Parsing

Using File URLs

Next Steps