Фото чека = проведено: як AI обробляє документи

Ви фотографуєте чек, надсилаєте його — і за кілька секунд отримуєте готовий бухгалтерський запис з усіма даними. Звучить як магія, але насправді за цим стоїть витончена комбінація технологій, які розвивалися десятиліттями. OCR (оптичне розпізнавання символів), машинне навчання, комп'ютерний зір та обробка природної мови разом утворюють систему, здатну «прочитати» паперовий документ і перетворити його на структуровані дані.
У цій статті ми зазирнемо під капот усього процесу. Пояснимо, як саме AI «бачить» і «читає» ваш чек, які дані з нього витягує, якої точності результатів варто очікувати і на що звернути увагу. Все технічно точно, але зрозуміло — жодних академічних фраз, лише практичне пояснення того, що відбувається від моменту натискання кнопки фотоапарата до збереження запису у вашому обліку.
Крок 1: Зйомка — що впливає на якість обробки
Все починається з фотографії. І хоча сучасні AI-системи впораються навіть із відносно неякісними знімками, дотримання певних правил допомагає досягти кращих результатів.
Що AI повинен бачити
На чеку або рахунку-фактурі з бухгалтерської точки зору важливі такі дані:
- Постачальник (назва компанії, ідентифікаційні номери)
- Дата виставлення та, за потреби, дата виникнення податкового зобов'язання
- Загальна сума
- Ставка та сума ПДВ (якщо ви є платником ПДВ)
- Податкова база
- Опис товару або послуги (для правильної категоризації)
- Номер документа (для можливої перевірки)
Поради для кращих фото документів
- Прямий погляд зверху — фотографуйте документ перпендикулярно, не під кутом
- Достатнє освітлення — найкраще денне світло, уникайте різких тіней
- Весь документ у кадрі — переконайтеся, що всі краї видно
- Стійкі руки — тримайте телефон двома руками або спирайтесь об стіл
- Розправлений документ — якщо чек зім'ятий, розправте його перед зйомкою
- Обережно з відблисками — глянцевий термопапір може відбивати світло
Навіть якщо ви не виконаєте всіх умов, сучасний AI впорається з більшістю ситуацій. Але чим кращий вхідний матеріал, тим швидший і точніший результат.
Що відбувається в телефоні перед надсиланням
Ще до того як ви надішлете фото, ваш телефон виконує базову оптимізацію: автофокус, корекцію експозиції та стиснення зображення. WhatsApp потім злегка стискає фото для швидшого надсилання, але зберігає достатню якість для читання тексту. Роздільна здатність типового фото WhatsApp (приблизно 1600 x 1200 пікселів) більш ніж достатня для OCR-обробки.
Крок 2: Попередня обробка зображення — підготовка до розпізнавання
Коли AI-система отримує ваше зображення, вона не починає відразу «читати» текст. Спочатку виконується серія корекцій, які разюче покращують точність розпізнавання.
Геометрична корекція
Якщо ви знімали під кутом, система виявляє перспективне викривлення та «вирівнює» зображення. Уявіть, що ви фотографуєте чек, який лежить на столі, під невеликим кутом — AI здатний розрахувати, як би виглядав документ при погляді прямо зверху, і відповідно трансформує зображення.
Корекція освітлення
Нерівномірне освітлення (наприклад, тінь від руки) може зробити частину тексту темною, а частину — світлою. Система виконує адаптивне вирівнювання яскравості, щоб весь документ мав рівномірний контраст.
Перетворення на чорно-біле зображення
Для цілей OCR колірна інформація зайва — важливий лише контраст між текстом і фоном. Система перетворює зображення в чорно-білий (бінарний) формат, де текст чорний на білому тлі. Цей процес називається бінаризацією, і для нього існують витончені алгоритми, що адаптуються до різних умов зйомки.
Визначення орієнтації
Якщо ви сфотографували документ догори ногами або повернутим на 90 градусів, система автоматично визначає правильну орієнтацію тексту й повертає зображення.
Усунення шуму
Текстура паперу, дрібні плями, фон столу — все це «шум», який AI повинен відфільтрувати, щоб зосередитися лише на релевантному тексті та цифрах.
Чому попередня обробка така важлива
Без попередньої обробки точність OCR для звичайних фотографій з мобільного телефону становила б лише 70–80 %. Завдяки автоматичним корекціям точність підвищується до 95–99 %+. Різниця між 80% і 99% точності означає для чека з 10 полями різницю між 2 помилками та практично жодною.
Крок 3: OCR — розпізнавання тексту із зображення
Тепер настає ядро всього процесу: оптичне розпізнавання символів (OCR). Простіше кажучи, система «читає» текст із зображення. Але сучасний OCR набагато складніший, ніж більшість людей уявляє.
Як OCR «бачить» літери
Традиційні OCR-системи порівнювали форми на зображенні з попередньо збереженою базою шрифтів. Сучасні системи, засновані на глибокому навчанні (deep learning), працюють інакше — вони навчилися розпізнавати символи на сотнях мільйонів прикладів, подібно до того, як дитина вчиться читати.
Процес відбувається в кілька етапів:
Виявлення текстових областей — Нейронна мережа спочатку визначає, де на зображенні знаходиться текст. Вона відрізняє текст від логотипів, штрих-кодів, зображень і декоративних елементів.
Сегментація рядків — Текст розбивається на окремі рядки. На чеках це зазвичай просто (рядки чітко розділені), на рахунках-фактурах із таблицями — складніше.
Розпізнавання символів — Кожен рядок аналізується, а окремі символи (літери, цифри, розділові знаки) ідентифікуються. Сучасні системи обробляють цілі рядки одночасно, що покращує точність — контекст сусідніх символів допомагає розпізнати навіть менш читабельні знаки.
Мовна корекція — Розпізнаний текст порівнюється з мовною моделлю. Якщо OCR «прочитав» слово з помилкою, мовна модель пропонує виправлення. Цей етап постобробки суттєво знижує рівень помилок.
Точність сучасного OCR у цифрах
| Тип документа | Точність на рівні символів | Точність на рівні полів | |--------------|---------------------------|------------------------| | Друкований рахунок-фактура (якість PDF) | 99,5 %+ | 99 %+ | | Друкований чек (термопапір, хороша якість) | 98–99 % | 95–99 % | | Друкований чек (вицвілий, зім'ятий) | 93–97 % | 85–95 % | | Рукописний документ | 85–92 % | 70–85 % | | Документ під кутом (корекція увімкнена) | 96–99 % | 93–98 % | | Погано освітлений документ | 90–96 % | 82–93 % |
Точність на рівні символів = відсоток правильно розпізнаних окремих символів. Точність на рівні полів = відсоток полів (дата, сума, постачальник), де весь запис розпізнано правильно.
Для порівняння: ручне введення даних людиною має середній рівень помилок 1–4 % на рівні полів. При монотонному введенні (наприклад, 50 чеків підряд) рівень помилок зростає через втому.
Крок 4: Інтелектуальне вилучення даних — від тексту до структурованих даних
OCR дає вам «сирий» текст. Але текст «Разом: 1 234,50 Kč» для комп'ютера досі є лише рядком символів. Наступний крок — зрозуміти, що цей текст означає, тобто присвоїти правильні значення правильним полям.
Як AI розуміє структуру документа
Кожен магазин, ресторан чи постачальник використовує інший формат чека. Albert має інше розташування, ніж Lidl, заправка — інше, ніж аптека. Проте AI здатний витягти з усіх них однакову інформацію. Як?
Аналіз розташування — AI аналізує просторове розміщення тексту на документі. Він розпізнає заголовок (інформація про продавця), тіло (перелік позицій) і нижній колонтитул (підсумки, ПДВ, оплата).
Контекстне розпізнавання — Система шукає ключові слова і шаблони. «Разом», «До сплати» сигналізують про загальну суму. «ПДВ», «21 %», «7 %» сигналізують про податкову інформацію. «Дата», пробіл і формат ДД.ММ.РРРР сигналізують про дату виставлення.
Реляційне відображення — AI розуміє зв'язки між даними. Число після слова «Разом» — це загальна сума. Відсоток після «ПДВ» — ставка податку. Сума в рядку «ПДВ 21 %» — це величина податку за цією ставкою.
Конкретний приклад вилучення даних
Уявіть такий чек з магазину електроніки:
DATART International, a.s.
IČO: 64828824
DIČ: CZ64828824
Provozovna: OC Chodov, Praha 4
Datum: 15.02.2026 Čas: 14:23
Pokladna: 3 Účtenka č.: 2026-00847
USB-C kabel 2m 249,00
Myš bezdrátová 599,00
Podložka pod myš 149,00
----------
Mezisoučet: 997,00
DPH 21%: 172,89
Základ 21%: 824,11
CELKEM: 997,00
Platba kartou: 997,00
Karta: **** **** **** 4521
AI витягує з цього тексту:
📋
- Постачальник: DATART International, a.s. (розпізнано із заголовка)
- IČO: 64828824 (розпізнано шаблон 8 цифр після «IČO:»)
- DIČ: CZ64828824 (розпізнано шаблон CZ + цифри після «DIČ:»)
- Дата: 15.02.2026 (розпізнано формат дати)
- Номер документа: 2026-00847 (розпізнано з рядка «Účtenka č.:»)
- Позиції: USB-C кабель (249 Kč), Бездротова миша (599 Kč), Килимок для миші (149 Kč)
- Загальна сума: 997,00 Kč (розпізнано з рядка «CELKEM:»)
- Ставка ПДВ: 21 % (розпізнано з рядка «DPH 21%:»)
- Сума ПДВ: 172,89 Kč
- Податкова база: 824,11 Kč
- Спосіб оплати: Карткою (розпізнано з тексту «Platba kartou»)
Валідація даних — перевірка правильності
Після вилучення AI виконує автоматичні перевірки:
- Математична перевірка: База (824,11) + ПДВ (172,89) = Разом (997,00)? Так, збігається.
- Перевірка ставки ПДВ: 21 % від 824,11 = 173,06? Невелика різниця через округлення — у межах допуску.
- Перевірка IČO: 64828824 — відповідає формату (8 цифр), можна перевірити в реєстрі ARES.
- Перевірка дати: 15.02.2026 — дійсна дата, не в майбутньому, не надто стара.
- Перевірка DIČ: CZ64828824 — відповідає формату, відповідає IČO.
Якщо якась перевірка не проходить, система повідомить вас і попросить виконати ручну перевірку.
Крок 5: Інтелектуальна категоризація — куди належить документ
Самого лише вилучення даних недостатньо. Для правильного податкового обліку кожен документ повинен бути віднесений до правильної категорії. І саме тут AI справді демонструє свою перевагу над простим OCR.
Як AI обирає категорію
Категоризація відбувається на основі кількох сигналів одночасно:
Постачальник — Якщо постачальник — це заправна станція, з великою ймовірністю йдеться про пальне. Магазини електроніки сигналізують про IT-обладнання. Оптові магазини — про гуртові закупівлі.
Позиції в документі — Розпізнані позиції («USB-кабель», «миша», «килимок») дозволяють точніше категоризувати: IT-обладнання / канцелярські товари.
Сума та контекст — Невелика сума у постачальника їжі (100–300 Kč) вказує на харчування. Велика сума у того ж постачальника (3 000+ Kč) може бути корпоративним кейтерингом.
Історія користувача — Якщо ви раніше відносили документи від того ж постачальника до певної категорії, AI враховує цю перевагу.
Час та частота — Чек із заправки кожного понеділка вранці — швидше за все, регулярна заправка службового автомобіля.
📊
| Сигнал у документі | Запропонована категорія | Надійність | |-------------------|------------------------|-----------| | Постачальник: заправна станція, продукт: бензин | Пальне | 99 % | | Постачальник: магазин електроніки, продукт: монітор 27" | IT-обладнання | 97 % | | Постачальник: оптовий магазин, позиції: офісний папір | Канцелярські товари | 95 % | | Постачальник: ресторан | Харчування / Представницькі витрати | 85 % (потребує уточнення) | | Постачальник: невідомий, позиції: невизначені | Інші витрати | 60 % (потребує ручного присвоєння) |
Навчання на ваших виправленнях
Ключова особливість сучасних AI-систем — здатність навчатися. Коли ви виправляєте категорію — наприклад, переносите документ із ресторану з «Харчування» на «Представницькі витрати, обід з клієнтом» — система запам'ятовує це виправлення. Наступного разу при схожому документі вона запропонує правильну категорію з більшою впевненістю.
Цей процес називається «навчанням зі зворотним зв'язком» (reinforcement learning from human feedback) і є причиною того, чому AI-помічник працює тим краще, чим довше ви його використовуєте.
Крок 6: Збереження та архівування
Останній крок — збереження структурованих даних та оригінального знімка.
Що зберігається
- Структуровані дані: Усі витягнуті поля у форматі бази даних (дата, сума, постачальник, категорія, ПДВ...)
- Оригінальна фотографія: Архівна копія у повному розрізненні як доказ існування документа
- Метадані: Час обробки, версія AI-моделі, оцінка надійності для окремих полів
- Історія змін: Якщо ви щось виправляли, зберігається й історія правок
Законодавчі вимоги до архівування
Як довго потрібно зберігати документи
Згідно з чеським законодавством про бухгалтерський облік та податковим кодексом:
- Податкові документи (рахунки-фактури, чеки): щонайменше 10 років від кінця податкового періоду, в якому виникло зобов'язання задекларувати ПДВ
- Облікові записи в податковому обліку: щонайменше 5 років (загальний строк архівування для податкових зобов'язань — 3 роки, відраховується від кінця року подання; на практиці — мінімум 5 років)
- Матеріали з оплати праці: до 30 років (для цілей пенсійного страхування)
Цифрове архівування повністю відповідає законодавству, якщо забезпечено читабельність, достовірність і довговічність запису. Якісна фотографія із сучасного смартфона відповідає цим вимогам.
Особливі випадки: з чим AI справляється і де виникають труднощі
Чеки на термопапері
Термопапір (звичайні чеки з магазинів і ресторанів) з часом вицвітає. AI може обробити навіть частково вицвілий чек, але чим раніше ви його сфотографуєте, тим кращий результат. У дуже старих і вицвілих чеків точність може бути нижчою.
Рекомендація: Фотографуйте чеки якомога швидше після отримання — в ідеалі одразу біля каси.
Багатомовні документи
Якщо ви робите покупки за кордоном або у іноземних постачальників, AI-системи справляються з розпізнаванням тексту більшістю європейських мов. Сучасні OCR-моделі навчені на десятках мов одночасно.
Документи з кількома ставками ПДВ
Деякі покупки містять позиції з різними ставками ПДВ (наприклад, продукти зі зниженою ставкою та непродовольчі товари з базовою ставкою). AI здатний розпізнати та правильно розрізнити окремі ставки.
Кредит-ноти та коригувальні документи
AI розпізнає, що йдеться про кредит-ноту (від'ємна сума, текст «кредит-нота» або «коригувальний документ»), і правильно зареєструє її як зменшення витрат, а не як новий видаток.
PDF-рахунки-фактури
Електронні рахунки-фактури у форматі PDF парадоксально простіші для AI, ніж фотографії паперових документів — текст безпосередньо машиночитаний, і OCR у строгому сенсі не потрібен. Точність вилучення даних із PDF сягає майже 100 %.
PDF проти фото: порівняння точності
| Джерело документа | Точність вилучення | Швидкість обробки | |------------------|-------------------|------------------| | PDF-рахунок-фактура (структурований) | 99,5 %+ | Менше 2 секунд | | PDF-рахунок-фактура (скановане зображення) | 97–99 % | 3–5 секунд | | Фото документа (хороша якість) | 95–99 % | 3–8 секунд | | Фото документа (нижча якість) | 85–95 % | 5–15 секунд |
PDF-рахунки-фактури обробляються найшвидше й найточніше, оскільки текст не потрібно розпізнавати із зображення.
Як AI постійно вдосконалюється
Одна з найбільших переваг AI-обробки документів — безперервне покращення. Кожен оброблений документ сприяє тому, щоб система ставала точнішою.
Глобальне навчання
Коли тисячі користувачів надсилають документи від одного й того ж торгового ланцюжка, AI навчається розпізнавати специфічний формат чеків цього ланцюжка. Новий користувач одразу отримує перевагу від того, що система вже знає цей формат.
Персоналізоване навчання
Ваші виправлення та підтвердження допомагають AI краще зрозуміти ваші конкретні потреби. Якщо ви IT-консультант і завжди категоризуєте чеки з ресторанів як «Представницькі витрати — обід з клієнтом», система адаптується до вашого профілю.
Оновлення моделей
Розробники регулярно навчають AI-моделі на нових даних, додають підтримку нових форматів документів і підвищують точність на основі анонімізованих відгуків користувачів.
Практичний тест: обробка 5 різних документів
Щоб стаття не була суто теоретичною, розглянемо типовий набір документів, який ОСВČ може зібрати за день:
| Документ | Тип | Очікуваний результат AI | Потенційна проблема | |---------|-----|------------------------|---------------------| | Чек із заправки за пальне | Термопапір, друкований | Пальне, 1 580 Kč, ПДВ 21 % | Жодної — стандартний формат | | Рахунок-фактура від хостингу (PDF) | Електронний PDF | IT-послуги, 290 Kč/міс., ПДВ 21 % | Жодної — PDF є ідеальним вхідним матеріалом | | Чек із канцелярського магазину | Термопапір, невеликий | Канцелярські товари, 347 Kč | Малий формат, можливе обрізання | | Рахунок із ресторану (обід з клієнтом) | Друкований на звичайному папері | Харчування/Представницькі витрати, 890 Kč | Потребує уточнення категорії | | Рахунок-фактура від дизайнера за логотип (рукописний) | Напіврукописний, нестандартний | Послуги/Маркетинг, 5 000 Kč | Рукописний текст — нижча точність |
З п'яти документів 3–4, швидше за все, будуть оброблені повністю автоматично без будь-якого втручання. Для 1–2 вам потрібно буде підтвердити або уточнити категорію. На практиці це справа кількох секунд, а не хвилин.
Часті запитання
Наскільки точним є розпізнавання чеків? У стандартних друкованих чеків із торгових мереж та заправок точність становить 97–99 %. Сучасні AI-моделі повністю підтримують специфіку різних мов, форматів дати та числових форматів.
Чи розпізнає AI чек із задрукованим папером? Частково. Якщо задрук незначний і ключові дані (сума, дата) читабельні, AI впорається. При сильно задрукованих або пошкоджених документах точність може бути нижчою — у такому разі система попросить заповнити дані вручну.
Що якщо чек містить особисті покупки разом із діловими? AI витягує всі позиції. Потім ви можете позначити, які позиції є діловими, а які — особистими. Система відокремить бухгалтерськи релевантну частину.
Чи працює розпізнавання для іноземних документів? Так, сучасні OCR-системи підтримують десятки мов і валют. Документ німецькою, англійською або словацькою мовою буде оброблено так само надійно, як і будь-який інший.
Що станеться, якщо AI щось розпізнає неправильно? Ви отримаєте підсумок розпізнаних даних для підтвердження. Якщо якийсь запис неправильний, ви просто його виправите. AI запам
Nechcete ztrácet čas s papírováním?
Vyzkoušejte DokladBot - účetnictví přes WhatsApp. První týden zdarma.
Схожі статті

5 речей, які AI бухгалтерський асистент вирішить замість вас
AI бухгалтерський асистент здатен взяти на себе напрочуд велику частину вашої адміністративної роботи. Дізнайтеся про 5 конкретних речей, які він вирішить замість вас — від категоризації чеків до розрахунку податку на доходи.

AI бухгалтерський асистент: як він працює і що вміє на практиці
AI бухгалтерія для OSVČ змінює правила гри. Дізнайтеся, як штучний інтелект обробляє документи, стежить за термінами та економить час і гроші підприємців у 2026 році.

AI чатбот vs. бухгалтер: коли достатньо робота
Чатбот для бухгалтерії чудово справляється із щоденним обліком документів, але іноді потрібен живий експерт. Коли AI достатньо, а коли ні? Чесне порівняння.