Реєстр ТЗ України — Покращена якість
Нормалізована та покращена за якістю похідна версія відкритого набору даних МВС України про зареєстровані транспортні засоби.
info Про набір даних
Реєстр ТЗ України — Покращена якість — це похідний набір даних, створений на основі офіційного відкритого реєстру транспортних засобів МВС України. Оригінальні дані опубліковані на data.gov.ua.
Оригінальний набір має численні проблеми з якістю: змішане кодування (Windows-1251 / UTF-8), нестабільна схема (різні назви стовпців у різних місяцях), масові дублікати (~85%), відсутність нормалізації марок і моделей.
Ми виправляємо ці проблеми автоматичним data quality pipeline і публікуємо чисті, готові до аналізу знімки у форматах Parquet та CSV.
verified Покращення якості
Кодування
Автоматичне визначення кодування (Windows-1251, UTF-8, KOI8-U) та конвертація в єдине UTF-8.
Стабілізація схеми
Уніфікація назв стовпців з різних місяців в єдину стабільну схему.
Дедуплікація
Видалення ~85% дублікатів. Оригінальний набір містить повторні записи для кожного місяця.
Приведення типів
Дати, числові поля, категоріальні змінні — приведені до коректних типів даних.
Нормалізація марок/моделей
Виправлення опечаток, уніфікація написання, маппінг до стандартних назв марок та моделей.
Формат Parquet
Колоночний формат для ефективних аналітичних запитів. Стиснення ~10x порівняно з CSV.
source Джерело
Відомості про транспортні засоби та їх власників
Міністерство внутрішніх справ України
table_chart Схема даних
Повний перелік стовпців у наборі даних (v2.0). Розширені поля доступні через API.
| # | Стовпець | Тип | Приклад | Опис |
|---|---|---|---|---|
| 1 | record_id | VARCHAR | d6179fa48a159e3c… | Унікальний ідентифікатор запису (SHA-256 хеш) |
| 2 | person | VARCHAR | P | Тип власника: P (фізична особа) або J (юридична особа) |
| 3 | reg_addr_koatuu | VARCHAR | 8036100000 | Код КОАТУУ зареєстрованої адреси власника |
| 4 | oper_code | INT | 40 | Числовий ідентифікатор операції реєстрації |
| 5 | oper_name | VARCHAR | ВТОРИННА РЕЄСТРАЦІЯ ТЗ… | Повна назва операції реєстрації |
| 6 | oper_car_condition | VARCHAR | used | Стан авто при операції |
| 7 | short_oper_name | VARCHAR | Вторинна реєстрація | Скорочена назва операції |
| 8 | oper_description | VARCHAR | Купив вживане авто… | Людинозрозумілий опис операції |
| 9 | oper_notes | VARCHAR | Людина купила вживане… | Додаткові примітки до операції |
| 10 | owner_change | INT | 1 | Чи відбулась зміна власника (1/0) |
| 11 | is_import | INT | 0 | Чи є операція імпортом ТЗ (1/0) |
| 12 | is_aid | INT | 0 | Чи пов'язано з гуманітарною допомогою (1/0) |
| 13 | is_credit_leasing | INT | 0 | Чи є кредит/лізинг (1/0) |
| 14 | modification_type | VARCHAR | — | Тип модифікації |
| 15 | document_basis | VARCHAR | purchase_contract | Підстава документу (purchase_contract тощо) |
| 16 | entity_type | VARCHAR | any | Тип суб'єкта операції |
| 17 | is_wartime | INT | 0 | Чи здійснено в воєнний час (1/0) |
| 18 | is_digital | INT | 0 | Чи є цифровою операцією (1/0) |
| 19 | is_stolen_related | INT | 0 | Чи пов'язано з викраденням (1/0) |
| 20 | is_insurer | INT | 0 | Чи є страхувальником (1/0) |
| 21 | is_social | INT | 0 | Чи є соціальною операцією (1/0) |
| 22 | d_reg | DATE | 2021-06-15 | Дата операції реєстрації (YYYY-MM-DD) |
| 23 | dep_code | VARCHAR | 1330313 | Ідентифікатор сервісного центру |
| 24 | dep | VARCHAR | ТСЦ 1330 | Назва сервісного центру |
| 25 | dep_region | VARCHAR | Харківська | Регіон сервісного центру |
| 26 | dep_city | VARCHAR | Харків | Місто сервісного центру |
| 27 | dep_address | VARCHAR | вул. Клочківська | Адреса сервісного центру |
| 28 | dep_address_number | VARCHAR | 228 | Номер будинку сервісного центру |
| 29 | dep_description | VARCHAR | Реєстрація ТЗ, техогляд | Опис сервісного центру |
| 30 | dep_hours_of_work | VARCHAR | Пн-Пт 09:00-18:00 | Години роботи сервісного центру |
| 31 | dep_phones | VARCHAR | +380577001234 | Телефони сервісного центру |
| 32 | brand | VARCHAR | Toyota | Марка ТЗ (латиницею) |
| 33 | model | VARCHAR | Camry | Модель ТЗ (латиницею) |
| 34 | generation | LIST<VARCHAR> | ["XV70 facelift 2017"] | Покоління/генерація моделі |
| 35 | model_suffix | VARCHAR | XLE | Суфікс моделі |
| 36 | make_year | INT | 2021 | Рік випуску |
| 37 | model_year | INT | 2021 | Модельний рік (може відрізнятись від року випуску) |
| 38 | vin_year_code | VARCHAR | M | Код року з VIN (10-та позиція) |
| 39 | color | VARCHAR | Сірий | Колір кузова |
| 40 | kind | VARCHAR | Легковий | Категорія ТЗ (легковий, вантажний тощо) |
| 41 | body | VARCHAR | Седан | Тип кузова (седан, хетчбек тощо) |
| 42 | possible_body_types | LIST<VARCHAR> | ["Sedan"] | Можливі типи кузова для моделі |
| 43 | body_subtype | VARCHAR | 4-door | Підтип кузова |
| 44 | body_modifiers | VARCHAR | — | Модифікатори кузова |
| 45 | vehicle_class | VARCHAR | — | Клас ТЗ (A, B, C, D, ...) |
| 46 | trailer_prefix | VARCHAR | — | Префікс причепа |
| 47 | purpose | VARCHAR | Загальний | Призначення ТЗ |
| 48 | fuel | VARCHAR | Бензин | Основний тип пального |
| 49 | secondary_fuel | VARCHAR | Електро | Додаткове паливо |
| 50 | is_gbo | INT | 0 | Чи встановлено ГБО (1/0) |
| 51 | is_hybrid | INT | 1 | Чи є гібридом (1/0) |
| 52 | fuel_notes | VARCHAR | Бензин + Електро | Примітки щодо пального |
| 53 | possible_fuels | LIST<VARCHAR> | ["Petrol", "Hybrid"] | Можливі типи пального для моделі |
| 54 | capacity | INT | 2487 | Об'єм двигуна (см³) |
| 55 | possible_displacements | LIST<INT> | [2487, 1998] | Можливі об'єми двигуна для моделі (см³) |
| 56 | own_weight | INT | 1570 | Власна вага (кг) |
| 57 | total_weight | INT | 2070 | Повна вага (кг) |
| 58 | payload | INT | 500 | Вантажопідйомність (кг) |
| 59 | n_reg_new_cyrillic | VARCHAR | АХ4521ВР | Державний номерний знак (кирилиця) |
| 60 | n_reg_latin | VARCHAR | AX4521BP | Номерний знак транслітерований латиницею |
| 61 | has_old_cyrillic | INT | 0 | Чи має старий номерний знак радянського зразка (1/0) |
| 62 | plate_type | VARCHAR | UA_MODERN | Тип номерного знака (UA_MODERN тощо) |
| 63 | region_code | VARCHAR | AX | Код регіону з номерного знака |
| 64 | is_valid_plate | BOOLEAN | true | Результат валідації формату номерного знака |
| 65 | validation_error | VARCHAR | — | Опис помилки валідації номера |
| 66 | region_name | VARCHAR | Харківська | Назва регіону за кодом номера |
| 67 | needs_moderation | BOOLEAN | false | Чи потребує модерації |
| 68 | raw_vin | VARCHAR | JTDKN3DU5M1234567 | Оригінальний VIN з джерела |
| 69 | vin | VARCHAR | JTDKN3DU5M1234567 | Нормалізований VIN-код |
| 70 | is_valid_vin | BOOLEAN | true | Результат валідації VIN |
| 71 | vin_validation_error | VARCHAR | — | Опис помилки валідації VIN |
| 72 | vin_length | INT | 17 | Довжина VIN-коду |
| 73 | vin_is_17 | BOOLEAN | true | Чи має VIN стандартну довжину 17 символів |
| 74 | vin_has_ioq | BOOLEAN | false | Чи містить VIN заборонені символи I, O, Q |
| 75 | vin_wmi | VARCHAR | JTD | WMI-код (перші 3 символи VIN) |
| 76 | vin_wmi_manufacturer | VARCHAR | Toyota Motor Corporation | Виробник за WMI-кодом |
| 77 | vin_wmi_region | VARCHAR | Asia | Регіон виробника за WMI-кодом |
| 78 | vin_wmi_known | BOOLEAN | true | Чи відомий WMI-код у базі виробників |
| 79 | possible_transmissions | LIST<VARCHAR> | ["automatic", "manual"] | Можливі типи трансмісії для моделі |
| 80 | possible_drives | LIST<VARCHAR> | ["Front wheel drive"] | Можливі типи приводу для моделі |
| 81 | backfill_confidence | VARCHAR | HIGH | Рівень впевненості відновленого VIN для записів 2013–2020 |
| 82 | backfill_stage | VARCHAR | stg1 | Етап pipeline, на якому відновлено VIN |
Схема v2.0 — 82 поля. Включає розширену інформацію про операції, сервісні центри, VIN-аналіз, характеристики кузова/пального та backfill-метадані.
api API доступ
REST API для програмного доступу до даних з розширеними полями. Базові 1 000 запитів — безкоштовно.
Реєстр ТЗ — пакети запитів
Кредити діють 12 місяців з моменту покупки. Набір полів обговорюється індивідуально. API-ключі персональні, передача третім особам заборонена.
Додаткові API
Окремі ендпоінти для швидкого пошуку та перевірки. Можна комбінувати з пакетами реєстру або купувати окремо.
Пошук номер ↔ VIN
Знайти VIN за держномером або держномер за VIN. Поточний та історичні записи.
Історія авто
Повна історія реєстрацій ТЗ за VIN або держномером: зміни власників, регіони, дати. Продажі на онлайн-маркетплейсах.
VIN Decode
Розшифровка VIN: виробник, модель, рік, тип кузова, двигун, країна та завод виробництва. Оплата лише за успішне декодування.
Річні підписки
Фіксована ціна, необмежені запити, повний доступ до даних. Ціна залежить від кількості додаткових полів.
Підписка на 1 рік
Для регулярної аналітики та інтеграцій
- checkНеобмежені запити
- checkBulk export (Parquet / CSV)
- checkЩомісячні оновлення даних
- checkТехнічна підтримка
- checkРекомендації з обробки та аналізу даних
Підписка на 5 років
Максимальна вигода для довгострокових проєктів
- checkНеобмежені запити
- checkBulk export (Parquet / CSV)
- checkЩомісячні оновлення даних
- checkГарантія фіксованої ціни
- checkMCP Server у подарунок
- checkРекомендації з обробки та аналізу даних
AUTOMOTO MCP Server
Підключіть AI-асистентів (Claude, ChatGPT, Cursor) напряму до даних реєстру через Model Context Protocol. Доступний для тарифів Business/Enterprise або як окремий додаток.
open_in_new MCP GatewayAPI-ключі та завантажені дані є персональними та не можуть бути передані, перепродані або поширені третім особам. Порушення умов призводить до блокування доступу без повернення коштів.
Усі ціни вказані без ПДВ. Для індивідуальних рішень — зв'яжіться з нами.
table_chart Розширені поля
Від 27 безкоштовних базових полів до 80+ розширених з VIN-декодуванням, технічними характеристиками та EU-даними.
lock_open Open Data (безкоштовно)
~27 полівУсі дані з бази МВС України — нормалізовані, дедупліковані та покращені за якістю. VIN-коди включені лише за наявності в оригінальному наборі.
- Номер реєстрації
- Марка / модель (нормалізовані)
- Рік випуску
- Колір
- Тип пального (сирий)
- Об'єм двигуна
- Власна / повна вага
- Дата реєстрації
- Код операції
- Код КОАТУУ
verified Basic
~30 полів+ до базових:
- Коректний тип кузова
- Коректний тип пального
- Коректний тип приводу
- КАТОТТГ (новий класифікатор)
- Валідація VIN
- Виправлення помилок VIN
- Розшифровка КОАТУУ
- Адреса ТСЦ / департаменту
star Standard
~50 полів+ до Basic:
- Модифікація авто
- Покоління (генерація)
- Базове VIN-декодування (NHTSA)
- Тип трансмісії
- Потужність (к.с. / кВт)
- Клас євростандарту
- Додаткові техн. характеристики
diamond Pro
80+ полів+ до Standard:
- Повне VIN-декодування
- Декодування авто з Європи
- Розширені техн. характеристики
- Країна виробництва + завод
- Усі аналітичні інструменти
- 5 кастомних аналітичних звітів/рік
- Пріоритетна підтримка та консультації
- Доступ до MCP Server
- Відновлені VIN для записів 2013–2020
bug_report Відомі проблеми
12 категорій проблем оригінального набору даних МВС (~46.8 GB, 146 CSV-файлів), виявлених та виправлених у версії з покращеною якістю.
description Документація та посилання
Схема даних
Опис усіх стовпців, типів даних та допустимих значень.
Звіт якості
12 категорій проблем оригінальних даних та методи їх виправлення.
DQ-звіти по місяцях
Детальні звіти якості для кожного місячного знімка даних.
README
Повний опис проєкту, інструкції з використання та приклади.
Релізи
Усі версії набору даних для завантаження.
Ліцензія
CC BY 4.0 — вільне використання з обов'язковою атрибуцією.
person Автор
format_quote Як цитувати
Klimnyk, M. (2026). UA Vehicle Registry — Enhanced Quality. https://doi.org/10.5281/zenodo.19099441При використанні даних обов'язково вказуйте Mykhailo Klimnyk та AUTOMOTO.AI як авторів покращеної версії, а МВС України як джерело оригінальних даних.
apps Інші продукти AUTOMOTO
Готові працювати з даними?
Завантажте безкоштовний набір або зверніться для доступу до API з розширеними полями.
Часті запитання
Це похідний набір даних, створений на основі офіційного відкритого реєстру транспортних засобів МВС України. Ми виправляємо проблеми кодування, стабілізуємо схему, видаляємо ~85% дублікатів, нормалізуємо марки й моделі, та публікуємо чисті дані у Parquet і CSV.
Набір містить ~24 мільйони унікальних записів реєстрацій транспортних засобів за період 2013–2026 років. Оригінальний набір МВС містить значно більше через масові дублікати, які ми видаляємо.
Безкоштовний Open Data набір містить 27 базових полів (номер, марка, модель, рік, колір тощо). Платні рівні додають коректні типи кузова/палива, VIN-валідацію, декодування VIN, покоління авто, потужність, євроклас і до 80+ полів загалом.
API працює на основі кредитів або річних підписок. Перші 1 000 запитів безкоштовні. Далі можна придбати пакети від 10K до 200K запитів, або річну підписку з необмеженими запитами. Додатково доступні API пошуку за номером/VIN, історії авто та VIN-декодування.
Безкоштовний набір включає VIN-коди лише за наявності в оригінальних даних МВС. Платні рівні додають відновлені VIN-коди для записів 2013–2020 (які відсутні в оригіналі), VIN-валідацію, виправлення помилок та повне декодування.
Так, через AUTOMOTO MCP Server можна підключити Claude, ChatGPT, Cursor та інших AI-асистентів напряму до даних реєстру через Model Context Protocol. MCP Server доступний для тарифів Business/Enterprise або як окремий додаток.
