~24M записів
2013–2026 часовий діапазон
~907 MB Parquet
Щомісяця оновлення
download Завантажити code GitHub lab_profile Звіт якості даних
Zenodo · Wikidata · ORCID

info Про набір даних

Реєстр ТЗ України — Покращена якість — це похідний набір даних, створений на основі офіційного відкритого реєстру транспортних засобів МВС України. Оригінальні дані опубліковані на data.gov.ua.

Оригінальний набір має численні проблеми з якістю: змішане кодування (Windows-1251 / UTF-8), нестабільна схема (різні назви стовпців у різних місяцях), масові дублікати (~85%), відсутність нормалізації марок і моделей.

Ми виправляємо ці проблеми автоматичним data quality pipeline і публікуємо чисті, готові до аналізу знімки у форматах Parquet та CSV.

verified Покращення якості

text_format

Кодування

Автоматичне визначення кодування (Windows-1251, UTF-8, KOI8-U) та конвертація в єдине UTF-8.

table_chart

Стабілізація схеми

Уніфікація назв стовпців з різних місяців в єдину стабільну схему.

content_copy

Дедуплікація

Видалення ~85% дублікатів. Оригінальний набір містить повторні записи для кожного місяця.

123

Приведення типів

Дати, числові поля, категоріальні змінні — приведені до коректних типів даних.

directions_car

Нормалізація марок/моделей

Виправлення опечаток, уніфікація написання, маппінг до стандартних назв марок та моделей.

storage

Формат Parquet

Колоночний формат для ефективних аналітичних запитів. Стиснення ~10x порівняно з CSV.

source Джерело

Відомості про транспортні засоби та їх власників

Міністерство внутрішніх справ України

table_chart Схема даних

Повний перелік стовпців у наборі даних (v2.0). Розширені поля доступні через API.

#СтовпецьТипПрикладОпис
1record_idVARCHARd6179fa48a159e3c…Унікальний ідентифікатор запису (SHA-256 хеш)
2personVARCHARPТип власника: P (фізична особа) або J (юридична особа)
3reg_addr_koatuuVARCHAR8036100000Код КОАТУУ зареєстрованої адреси власника
4oper_codeINT40Числовий ідентифікатор операції реєстрації
5oper_nameVARCHARВТОРИННА РЕЄСТРАЦІЯ ТЗ…Повна назва операції реєстрації
6oper_car_conditionVARCHARusedСтан авто при операції
7short_oper_nameVARCHARВторинна реєстраціяСкорочена назва операції
8oper_descriptionVARCHARКупив вживане авто…Людинозрозумілий опис операції
9oper_notesVARCHARЛюдина купила вживане…Додаткові примітки до операції
10owner_changeINT1Чи відбулась зміна власника (1/0)
11is_importINT0Чи є операція імпортом ТЗ (1/0)
12is_aidINT0Чи пов'язано з гуманітарною допомогою (1/0)
13is_credit_leasingINT0Чи є кредит/лізинг (1/0)
14modification_typeVARCHARТип модифікації
15document_basisVARCHARpurchase_contractПідстава документу (purchase_contract тощо)
16entity_typeVARCHARanyТип суб'єкта операції
17is_wartimeINT0Чи здійснено в воєнний час (1/0)
18is_digitalINT0Чи є цифровою операцією (1/0)
19is_stolen_relatedINT0Чи пов'язано з викраденням (1/0)
20is_insurerINT0Чи є страхувальником (1/0)
21is_socialINT0Чи є соціальною операцією (1/0)
22d_regDATE2021-06-15Дата операції реєстрації (YYYY-MM-DD)
23dep_codeVARCHAR1330313Ідентифікатор сервісного центру
24depVARCHARТСЦ 1330Назва сервісного центру
25dep_regionVARCHARХарківськаРегіон сервісного центру
26dep_cityVARCHARХарківМісто сервісного центру
27dep_addressVARCHARвул. КлочківськаАдреса сервісного центру
28dep_address_numberVARCHAR228Номер будинку сервісного центру
29dep_descriptionVARCHARРеєстрація ТЗ, техоглядОпис сервісного центру
30dep_hours_of_workVARCHARПн-Пт 09:00-18:00Години роботи сервісного центру
31dep_phonesVARCHAR+380577001234Телефони сервісного центру
32brandVARCHARToyotaМарка ТЗ (латиницею)
33modelVARCHARCamryМодель ТЗ (латиницею)
34generationLIST<VARCHAR>["XV70 facelift 2017"]Покоління/генерація моделі
35model_suffixVARCHARXLEСуфікс моделі
36make_yearINT2021Рік випуску
37model_yearINT2021Модельний рік (може відрізнятись від року випуску)
38vin_year_codeVARCHARMКод року з VIN (10-та позиція)
39colorVARCHARСірийКолір кузова
40kindVARCHARЛегковийКатегорія ТЗ (легковий, вантажний тощо)
41bodyVARCHARСеданТип кузова (седан, хетчбек тощо)
42possible_body_typesLIST<VARCHAR>["Sedan"]Можливі типи кузова для моделі
43body_subtypeVARCHAR4-doorПідтип кузова
44body_modifiersVARCHARМодифікатори кузова
45vehicle_classVARCHARКлас ТЗ (A, B, C, D, ...)
46trailer_prefixVARCHARПрефікс причепа
47purposeVARCHARЗагальнийПризначення ТЗ
48fuelVARCHARБензинОсновний тип пального
49secondary_fuelVARCHARЕлектроДодаткове паливо
50is_gboINT0Чи встановлено ГБО (1/0)
51is_hybridINT1Чи є гібридом (1/0)
52fuel_notesVARCHARБензин + ЕлектроПримітки щодо пального
53possible_fuelsLIST<VARCHAR>["Petrol", "Hybrid"]Можливі типи пального для моделі
54capacityINT2487Об'єм двигуна (см³)
55possible_displacementsLIST<INT>[2487, 1998]Можливі об'єми двигуна для моделі (см³)
56own_weightINT1570Власна вага (кг)
57total_weightINT2070Повна вага (кг)
58payloadINT500Вантажопідйомність (кг)
59n_reg_new_cyrillicVARCHARАХ4521ВРДержавний номерний знак (кирилиця)
60n_reg_latinVARCHARAX4521BPНомерний знак транслітерований латиницею
61has_old_cyrillicINT0Чи має старий номерний знак радянського зразка (1/0)
62plate_typeVARCHARUA_MODERNТип номерного знака (UA_MODERN тощо)
63region_codeVARCHARAXКод регіону з номерного знака
64is_valid_plateBOOLEANtrueРезультат валідації формату номерного знака
65validation_errorVARCHARОпис помилки валідації номера
66region_nameVARCHARХарківськаНазва регіону за кодом номера
67needs_moderationBOOLEANfalseЧи потребує модерації
68raw_vinVARCHARJTDKN3DU5M1234567Оригінальний VIN з джерела
69vinVARCHARJTDKN3DU5M1234567Нормалізований VIN-код
70is_valid_vinBOOLEANtrueРезультат валідації VIN
71vin_validation_errorVARCHARОпис помилки валідації VIN
72vin_lengthINT17Довжина VIN-коду
73vin_is_17BOOLEANtrueЧи має VIN стандартну довжину 17 символів
74vin_has_ioqBOOLEANfalseЧи містить VIN заборонені символи I, O, Q
75vin_wmiVARCHARJTDWMI-код (перші 3 символи VIN)
76vin_wmi_manufacturerVARCHARToyota Motor CorporationВиробник за WMI-кодом
77vin_wmi_regionVARCHARAsiaРегіон виробника за WMI-кодом
78vin_wmi_knownBOOLEANtrueЧи відомий WMI-код у базі виробників
79possible_transmissionsLIST<VARCHAR>["automatic", "manual"]Можливі типи трансмісії для моделі
80possible_drivesLIST<VARCHAR>["Front wheel drive"]Можливі типи приводу для моделі
81backfill_confidenceVARCHARHIGHРівень впевненості відновленого VIN для записів 2013–2020
82backfill_stageVARCHARstg1Етап pipeline, на якому відновлено VIN
info

Схема v2.0 — 82 поля. Включає розширену інформацію про операції, сервісні центри, VIN-аналіз, характеристики кузова/пального та backfill-метадані.

api API доступ

REST API для програмного доступу до даних з розширеними полями. Базові 1 000 запитів — безкоштовно.

Реєстр ТЗ — пакети запитів

Кредити діють 12 місяців з моменту покупки. Набір полів обговорюється індивідуально. API-ключі персональні, передача третім особам заборонена.

Free $0
1 000 запитів 27 базових полів
50K $199
50 000 запитів Поля за домовленістю $3.98 / 1K — економія 19%
200K $699
200 000 запитів Поля за домовленістю + bulk $3.50 / 1K — економія 29%

Додаткові API

Окремі ендпоінти для швидкого пошуку та перевірки. Можна комбінувати з пакетами реєстру або купувати окремо.

swap_horiz

Пошук номер ↔ VIN

Знайти VIN за держномером або держномер за VIN. Поточний та історичні записи.

$0.001 / запит
Мін. пакет: 10K запитів — $10
history

Історія авто

Повна історія реєстрацій ТЗ за VIN або держномером: зміни власників, регіони, дати. Продажі на онлайн-маркетплейсах.

$0.02 / запит
Мін. пакет: 5K запитів — $99
fingerprint

VIN Decode

Розшифровка VIN: виробник, модель, рік, тип кузова, двигун, країна та завод виробництва. Оплата лише за успішне декодування.

$0.01 / запит
Мін. пакет: 10K запитів — $99

Річні підписки

Фіксована ціна, необмежені запити, повний доступ до даних. Ціна залежить від кількості додаткових полів.

diamond

Підписка на 5 років

Максимальна вигода для довгострокових проєктів

Basic
$70 / міс.
оплата $4,200 / 5 років ~30 полів: базові + коректні типи Економія 30%
Standard
$140 / міс.
оплата $8,400 / 5 років ~50 полів: + VIN, покоління, модифікації Економія 30%
Pro
$280 / міс.
оплата $16,800 / 5 років 80+ полів: повний decode + звіти + підтримка Економія 30%
  • checkНеобмежені запити
  • checkBulk export (Parquet / CSV)
  • checkЩомісячні оновлення даних
  • checkГарантія фіксованої ціни
  • checkMCP Server у подарунок
  • checkРекомендації з обробки та аналізу даних
hub

AUTOMOTO MCP Server

Підключіть AI-асистентів (Claude, ChatGPT, Cursor) напряму до даних реєстру через Model Context Protocol. Доступний для тарифів Business/Enterprise або як окремий додаток.

open_in_new MCP Gateway
shield

API-ключі та завантажені дані є персональними та не можуть бути передані, перепродані або поширені третім особам. Порушення умов призводить до блокування доступу без повернення коштів.

Усі ціни вказані без ПДВ. Для індивідуальних рішень — зв'яжіться з нами.

table_chart Розширені поля

Від 27 безкоштовних базових полів до 80+ розширених з VIN-декодуванням, технічними характеристиками та EU-даними.

lock_open Open Data (безкоштовно)

~27 полів

Усі дані з бази МВС України — нормалізовані, дедупліковані та покращені за якістю. VIN-коди включені лише за наявності в оригінальному наборі.

  • Номер реєстрації
  • Марка / модель (нормалізовані)
  • Рік випуску
  • Колір
  • Тип пального (сирий)
  • Об'єм двигуна
  • Власна / повна вага
  • Дата реєстрації
  • Код операції
  • Код КОАТУУ

verified Basic

~30 полів

+ до базових:

  • Коректний тип кузова
  • Коректний тип пального
  • Коректний тип приводу
  • КАТОТТГ (новий класифікатор)
  • Валідація VIN
  • Виправлення помилок VIN
  • Розшифровка КОАТУУ
  • Адреса ТСЦ / департаменту

star Standard

~50 полів

+ до Basic:

  • Модифікація авто
  • Покоління (генерація)
  • Базове VIN-декодування (NHTSA)
  • Тип трансмісії
  • Потужність (к.с. / кВт)
  • Клас євростандарту
  • Додаткові техн. характеристики

diamond Pro

80+ полів

+ до Standard:

  • Повне VIN-декодування
  • Декодування авто з Європи
  • Розширені техн. характеристики
  • Країна виробництва + завод
  • Усі аналітичні інструменти
  • 5 кастомних аналітичних звітів/рік
  • Пріоритетна підтримка та консультації
  • Доступ до MCP Server
  • Відновлені VIN для записів 2013–2020

bug_report Відомі проблеми

12 категорій проблем оригінального набору даних МВС (~46.8 GB, 146 CSV-файлів), виявлених та виправлених у версії з покращеною якістю.

Виправлено Кодування (mojibake) — Windows-1251 / UTF-8, автоматична нормалізація
Виправлено Нестабільна схема — різні назви стовпців у різних роках, VIN з'явився у 2021
Виправлено Різні роздільники — крапка з комою та кома в різних файлах
Виправлено Масові дублікати — до 88% повторних записів (SHA-256 дедуплікація)
Виправлено Змішані типи даних — числа як рядки, різні формати дат
Виправлено Втрачені провідні нулі в кодах КОАТУУ (Excel-артефакт)
Виправлено Варіації марок/моделей — десятки варіантів однієї назви
Виправлено Placeholder-значення замість null — «невизначено», пробіли, дефіси, «NULL»
Виправлено Пошкоджені значення — ~107K рядків у 2022, ~1K у 2019
Виправлено Змішані формати числових полів — різні роздільники, діапазони, одиниці
Частково Осиротілі коди КОАТУУ — 100+ кодів без відповідності в реєстрах
Частково Аномалії вихідних даних — від'ємні ваги, нереальні роки, об'єми >50 000 см³

description Документація та посилання

person Автор

Mykhailo Klimnyk

Mykhailo Klimnyk

Head of Data, AUTOMOTO

format_quote Як цитувати

Klimnyk, M. (2026). UA Vehicle Registry — Enhanced Quality. https://doi.org/10.5281/zenodo.19099441

При використанні даних обов'язково вказуйте Mykhailo Klimnyk та AUTOMOTO.AI як авторів покращеної версії, а МВС України як джерело оригінальних даних.

apps Інші продукти AUTOMOTO

Готові працювати з даними?

Завантажте безкоштовний набір або зверніться для доступу до API з розширеними полями.

Часті запитання

Що таке Реєстр ТЗ України — Покращена якість?

Це похідний набір даних, створений на основі офіційного відкритого реєстру транспортних засобів МВС України. Ми виправляємо проблеми кодування, стабілізуємо схему, видаляємо ~85% дублікатів, нормалізуємо марки й моделі, та публікуємо чисті дані у Parquet і CSV.

Скільки записів містить набір даних?

Набір містить ~24 мільйони унікальних записів реєстрацій транспортних засобів за період 2013–2026 років. Оригінальний набір МВС містить значно більше через масові дублікати, які ми видаляємо.

Чим відрізняються безкоштовні поля від платних?

Безкоштовний Open Data набір містить 27 базових полів (номер, марка, модель, рік, колір тощо). Платні рівні додають коректні типи кузова/палива, VIN-валідацію, декодування VIN, покоління авто, потужність, євроклас і до 80+ полів загалом.

Як працює API доступ?

API працює на основі кредитів або річних підписок. Перші 1 000 запитів безкоштовні. Далі можна придбати пакети від 10K до 200K запитів, або річну підписку з необмеженими запитами. Додатково доступні API пошуку за номером/VIN, історії авто та VIN-декодування.

Чи містить набір VIN-коди?

Безкоштовний набір включає VIN-коди лише за наявності в оригінальних даних МВС. Платні рівні додають відновлені VIN-коди для записів 2013–2020 (які відсутні в оригіналі), VIN-валідацію, виправлення помилок та повне декодування.

Чи можна підключити AI-асистентів до даних?

Так, через AUTOMOTO MCP Server можна підключити Claude, ChatGPT, Cursor та інших AI-асистентів напряму до даних реєстру через Model Context Protocol. MCP Server доступний для тарифів Business/Enterprise або як окремий додаток.