AUTOMOTO Open Data HUB
Безкоштовні набори відкритих даних з покращеною якістю для дослідників, аналітиків та розробників
AUTOMOTO Open Data HUB — це ініціатива з покращення якості відкритих наборів даних в Україні. Ми беремо сирі державні дані, вирішуємо проблеми кодування, схеми та якості, і публікуємо чисті, готові до аналізу знімки у форматах Parquet та CSV.
dataset Набори даних
directions_car Реєстр ТЗ України — Покращена якість
Нормалізована та покращена за якістю похідна версія відкритого набору даних МВС України про зареєстровані транспортні засоби. 80+ полів, дедуплікація, стабілізація схеми.
verified Покращення якості
- check_circle Виправлення кодування (Windows-1251 / UTF-8 / KOI8-U → UTF-8)
- check_circle Стабілізація схеми — єдина структура для всіх місяців
- check_circle Дедуплікація — видалення ~85% повторних записів
- check_circle Нормалізація марок та моделей (латиницею)
- check_circle Валідація VIN та номерних знаків
- check_circle Формати Parquet та CSV з автоматичними DQ-звітами
Джерело
Відомості про транспортні засоби та їх власників — Міністерство внутрішніх справ України. Опубліковано на data.gov.ua
map Адміністративні коди України (КОАТУУ та КАТОТТГ)
Найповніший публічний набір кодів адміністративно-територіального устрою України — КОАТУУ та КАТОТТГ у машинозчитуваному форматі з координатами, перехресними посиланнями та повною ієрархією.
verified Особливості набору
- check_circle Уніфікована структура — КОАТУУ та КАТОТТГ в єдиній схемі
- check_circle Історичні та скасовані коди — для ретроспективного аналізу
- check_circle Перехресні посилання — 96.4% КАТОТТГ зіставлено з КОАТУУ
- check_circle Координати — 100% КАТОТТГ та 72.6% КОАТУУ
- check_circle Повна ієрархія — область → район → громада → населений пункт
- check_circle Формати Parquet та CSV для ефективних запитів
Джерела
Класифікатор КОАТУУ — Державна служба статистики України. Класифікатор КАТОТТГ — Міністерство розвитку громад та територій України. Опубліковано на data.gov.ua
analytics AUTOMOTO Analytics
Агреговані статистики та аналітика на основі даних реєстру ТЗ України — розподіл марок, моделей, палива, регіонів, тренди реєстрацій та інше.
add_circle_outline Ще більше наборів даних
Ми працюємо над покращенням якості інших наборів даних. Слідкуйте за оновленнями.
Потрібні дані?
Завантажте безкоштовні набори даних або зв'яжіться з нами для доступу до API з розширеними полями.
Часті запитання
AUTOMOTO Open Data HUB — це ініціатива з покращення якості відкритих державних наборів даних. Ми беремо сирі дані, виправляємо проблеми кодування, схеми та якості, і публікуємо чисті, готові до аналізу дані у форматах Parquet та CSV під ліцензією CC BY 4.0.
Так, базові набори даних (Open Data) доступні безкоштовно під ліцензією CC BY 4.0. Розширені поля з VIN-декодуванням, нормалізацією та додатковими характеристиками доступні через платні API-пакети.
Дані доступні у форматах Apache Parquet (оптимальний для аналітичних запитів, ~10x стиснення) та CSV (універсальна сумісність). Через API дані повертаються у форматі JSON.
Набори даних оновлюються щомісяця. Після кожного оновлення МВС ми запускаємо автоматичний pipeline покращення якості та публікуємо новий реліз на GitHub.
Усі набори даних опубліковані під ліцензією Creative Commons Attribution 4.0 (CC BY 4.0). Ви можете вільно використовувати, копіювати та поширювати дані за умови вказання авторства AUTOMOTO.AI та МВС України як джерела оригінальних даних.