Користування відкритими базами даних спостережень

Сучасні бази даних спостережень за живою природою є важливим інструментом моніторингу тваринного і рослинного світу, передусім, завдяки тому, що дані збираються на чималій території від значної кількості спостерігачів. Створення і розвиток таких баз були зумовлені розвитком інтернету, спочатку дротового, пізніше і мобільного. Далі ми спробуємо на деяких прикладах розглянути можливості, переваги та вади сучасних онлайн ресурсів, що створені для збору та первинної обробки польових спостережень за об’єктами живої природи, зокрема денними хижими птахами та совами.

Accipitriformes in iNaturalistПочнемо з вад. Нічим не обмежена свобода створення ресурсів для реєстрації спостережень вилилась у чималу кількість сайтів із різноманітним оформленням та інструментарієм. З розвитком мобільного інтернету для деяких із них були розроблені спеціальні застосунки для мобільних пристроїв, а згодом почали застосовуватись технології штучного інтелекту для швидкого визначення видів. Різноманіття пропозицій призводить до виникнення притаманних йому проблем, серед яких слід згадати наступні:
– неузгодженість технічних рішень при створенні різних мережевих ресурсів, що перешкоджає об’єднанню зібраних у них первинних даних для подальшої обробки;
– загальна складність баз даних, яка унеможливлює прорахування всіх потенційних викликів майбутнього і, як наслідок, спричиняє виникнення певних меж для подальшого розвитку, коли база вже містить значну кількість цінних спостережень;
– “параліч вибору” користувача, коли важко визначити, який саме ресурс найзручніший та найбільш відповідний вимогам та побажанням конкретної людини. Причому проблеми вибору стають тим гострішими, чим більше спостережень накопичується в орнітолога, бьордвотчера чи просто любителя птахів.
І як результат:
– розпорошеність даних по різних ресурсах, що важко змінити з огляду на природній консерватизм користувачів;
– дублювання спостережень у різних базах, яке дуже складно відсіяти при обробці;
– відсутність гарантій довгострокового фінансування і технічної підтримки конкретних мережевих ресурсів.

Хотілось би також відзначити типову дилему демократичного шляху вирішення питань, яка виникає при обговоренні окремих спостережень користувачами: підхід, коли думка будь-якого учасника враховується однаково; проти підходу, коли думка визнаного за різними алгоритмами фахівця важить певною мірою більше. Другий варіант забезпечує точніші результати тут і зараз, перший – залучає більше людей і заохочує їх до навчання в процесі роботи з базами даних. У схожій ситуації у виборчому праві провідних країн світу перевага надається саме першому підходу, що створює кращі умови для розвитку суспільства в довгостроковій перспективі. Останню тезу варто не забувати, коли суперечки з людьми, що припустились спільної помилки, починають відверто дратувати.

Переваги і важливість користування базами даних. Проте, звісно, перераховані недоліки аж ніяк не перекреслюють переваг об’єднання значної кількості спостережень на одному або декількох ресурсах з відкритим доступом. Таке об’єднання дозволяє швидко, без зайвої витрати часу отримувати дані для обробки необмеженій кількості спеціалістів, підвищує точність визначення виду птаха завдяки вчасній перевірці спостережень відповідними фахівцями, відкриває користувачеві широкі можливості для вдосконалення знань.

На які ж питання може отримати відповіді орнітолог, базуючись на аналізі зібраних даних? Ось декотрі з них:
– поточні межі ареалу видів, їх розповсюдження в різних регіонах;
– шляхи і терміни міграції птахів;
– типові та нетипові біотопи, де птахи трапляються;
– фенологія розмноження за зустрічами молодих птахів у відповідному вбранні;
– місця зимівлі та райони, де тримаються нестатевозрілі птахи влітку;
– стан місцевої популяції, наявність територіальних птахів на відомих гніздових територіях та багато інших.

Тут треба зауважити, що у сучасному мінливому світі перераховані аспекти біології птахів також змінюються, і ці зміни варто ретельно відстежувати в часі.

Приклади роботи з базами даних на хижих птахах України. На даний час найбільша кількість спостережень хижих птахів на території нашої країни, що були підтверджені фотознімками, занесена до баз даних iNaturalist та uabirds. Невипадково посилання саме на ці два ресурси ми розмістили в таблиці огляду сучасного статусу різних видів денних хижих птахів і сов України. Користувачам iNaturalist відомо, що це – одна з найсучасніших баз даних з використанням технології ШІ, яка досить якісно допомагає визначити вид птаха ще при завантаженні спостереження, містить багато спеціальних форм для внесення додаткової інформації. Отримати ж необхідні вам дані можна за допомогою фільтрів, які додають до запиту змінні з відповідними значеннями. Наприклад, якщо вас цікавлять спостереження яструбоподібних, що потребують підтвердження визначення виду, в адресному рядку вашого браузера в посиланні
https://www.inaturalist.org/observations?quality_grade=needs_id&taxon_id=71261
такому запиту відповідатимуть змінні taxon_id=71261
та quality_grade=needs_id, що відокремлені одна від одної оператором &.
Однак, слід пам’ятати, що не всі дані можна відфільтрувати з допомогою лише наявних інструментів інтерфейсу. Деякі з них доступні виключно через додавання змінних до запиту в адресному рядку. Наприклад, якщо з метою оцінки сучасних меж гніздового ареалу змієїда (Circaetus gallicus) потрібна мапа спостережень за 6 місяців гніздового сезону з квітня до вересня, причому, тільки тих, які мають примітку “дорослий”, то посилання матиме наступний вигляд:
https://www.inaturalist.org/observations?place_id=any&subview=map
&taxon_id=5242&month=4,5,6,7,8,9
&term_id=1&term_value_id=2

Для змінних в останньому рядку немає відповідних налаштувань фільтра, вони можуть додаватись до запиту тільки вручну, копіюванням.
Якщо ви бажаєте виключити певну країну з вибірки, вам доведеться спочатку дізнатись її ID номер, вибравши потрібну країну фільтром, наприклад, place_id=7161, після чого замінити поточну змінну іншою з тим самим значенням not_in_place=7161.
Довідкова інформація про те, які змінні та їх значення відповідають яким саме параметрам пошукових запитів, доступна на форумі iNaturalist.

База даних uabirds, адміністратором якої є експерт нашого центру Андрій Сімон, не має таких розгалужених форм для систематизації спостережень, проте наразі містить більше знімків хижих птахів, зібраних за багато років в Україні великою кількістю спостерігачів. Усі спостереження одного виду одночасно доступні на мапі. Запити до бази даних складаються за таким самим принципом, як і в iNaturalist. Проте її зручно використовувати іншим чином, коли стоїть задача відслідковувати свіжі спостереження птахів в Україні в поточному сезоні. Для такої мети можна пристосувати зовнішній безкоштовний моніторинговий сервіс, такий як, наприклад, Wachete. Досить прості налаштування сервісу дозволяють отримувати регулярні повідомлення по електронній пошті щоразу, коли на сторінці 100 останніх оновлень з’являється або щезає слово, наприклад, “змієїд”. Такий підхід забезпечує вчасне інформування про реєстрації територіальних птахів на гніздових територіях, зокрема з тих пар, моніторинг яких проводиться щорічно.

Найбільшою відкритою базою даних про птахів світу на сьогодні є eBird. У ній міститься також чимало даних про денних хижих птахів та сов з території України. Особливістю функціонування цієї бази даних є необов’язковість завантаження фото зустрінутих птахів. Це значною мірою обмежує використання інформації орнітологами (у випадку необхідності уточнення даних про зустрінутий вид). Хоча існує функціональна можливість відфільтрувати спостереження із фото або відео. Як і у попередніх базах даних, на eBird можна проглядати карти поширення обраного виду, окремі спостереження або завантажувати датасет.

Українською базою даних з біорізноманіття є UkrBIN. Вона також містить певний обсяг інформації про хижих птахів. У ній усі користувачі мають підтверджувати спостереження виду завантаженими фото. При визначенні застосовується шкала достовірності: “можливо – швидше за все – достовірно”. Для науковців надається функція додавання даних без фото. Є змога проглядати карти поширення обраного виду, окремі спостереження або завантажувати датасет.

Також слід мати на увазі, що відомості з більшості згаданих вище баз даних завантажуються до GBIF, Global Biodiversity Information Facility, яка на сьогодні є найбільшою і загальновизнаною науковою базою даних з біорізноманіття.

Оскільки більшість мережевих баз даних (якщо не всі) зберігають інформацію в табличній формі, для користувачів з певними правами доступу існує опція експортування та конвертації даних у формат відповідного програмного забезпечення для роботи з таблицями. Цей шлях надає майже необмежені можливості для детальної і всебічної обробки інформації з використанням математичних інструментів і методів ймовірнісно-статистичного аналізу даних.

Сучасний розвиток інформаційних технологій прибирає багато перепон для поглиблення та розповсюдження знань людини про живу природу. Це набуває особливого значення тепер, коли вплив людської цивілізації на неї критично зріс. Відкриті мережеві бази даних надають змогу широкому колу спостерігачів долучитись до збору важливої інформації, яка, окрім суто наукових цілей, слугуватиме для вчасного виявлення критичних змін у навколишньому середовищі та адекватного реагування на них відповідними заходами.

Костянтин Письменний, Максим Гаврилюк
Український центр досліджень хижих птахів

Дивіться також допис Максима Гаврилюка для ФБ-групи “Птахи України” з коротким оглядом основних відкритих баз даних для занесення результатів спостережень перш за все птахів.

Рекомендоване посилання:Письменний К., Гаврилюк М. Користування відкритими базами даних спостережень. – Український центр досліджень хижих птахів. 30.09.2022. https://raptors.org.ua/6297. Дата звернення: .

Ви маєте увійти, щоб коментувати.