Дмитро Вакуленко, керівник проєкту UA Anti Spam Bot

Ми створили чат-бот, який допомагає вирішити питання інформаційної безпеки в Україні

12.08.2023 10:00

В умовах повномасштабної війни публікація певного контенту в мережі може загрожувати не тільки особистій безпеці чи безпеці близького оточення, а й безпеці та інтересам всієї країни. Саме тому після 24 лютого 2022 року проблема дотримання українцями інформаційної гігієни стала ще більш актуальною.

Так, вже 1,5 року влада, правоохоронці та Сили оборони просять громадян не публікувати в інтернеті інформацію про прильоти, пересування військ, блокпости українських військових або інші чутливі дані, які ворог може використати проти нас. Проте дослухаються до рекомендацій не всі.

За боротьбу з подібним контентом взялися волонтери IT-компанії Master of Code Global, започаткувавши проєкт UA Anti Spam Bot. Вони створили чат-бот для Телеграму, що видаляє коментарі у групах і чатах з інформацією, яку українська влада не рекомендує оприлюднювати під час війни. Крім цього, бот допомагає боротися із шахраями та із тими, хто поширює “дорослий” контент.

Укрінформ розпитав керівника проєкту Дмитра Вакуленка про те, як працює чат-бот, як він допомагає боротися зі шкідливим контентом у Телеграмі, а також про можливості та майбутнє чат-ботів як інструментів адміністрування каналів.

ЩО ТАКЕ UA ANTI SPAM BOT ТА ЧОМУ ВІН ПОТРІБЕН

- Розкажіть, будь ласка, про UA Anti Spam Bot, навіщо він потрібен та чим н буде корисний користувачам Телеграму?

- UA Anti Spam Bot - це бот, який розробили для того, щоб видаляти коментарі зі стратегічно важливою інформацією про хід війни в Україні (пересування наших військ, прильоти і т.д.), але згодом ми розширили його функціонал. Відтепер бот також видаляє різноманітний шкідливий контент (фейкові збори, фішингові посилання, контент 18+ тощо).

Бот полегшує життя адміністраторам чатів та груп у Телеграмі. Він спрощує процес адміністрування групи або чату – адмінам не потрібно власноруч моніторити і видаляти шкідливі коментарі. Бот перевіряє повідомлення за певними факторами і самостійно все видаляє.

UA Anti Spam Bot – це повноцінний інструмент для модерування груп. Ми створили його на волонтерських засадах, і користування ним було, є та буде безоплатним. Як мені відомо, це унікальний інструмент, якому немає аналогів за функціоналом.

Ми запустили його на самому початку повномасштабного російського вторгнення. Виявилося, що, наприклад, функція видалення коментарів про рух українських військових, про розташування наших блокпостів, а також про прильоти стала дуже актуальною. Особливо у перші місяці великої війни.

Ми допомагаємо вирішити питання інформаційної безпеки, адже росіяни дуже прискіпливо стежать за українськими групами, чатами та за нашим інфопростром взагалі.

- Уявімо, що я адміністраторка невеликого каналу у Телеграмі і помічаю, що під постами з’являється все більше коментарів, які, наприклад, стосуються пересування української армії, як цей бот допоможе мені боротися з такими повідомленнями?

- Бот потрібно додати до групи або каналу як користувача та надати йому права адміністратора. Після цього він у реальному часі моніторитиме всі повідомлення, які з’являються у групі. Він має певний функціонал, який можна вмикати або вимикати, і відповідно до якого бот перевіряє всі коментарі та видаляє шкідливі повідомлення. Тобто адміністратор може самостійно обрати той контент, який потрібно видаляти, й бот видалятиме його.

Адміністраторам не варто боятися того, що бот має доступ до якоїсь чутливої особистої інформації або зберігає персональні дані. Код нашого бота є у відкритому доступі, тож кожен може побачити, що у ньому не закладені якісь таємні функції. Також ми не приховуємо, хто його створив.

- Як відбувається процес навчання бота?

- При створенні UA Anti Spam Bot ми заклали спеціальну архітектуру, яка дозволяє розширювати функціонал. Спочатку бот видаляв інформацію, пов’язану з війною. Для цього було використано низку ключових слів на кшталт: “вибух” чи “пожежа”, “прильот”, “локація”. Бот, коли бачив таку зв’язку, автоматично видаляв повідомлення. Але з часом ми зрозуміли, що цей підхід не працює, оскільки бот не враховував контекст.

Ми отримували відгуки від адміністраторів та зрозуміли, що треба натренувати нейромережу. Для цього почали збирати приклади повідомлень - як негативних, так і позитивних - на основі яких система навчалася розрізняти, що потрібно видаляти, а що ні.

Наприклад, словосполучення “сонце палає” має нейтральний характер і не несе жодної важливої інформації, а речення “за такою адресою палає будинок після прильоту” містить стратегічні дані. Бот навчений розрізняти ці повідомлення.

ПРО ЗАСИЛЛЯ СПАМУ У ТЕЛЕГРАМІ

- Як виникла ідея створити такий інструмент?

- Після 24 лютого у Телеграмі з’явилося багато каналів та груп, де люди публікували інформацію про прильоти, пересування військ. Водночас державні органи влади почали надавати рекомендації не публікувати таку інформацію у мережі, тому що її може використати ворог.

На початку повномасштабної війни я просто вручну писав у групах “видаліть цю інформацію”, “це не можна повідомляти”. Я моніторив канали та групи і помітив, що люди пишуть подібні коментарі за певним шаблоном і з використанням певних ключових слів. Після цього я вже почав працювати над першою версією бота.

Взагалі вже під час повномасштабної війни виявилося, що багато хто не надто стежить за інформаційною гігієною, і люди вперше зіштовхнулися із тим, що не все можна публікувати в мережі. Навіть зараз ми бачимо, що деякі відомі блогери виставляють у соцмережі відео з прильотами чи ще якусь важливу інформацію, яку не можна повідомляти.

- Отже, проєкт існує вже майже півтора року. За цей час скільки коментарів було видалено з Телеграму? Скільки користувачів бот має?

- За весь час було видалено десь 70 - 80 тисяч коментарів. Це без урахування відомостей, що стосуються повномасштабного вторгнення. Їх ми ніде не зберігаємо для інформаційної безпеки, щоб такі дані не виходили нікуди за межі чату. Тобто, наведені цифри - це про шахрайські повідомлення та про контент 18+.

У нас майже 9 тисяч комунікацій. Це стільки разів боту написали у приватні повідомлення або додали у групу або чат. Загалом маємо 683 тисячі користувачів і в цілому 2500 груп та чатів, де наш бот використовується.

- Бот розуміє тільки українську мову чи й інші мови також?

- Бот розуміє українську та російську мови. Він може перевіряти повідомлення, написані російською. Водночас ми фокусуємося на українському сегменті і наша основна аудиторія – це українці.

- Чи можна використовувати бот у російських чатах та групах, де також багато дезінформації і шкідливих повідомлень?

- Потрібно, щоб адміністратор додав бот та надав йому відповідні права. Ініціатива має йти саме від нього. Якщо ж він не надав такого дозволу, то бот не може використовуватися у чаті чи групі.

- Бот має якісь обмеження або недоліки?

- Здебільшого, це випадки, коли бот видаляє контент, який не є неприйнятним. Таке іноді трапляється.

Інша проблема – оптимізація. На початку, коли ми тільки-но створили бот, його додали у дуже багато чатів і він отримав сильне навантаження. Були проблеми з оптимізацією - потрібно було чітко розуміти, скільки чатів його використовують, скільки потрібно часу на перевірку повідомлень. Це для того, щоб не створювати занадто велику чергу, коли він не зміг би опрацювати всі запити.

Також сам Телеграм має обмеження у роботі для ботів, зокрема певний ліміт на кількість дій, які бот може виконати за одиницю часу. Тож ми оптимізували роботу відповідно до цих лімітів.

- Чому для створення подібного інструменту було обрано саме Телеграм? Там фіксується найбільше “шкідливих” повідомлень?

- На початку повномасштабного вторгнення я помітив, що у Телеграмі справді найбільше спаму в коментарях. Мабуть тому, що у ньому немає модерації. Наприклад, Фейсбук має свої фільтри та алгоритми і сам модерує спам чи дезінформацію відповідно до них. А у Вайбері немає можливості додати бот у групу або чат. Тому ми вирішили сфокусуватися саме на Телеграмі. Плюс він має зручний функціонал для створення ботів.

- До речі, у межах вашого проєкту люди перевіряють те, що видалив бот?

- Іноді до нас звертаються адміністратори, якщо бот видаляє якесь повідомлення випадково. Ми вивчаємо, що сталося і як це виправити. Але як такої ручної модерації у нас немає.

- Плануєте додати таку функцію?

- Так, до нас звертались адміністратори з пропозицією запуску інструменту, який дозволив би маркувати певні повідомлення безпосередньо у чаті як небезпечні. А ми вже тоді б створювали нові фільтри для бота і одразу б видаляли такі коментарі.

ПРО ЦЕНЗУРУ ТА ЕФЕКТИВНІСТЬ ВИКОРИСТАННЯ UA ANTI SPAM BOT

- Розкажіть детальніше, як співпрацюєте з адміністраторами чатів та груп у Телеграмі?

- Якщо говорити конкретно про навчання, то бот самостійно повідомляє про те, що він робить, і надає інструкцію. Також ми створили спеціальне відео, в якому детально розповідаємо, навіщо потрібен наш бот та як його використовувати.

Про нас розповідають медіа. Про нас розповідають адміністратори один одному. Ми ніколи не купували рекламу. Тільки-но ми запускаємо новий функціонал і повідомляємо про це через ЗМІ, про нас одразу ж дізнаються користувачі. Взагалі кожна нова функція приводить до нас нових користувачів.

- Які саме групи та чати найчастіше встановлюють бот? Це популярні пабліки-“мільйонники” чи навпаки більш локальні групи?

- Як правило, це регіональні групи і тематичні канали, які об’єднують людей за певними інтересами. Наш пріоритет насправді – це групи та канали з великою кількістю користувачів.

Маємо на меті досягти того, щоб наш бот використовували усі найбільші українські групи й канали.

- Як оцінюєте ефективність роботи бота? Чи можливо побороти засилля спаму та дезінформації у тому ж таки Телеграмі?

- Єдине, що може заважити роботі бота – наявність лімітів, про які я вже казав, що обмежують кількість дій, які бот може виконати за одиницю часу.

Вважаю, що UA Anti Spam Bot розв’язує проблему саме українських адміністраторів чатів та груп, з якою вони стикаються постійно – засилля спаму у коментарях. Ми фокусуємося саме на цьому і допомагаємо подолати це.

- UA Anti Spam Bot розпізнає та видаляє повідомлення з різноманітним шахрайським контентом. Чи співпрацює ваша команда з правоохоронними органами?

- Так, ми передаємо Кіберполіції інформацію про домени, які вказані в цих повідомленнях, для того, щоб провайдери їх блокували. Також передаємо інформацію про банківські карти, які вказуються у шахрайських повідомленнях. Це ми робимо, щоб банки могли заблокувати такі картки.

Але наголошую: дані про повідомлення зі стратегічною інформацією, яка стосується повномасштабного вторгнення, ми не зберігаємо.

- Про етичний бік роботи бота. Як думаєте, чи може бути така ситуація, коли бот використають для видалення повідомлень, що не стосуються неприйнятного контенту? Чи може він стати інструментом цензури?

- Таке можливо, звісно. Якщо навчити нейромережу на подібних повідомленнях і якщо вона еволюціонуватиме сама. Ми, коли розробляли бот, розуміли, що можемо зіштовхнутися з цією проблемою.

Тому використовуємо контрольоване навчання. Ми самі визначаємо, коли нейромережа навчається, перевіряємо її метрики, щоб вона не могла навчитися самостійно. Також наш функціонал розділений на окремі модулі, які відповідають за певний вид контенту. Тобто “шахрайський” модуль не видаляє стратегічну інформацію і навпаки. Цей підхід нам дозволяє дуже легко розширити функціонал бота та підтримувати його роботу.

Для того, щоб бот видаляв певні повідомлення, ми маємо самі його навчити це робити. Орієнтуємося на рекомендації державних органів щодо того, який контент може бути шкідливим у воєнний час.

ПРО МАЙБУТНЄ МЕСЕНДЖЕРІВ ТА СОЦМЕРЕЖ

- Ви вже пояснювали, чому обрали Телеграм для реалізації своєї ініціативи. Та чи є у планах команди охоплення інших соцмереж або месенджерів? Можливо, розглядаєте ідею розробки подібних до UA Anti Spam Bot інструментів, які створені з урахуванням особливостей Фейсбуку чи Вайберу?

- Теоретично розширити роботу нашого інструменту можна на будь-яку платформу. Ми поки що цього не плануємо, оскільки, знову ж таки, той же Фейсбук має власні алгоритми модерації.

Якщо казати про Вайбер, то ми вивчали питання, як можна імплементувати наше рішення в цьому месенджері. Але, на мою думку, проблема, яку розв’язує наш бот, більш актуальна для Телеграму, ніж для Вайберу. Тому фокусуємося на боротьбі зі спамом у коментарях саме в Телеграмі.

- Я дуже часто помічаю, що в коментарях у групах чи у чатах пишуть повідомлення не живі люді, а боти. Досить часто таких ботів декілька і вони ледь не спілкуються один з одним. На вашу думку, чи може на нас чекати таке майбутнє, коли використання ботів буде неконтрольованим і, наприклад, Телеграм перетвориться на месенджер, де боти спілкуються з ботами?

- В першу чергу, потрібно розібратися, навіщо існують месенджери. Вони призначені для спілкування. Якщо ж тільки боти писатимуть коментарі і переглядатимуть пости, то самим адміністраторам не буде сенсу створювати якийсь контент. Тоді потрібні будуть інші боти, які його створюватимуть. Але хто тоді розповідатиме про цей канал і як на нього приходитиме аудиторія? Дуже багато каналів існують за рахунок реклами. Якщо там будуть тільки боти, рекламодавці не захочуть співпрацювати з ними.

Я не бачу сенсу людям вдаватися до подібних заходів і використовувати занадто багато ботів.

- Тобто власники каналів та груп самі не зацікавлені у використанні занадто великої кількості ботів?

- На мою думку, так, не зацікавлені. Водночас вважаю, що за ботами майбутнє як за інструментами автоматичної модерації контенту. Адміністраторові потрібно спати, відпочивати, займатися іншими справами і він не зможе постійно модерувати групу або чат. Своєю чергою, автоматична модерація дозволить йому зосередитися на створенні контенту.

- Наостанок про майбутнє. Скажіть, які у вас та в команди плани стосовно розвитку проєкту? Чи варто очікувати на новий функціонал найближчим часом?

- Так, ми думаємо над тим, щоб запустити функцію, яка б дозволила видаляти російські або проросійські дезінформацію та пропаганду. Саме російські наративи. Це не так просто зробити, але у цьому є потреба. Ми бачимо, що боти маскуються під справжніх людей і поширюють багато ворожих тез. Тож зараз зосереджуємося на тому, щоб розробити інструмент, який би боровся із цим явищем. Зокрема, шукаємо партнерів поміж організацій та інституцій, які б нам допомогли розробити і впровадити таку функцію.

Анастасія Кравченко, Київ

Фото: Михайло Бублик