Dzięki owocnej współpracy między nauczycielami języków obcych i specjalistami w dziedzinie uczenia maszynowego, nowa aplikacja opracowana przez naukowców z Uniwersytetu Wschodniej Finlandii i Uniwersytetu Linneusza w Szwecji będzie w stanie wykryć boty na Twitterze w dowolnym języku

W ostatnich latach wiele danych pochodzących z różnych aplikacji społecznościowych przekształciło sieć w generowane przez użytkowników składnice informacji w coraz większej liczbie obszarów. Ze względu na stosunkowo łatwy dostęp do tweetów i ich metadanych, Twitter stał się popularnym źródłem wykorzystywanym do badań wielu zjawisk. Należą do nich na przykład różne kampanie polityczne, przewroty społeczne i polityczne oraz wykorzystywanie danych z mediów społecznościowych do prognozowania cen na giełdzie.

Nowa aplikacja poprawi jakość danych

Jednak badania wykorzystujące dane z social media są często zniekształcone przez obecność botów. Boty to nieosobowe i zautomatyzowane konta, które publikują treści w internetowych sieciach społecznościowych. Popularność Twittera jako instrumentu debaty publicznej doprowadziła do sytuacji, w której stał się on idealnym celem spamerów i zautomatyzowanych skryptów. Szacuje się, że około 5 – 10 proc. wszystkich użytkowników to boty. Tego rodzaju konta generują około 20 – 25 proc. wszystkich opublikowanych tweetów.

Naukowcy zajmujący się humanistyką cyfrową na Uniwersytecie Wschodniej Finlandii i Uniwersytecie Linneusza w Szwecji opracowali nową aplikację, która wykorzystuje uczenie maszynowe w celu wykrywania botów na Twitterze. Aplikacja jest w stanie wykryć wygenerowane automatycznie tweety niezależnie od używanego języka. Naukowcy przeanalizowali 15 tys. tweetów w języku fińskim, szwedzkim i angielskim. Fińskie i szwedzkie tweety były używane głównie do szkolenia, zaś tych w języku angielskim używano do oceny niezależności językowej aplikacji. Aplikacja umożliwia szybkie i względne klasyfikowanie dużych ilości danych.

„To poprawia jakość danych i przedstawia dokładniejszy obraz rzeczywistości” – zauważa profesor języka angielskiego Mikko Laitinen z Uniwersytetu Wschodniej Finlandii.

Według profesora Laitinena boty są stosunkowo nieszkodliwe. To trolle szkodzą, rozpowszechniając fałszywe wiadomości. Dlatego istnieje potrzeba coraz bardziej zaawansowanych narzędzi do monitorowania mediów społecznościowych.

„Jest to złożony problem i wymaga interdyscyplinarnego podejścia. Na przykład my, językoznawcy, współpracujemy ze specjalistami w zakresie uczenia maszynowego. Ten rodzaj pracy wymaga również determinacji i inwestycji w infrastrukturę badawczą”.

Zdaniem profesora Laitinena ważne jest, aby naukowcy mieli dostęp do danych pochodzących z social media.

„Obecnie dane są własnością amerykańskich konglomeratów technologicznych i źródłem ich dochodów. Aby naukowcy mogli uzyskać dostęp do tych danych, potrzebna jest współpraca na poziomie krajowym i międzynarodowym, a zwłaszcza zaangażowanie UE”.

Źródło: phys.org