Трафик из отдельных приложений Android обнаружен с точностью до 97%

Новый алгоритм машинного обучения может обнаружить, когда Вы используете определенное приложение, такое как YouTube, Instagram, Spotify и другие. Итальянские ученые говорят, что они разработали алгоритм, который может определять закономерности активности приложений Android внутри трафика Tor с точностью до 97%.

Работа исследователей из римского университета Сапиенца в Италии основана на предыдущих исследованиях, которые позволили проанализировать потоки TCP-пакетов трафика Tor и выделить восемь типов трафика: просмотр, электронная почта, чат, потоковое аудио, потоковое видео, передача файлов, VoIP и P2P.

  • В своей работе итальянские исследователи применили аналогичную концепцию анализа TCP-пакетов, проходящих через соединение Tor, для обнаружения шаблонов, характерных для определенных приложений Android.
  • Затем они разработали алгоритм машинного обучения, который они обучили, используя шаблоны трафика Tor для десяти приложений: приложения Tor Browser для Android, Instagram, Facebook, Skype, uTorrent, Spotify, Twitch, YouTube, DailyMotion и Replaio Radio.
  • С помощью обученного алгоритма они смогли указать его на трафик Tor и определять, когда пользователь использует одно из десяти приложений. Результаты испытаний показали точность алгоритма 97,3 процента.

Однако механизм, который они разработали, не так совершенен и эффективен, как кажется. Начнем с того, что его можно использовать только в том случае, если на канале связи отсутствует фоновый шум трафика, то есть он работает только тогда, когда пользователь использует свое мобильное устройство с одним приложением, и больше ничего.

Если в фоновом режиме телефона одновременно работает слишком много приложений, шаблоны трафика TCP запутываются и эффективность алгоритма падает.

Во-вторых, есть еще проблемы с точностью некоторых результатов. Например, потоковые приложения, такие как Spotify или YouTube, генерируют похожие схемы трафика, что приводит к ложным срабатываниям.

Также существует проблема с длительными периодами «бездействия» для таких приложений, как Facebook, Instagram и приложение Tor Browser, так как пользовательская активность замолкает, когда они просматривают доступный контент.

Поскольку в будущих экспериментах будет учитываться больше приложений, будут появляться похожие проблемы, что увеличивает вероятность ложных срабатываний и снижает общую точность.

Исследователи заявили, что планируют выпустить код своего алгоритма.

Вернуться к началу