Трафик из отдельных приложений Android обнаружен с точностью до 97%
Новый алгоритм машинного обучения может обнаружить, когда Вы используете определенное приложение, такое как YouTube, Instagram, Spotify и другие. Итальянские ученые говорят, что они разработали алгоритм, который может определять закономерности активности приложений Android внутри трафика Tor с точностью до 97%.
Работа исследователей из римского университета Сапиенца в Италии основана на предыдущих исследованиях, которые позволили проанализировать потоки TCP-пакетов трафика Tor и выделить восемь типов трафика: просмотр, электронная почта, чат, потоковое аудио, потоковое видео, передача файлов, VoIP и P2P.
- В своей работе итальянские исследователи применили аналогичную концепцию анализа TCP-пакетов, проходящих через соединение Tor, для обнаружения шаблонов, характерных для определенных приложений Android.
- Затем они разработали алгоритм машинного обучения, который они обучили, используя шаблоны трафика Tor для десяти приложений: приложения Tor Browser для Android, Instagram, Facebook, Skype, uTorrent, Spotify, Twitch, YouTube, DailyMotion и Replaio Radio.
- С помощью обученного алгоритма они смогли указать его на трафик Tor и определять, когда пользователь использует одно из десяти приложений. Результаты испытаний показали точность алгоритма 97,3 процента.
Однако механизм, который они разработали, не так совершенен и эффективен, как кажется. Начнем с того, что его можно использовать только в том случае, если на канале связи отсутствует фоновый шум трафика, то есть он работает только тогда, когда пользователь использует свое мобильное устройство с одним приложением, и больше ничего.
Если в фоновом режиме телефона одновременно работает слишком много приложений, шаблоны трафика TCP запутываются и эффективность алгоритма падает.
Во-вторых, есть еще проблемы с точностью некоторых результатов. Например, потоковые приложения, такие как Spotify или YouTube, генерируют похожие схемы трафика, что приводит к ложным срабатываниям.
Также существует проблема с длительными периодами «бездействия» для таких приложений, как Facebook, Instagram и приложение Tor Browser, так как пользовательская активность замолкает, когда они просматривают доступный контент.
Поскольку в будущих экспериментах будет учитываться больше приложений, будут появляться похожие проблемы, что увеличивает вероятность ложных срабатываний и снижает общую точность.
Исследователи заявили, что планируют выпустить код своего алгоритма.