Podcast może przejąć twoją AI? Naukowcy ostrzegają przed nową formą cyfrowej manipulacji

Wystarczy podcast, film w internecie albo zwykłe nagranie audio, aby sztuczna inteligencja w smartfonie zaczęła wykonywać ukryte polecenia — nawet jeśli człowiek ich nie słyszy. Naukowcy alarmują, że nowa metoda ataku może pozwolić cyberprzestępcom manipulować asystentami AI i uzyskiwać dostęp do prywatnych danych użytkowników.

Badacze opisali technikę określaną jako „AudioHijack”, która wykorzystuje ukryte sygnały dźwiękowe niesłyszalne dla ludzkiego ucha, ale interpretowane przez modele sztucznej inteligencji jako komendy.

Według ekspertów problem dotyczy szczególnie nowoczesnych asystentów opartych na dużych modelach językowych (LLM), które coraz częściej posiadają częściową autonomię działania — potrafią otwierać aplikacje, analizować dokumenty, wysyłać wiadomości czy przeszukiwać dane użytkownika.

„AudioHijack uderza w warstwy rozumowania zaawansowanych modeli językowych” — alarmują autorzy badań cytowani przez Bloomberg.

Naukowcy pokazali, że odpowiednio przygotowane ukryte komunikaty mogą zostać osadzone np. w podcaście, reklamie internetowej albo materiale wideo. Człowiek słyszy zwykłe nagranie, ale system AI odbiera dodatkowe polecenia.

W praktyce może to oznaczać próbę uzyskania dostępu do prywatnych maili, kontaktów, dokumentów czy aplikacji znajdujących się na urządzeniu użytkownika.

Eksperci od cyberbezpieczeństwa podkreślają, że podobne zagrożenia były analizowane już wcześniej w kontekście inteligentnych głośników i asystentów głosowych, takich jak Amazon Alexa czy Google Assistant. Nowe badania pokazują jednak, że wraz z rozwojem generatywnej AI ryzyko może być znacznie większe.

„Modele AI stają się coraz bardziej autonomiczne, a to oznacza również nowe powierzchnie ataku” — ostrzegają analitycy zajmujący się bezpieczeństwem systemów sztucznej inteligencji.

Problem jest szczególnie poważny dlatego, że użytkownik może nawet nie zauważyć momentu przejęcia kontroli nad częścią funkcji urządzenia. Ukryte polecenia mogą zostać zakodowane w zakresie częstotliwości praktycznie niesłyszalnym dla człowieka.

Badacze z Cornell University oraz innych ośrodków akademickich już wcześniej publikowali prace pokazujące możliwość manipulowania systemami rozpoznawania mowy za pomocą ukrytych sygnałów audio.

Firmy technologiczne zapewniają, że rozwijają dodatkowe zabezpieczenia dla systemów AI. Coraz więcej ekspertów uważa jednak, że wyścig pomiędzy twórcami sztucznej inteligencji a cyberprzestępcami dopiero się rozpoczyna.

Dla zwykłych użytkowników oznacza to jedno: przyszłe zagrożenia cyfrowe mogą być znacznie mniej widoczne niż klasyczne wirusy czy phishing. Czasem wystarczy po prostu… włączyć podcast.

mp/Bloomberg, arXiv, Cornell University, Fronda.pl