Archiwa: LLM - Strona 3 z 11 - Security Bez Tabu

10 aktywnych technik pośredniego prompt injection zagraża agentom AI

Cybersecurity news

Wprowadzenie do problemu / definicja

Pośredni prompt injection to klasa ataków na systemy sztucznej inteligencji, w której złośliwe instrukcje nie są przekazywane modelowi bezpośrednio przez użytkownika, lecz ukrywane w zewnętrznych źródłach danych. Mogą to być strony internetowe, dokumenty, wiadomości e-mail, bazy wiedzy czy repozytoria treści, które agent AI pobiera i analizuje w toku wykonywania zadania.

Problem pojawia się wtedy, gdy model lub aplikacja nie potrafią jednoznacznie oddzielić danych od instrukcji. W efekcie agent może uznać fragment obcej treści za wiążące polecenie operacyjne, co prowadzi do zmiany logiki działania, obejścia zabezpieczeń lub wykonania nieautoryzowanych akcji.

W skrócie

Badacze zidentyfikowali 10 rzeczywistych przypadków pośredniego prompt injection wykorzystywanych przeciwko agentom AI. To ważny sygnał dla rynku, ponieważ pokazuje, że zagrożenie nie jest już wyłącznie koncepcją badawczą, ale praktycznym wektorem ataku obserwowanym w realnych treściach dostępnych dla systemów LLM.

  • Ataki były osadzane w treściach zewnętrznych dostępnych dla agentów AI.
  • Celem było przejęcie kontroli nad logiką działania modelu lub narzędzi.
  • Skutki mogły obejmować wyciek danych, kradzież kluczy API, manipulację odpowiedziami i nieautoryzowane działania.
  • Najbardziej narażone są systemy RAG i agenci z dostępem do narzędzi wykonawczych.

Kontekst / historia

Prompt injection od dawna znajduje się w centrum zainteresowania środowiska bezpieczeństwa AI, jednak początkowo uwaga skupiała się głównie na atakach bezpośrednich. W takim modelu użytkownik jawnie próbuje skłonić system do złamania reguł działania, ominięcia polityk lub ujawnienia informacji.

Sytuacja zmieniła się wraz z upowszechnieniem architektur RAG, agentów AI oraz integracji z pocztą, przeglądarkami, repozytoriami kodu i systemami biznesowymi. Modele coraz częściej operują na nieufnych danych pochodzących z otoczenia, a to znacząco zwiększa powierzchnię ataku. W takim środowisku zagrożeniem staje się nie tylko użytkownik, ale również każdy dokument lub zasób, który może zostać pobrany do kontekstu modelu.

Najnowsze ustalenia pokazują, że atakujący potrafią projektować treści tak, aby zostały skutecznie odnalezione przez mechanizmy wyszukiwania i retrievalu, a następnie wykonane przez model jako część procesu decyzyjnego. To przesuwa problem z poziomu filtrowania promptów wejściowych na poziom całego łańcucha przetwarzania informacji.

Analiza techniczna

Techniczny fundament pośredniego prompt injection wynika z braku ścisłej granicy między danymi a instrukcjami. Jeśli aplikacja przekazuje modelowi treści pobrane z Internetu, dokumentów lub systemów wewnętrznych, model może potraktować zawarte tam komendy jako istotne wskazówki operacyjne.

Badania wskazują, że złośliwe ładunki są konstruowane w sposób zwiększający ich szansę na pobranie przez mechanizmy retrievalu. W praktyce mogą składać się z fragmentu wyzwalającego, który podnosi prawdopodobieństwo odnalezienia dokumentu, oraz z części właściwej, zawierającej instrukcję atakującą. Taka konstrukcja sprawia, że niebezpieczna treść może trafić do kontekstu modelu nawet przy pozornie neutralnym zapytaniu użytkownika.

Skuteczność ataku zależy od kilku czynników technicznych:

  • sposobu indeksowania i wyszukiwania treści,
  • jakości wyszukiwania semantycznego,
  • reguł łączenia kontekstu przez aplikację,
  • hierarchii instrukcji systemowych i użytkownika,
  • zakresu uprawnień przypisanych agentowi.

Jeśli agent może korzystać z poczty, API, plików, sekretów aplikacyjnych lub systemów administracyjnych, pojedyncza skuteczna iniekcja może przełożyć się na pełnoprawny incydent bezpieczeństwa. Dodatkowym problemem pozostaje wysoki poziom fałszywych alarmów, ponieważ wiele wzorców przypominających prompt injection występuje również w materiałach edukacyjnych i badawczych. To sprawia, że skuteczna detekcja wymaga łączenia sygnatur, analizy semantycznej i ręcznej walidacji.

Konsekwencje / ryzyko

Najpoważniejsze ryzyko polega na tym, że napastnik nie musi mieć bezpośredniego dostępu do interfejsu aplikacji. Wystarczy, że agent AI pobierze wcześniej przygotowaną treść i przetworzy ją jako część kontekstu. Taki scenariusz może prowadzić do ujawnienia danych, historii rozmów, tokenów dostępowych, kluczy API i innych informacji wrażliwych.

W środowiskach firmowych skutki mogą być jeszcze poważniejsze. Agent zintegrowany z systemami biznesowymi może zostać zmanipulowany do wysyłki wiadomości, modyfikacji plików, przekazywania informacji osobom nieuprawnionym, generowania fałszywych rekomendacji lub zakłócania procesów operacyjnych. Szczególnie wysokie ryzyko dotyczy platform, które łączą model z pamięcią długoterminową, narzędziami wykonawczymi i nieufnymi źródłami danych.

  • Wycieki sekretów i danych poufnych
  • Manipulacja odpowiedziami i analizami modelu
  • Przejęcie logiki wykonywania zadań
  • Nieautoryzowane operacje w systemach zewnętrznych
  • Wpływ na decyzje biznesowe i operacyjne

Rekomendacje

Organizacje wdrażające agentów AI powinny przyjąć, że pośredni prompt injection jest realnym i trwałym elementem krajobrazu zagrożeń. Obrona nie może opierać się na pojedynczym filtrze, lecz powinna wykorzystywać podejście defense-in-depth.

Kluczowe znaczenie ma rozdzielanie zaufanych instrukcji systemowych od nieufnych danych pobieranych z zewnątrz. Treści z Internetu, poczty, dokumentów i repozytoriów powinny być wyraźnie oznaczane oraz izolowane, tak aby nie wpływały bezpośrednio na planowanie działań modelu.

Równie istotna jest zasada najmniejszych uprawnień. Agent powinien mieć tylko taki dostęp do narzędzi, danych i sekretów, jaki jest absolutnie niezbędny do wykonania konkretnego zadania. Operacje wysokiego ryzyka, takie jak eksport danych, wysyłka wiadomości, transakcje czy działania administracyjne, powinny wymagać dodatkowego zatwierdzenia przez człowieka.

  • Izolowanie nieufnych danych od warstwy instrukcyjnej
  • Ograniczanie uprawnień agentów i konektorów
  • Wymuszanie potwierdzeń dla działań wysokiego ryzyka
  • Monitorowanie anomalii i odchyleń w zachowaniu agenta
  • Testowanie odporności poprzez red teaming i symulacje ataków
  • Stosowanie piaskownic wykonawczych i kontroli przepływu informacji

Podsumowanie

Wykrycie 10 aktywnych technik pośredniego prompt injection pokazuje, że ataki na agentów AI wkroczyły w fazę praktycznego zastosowania. To już nie tylko zagadnienie akademickie, ale realny problem bezpieczeństwa dla organizacji wdrażających systemy LLM z dostępem do zewnętrznych źródeł danych i narzędzi wykonawczych.

Wraz ze wzrostem autonomii agentów rośnie znaczenie ochrony przed manipulacją kontekstem. Firmy powinny traktować pośredni prompt injection jako jeden z kluczowych wektorów ataku nowej generacji i odpowiednio projektować architekturę bezpieczeństwa swoich aplikacji AI.

Źródła

  1. Researchers Uncover 10 In-the-Wild Prompt Injection Payloads Targeting AI Agents — https://www.infosecurity-magazine.com/news/researchers-10-wild-indirect/
  2. Overcoming the Retrieval Barrier: Indirect Prompt Injection in the Wild for LLM Systems — https://arxiv.org/abs/2601.07072
  3. Defend against indirect prompt injection attacks — https://learn.microsoft.com/en-us/security/zero-trstricted”>https://learn.microsoft.com/en-us/security/zero-trust/sfi/defend-indirect-prompt-injection
  4. Understanding prompt injections — https://openai.com/safety/prompt-injections/
  5. AI threats in the wild: The current state of prompt injections on the web — https://security.googleblog.com/2026/04/ai-threats-in-wild-current-state-of.html

Zatruwanie pamięci agentów AI: trwałe zagrożenie dla systemów opartych na LLM

Cybersecurity news

Wprowadzenie do problemu / definicja

Mechanizmy pamięci w agentach AI mają zwiększać skuteczność modeli językowych poprzez przechowywanie preferencji użytkownika, kontekstu pracy i informacji potrzebnych w kolejnych sesjach. To jednak tworzy nową powierzchnię ataku. Jeśli napastnik zmodyfikuje plik pamięci lub inne dane kontekstowe, agent może wykonywać szkodliwe instrukcje nie tylko jednorazowo, ale również w sposób trwały, wpływając na przyszłe działania systemu.

W praktyce oznacza to przejście od incydentów sesyjnych do trwałej kompromitacji stanu operacyjnego agenta. Problem nie dotyczy wyłącznie jednego narzędzia, lecz całej klasy rozwiązań wykorzystujących pamięć długoterminową, warstwy orkiestracji i integracje z zewnętrznymi źródłami danych.

W skrócie

Zatrucie pamięci agentów AI polega na wprowadzeniu złośliwych instrukcji do plików lub artefaktów, które później są ponownie ładowane do kontekstu modelu. W efekcie agent może przez długi czas podejmować decyzje zgodne z intencją napastnika, mimo że sam model bazowy pozostaje bezstanowy.

  • atak może utrzymywać się między sesjami i projektami,
  • złośliwe instrukcje mogą wpływać na generowany kod i decyzje operacyjne,
  • ryzyko obejmuje wybór niebezpiecznych pakietów, osłabienie konfiguracji i propagację błędów,
  • zagrożenie dotyczy pamięci, plików tekstowych, konfiguracji oraz danych kontekstowych używanych przez agentów AI.

Kontekst / historia

W ostatnim czasie bezpieczeństwo agentów AI stało się jednym z kluczowych tematów w obszarze AppSec i ochrony łańcucha dostaw oprogramowania. Wraz z popularyzacją asystentów kodowania i narzędzi opartych na LLM pojawiły się nowe klasy zagrożeń, takie jak prompt injection, zatrucie kontekstu, manipulacja pamięcią długoterminową i nadużycia integracji z usługami zewnętrznymi.

Badania opisujące kompromitację plików pamięci wykorzystywanych przez asystentów AI pokazały, że atak nie musi kończyć się na pojedynczym wywołaniu modelu. Po zapisaniu złośliwej treści do pamięci system może odtwarzać ją w kolejnych sesjach, projektach lub interakcjach użytkownika. To znacząco zwiększa trwałość ataku i utrudnia jego wykrycie.

Analiza techniczna

Modele bazowe są z natury bezstanowe, dlatego ciągłość działania agentów wymaga dostarczania im stanu z dodatkowych warstw, takich jak pliki pamięci, bazy wektorowe, systemy RAG, adaptery czy konfiguracje projektowe. Każdy z tych elementów może stać się nośnikiem nieautoryzowanych instrukcji.

W analizowanych scenariuszach wektorem wejścia były między innymi mechanizmy post-install hook w ekosystemie pakietów, które pozwalały modyfikować pliki pamięci używane przez narzędzia AI. Jeśli taka zawartość trafia następnie do system promptu lub uprzywilejowanego kontekstu, model może potraktować złośliwy tekst jako zaufaną instrukcję operacyjną.

To podejście jest groźne, ponieważ szkodliwy komponent nie musi mieć postaci klasycznego kodu wykonywalnego. Wystarczy odpowiednio sformułowany tekst, który warstwa orkiestracji zinterpretuje jako część stanu systemu. Podatne mogą być więc nie tylko dedykowane pliki pamięci, ale także pliki Markdown, zależności, dokumentacja projektowa czy reguły pracy modelu.

Z perspektywy architektury bezpieczeństwa jest to rozszerzenie znanego problemu prompt injection. Różnica polega na trwałości oraz na tym, że zainfekowany kanał może być traktowany przez system jako zaufany. W rezultacie memory poisoning staje się formą trwałego skażenia środowiska roboczego agenta, a nie jedynie jednorazową manipulacją odpowiedzią.

Konsekwencje / ryzyko

Największym zagrożeniem jest utrata integralności działań agenta AI. Organizacja może przez długi czas nie zauważyć, że model podejmuje decyzje zgodne z logiką zaszytą przez napastnika, a nie z polityką bezpieczeństwa firmy.

W środowiskach deweloperskich skutki mogą być szczególnie dotkliwe, ponieważ agenci często mają dostęp do kodu, repozytoriów, konfiguracji CI/CD, zależności i pośrednio do danych wrażliwych. Zatruta pamięć może prowadzić do wdrażania ryzykownych bibliotek, osłabienia konfiguracji bezpieczeństwa, wprowadzania poufnych danych do kodu lub dokumentacji oraz propagacji niepoprawnych zmian na inne zespoły.

Problemem pozostaje także niska widoczność incydentu. Złośliwe instrukcje mogą wyglądać jak zwykła zawartość tekstowa w pozornie nieszkodliwym pliku. Im dłużej pamięć jest przechowywana i rzadziej weryfikowana, tym większa szansa, że atak pozostanie aktywny przez wiele dni lub tygodni.

Rekomendacje

Organizacje wdrażające agentów AI powinny traktować pliki pamięci, dane kontekstowe i artefakty sterujące jako zasoby wysokiego ryzyka. Wymagają one podobnych kontroli jak konfiguracje bezpieczeństwa, skrypty startowe czy komponenty łańcucha dostaw.

  • wdrożenie kontroli integralności plików pamięci i ich wersjonowania,
  • regularne przeglądy bezpieczeństwa oraz monitoring zmian w artefaktach kontekstowych,
  • skanowanie zależności, hooków instalacyjnych i konfiguracji pod kątem nieautoryzowanych modyfikacji,
  • ograniczenie retencji pamięci i okresowe czyszczenie stanu długoterminowego,
  • odbudowa pamięci wyłącznie z zaufanych źródeł po wykryciu anomalii,
  • separacja uprawnień i ograniczenie dostępu agenta do systemów wysokiego ryzyka,
  • wymaganie zatwierdzenia człowieka dla działań o wysokim wpływie operacyjnym.

W praktyce zespoły bezpieczeństwa powinny przyjąć, że każdy plik tekstowy dołączany do kontekstu modelu może stać się wektorem ataku. Ochrona agentów AI nie może więc ograniczać się do samego modelu, lecz musi obejmować także stan, pamięć i warstwę orkiestracji.

Podsumowanie

Zatrucie pamięci agentów AI to jedno z najpoważniejszych i nadal niedoszacowanych zagrożeń w bezpieczeństwie systemów opartych na LLM. Mechanizmy, które mają poprawiać użyteczność i personalizację, jednocześnie tworzą trwały kanał wpływu na zachowanie modelu.

Dla organizacji oznacza to konieczność rozszerzenia klasycznego podejścia do AppSec i supply chain security o nowe klasy artefaktów: pliki pamięci, dane kontekstowe oraz logikę orkiestracji agentów. W najbliższych latach to właśnie ochrona stanu operacyjnego agentów może stać się jednym z kluczowych warunków bezpiecznego wdrażania AI w środowiskach produkcyjnych.

Źródła

  1. Bad Memories Still Haunt AI Agents — https://www.darkreading.com/vulnerabilities-threats/bad-memories-haunt-ai-agents
  2. Cisco: Weaponizing AI Assistant Memories: Prompt Injection & Persistence in Anthropic Claude Code — https://blogs.cisco.com/security/weaponizing-ai-assistant-memories-prompt-injection-persistence-in-anthropic-claude-code
  3. Palo Alto Networks Unit 42: Context Manipulation Attacks in AI Agents — https://unit42.paloaltonetworks.com/context-manipulation-attacks-ai-agents/
  4. Princeton University / Sentient AI: Emergent Misalignment from Memory Poisoning — https://arxiv.org/abs/2502.17424
  5. Open Worldwide Application Security Project: OWASP Top 10 for LLM Applications — https://owasp.org/www-project-top-10-for-large-language-model-applications/

Krytyczna luka CVE-2026-5760 w SGLang umożliwia zdalne wykonanie kodu przez złośliwe modele GGUF

Cybersecurity news

Wprowadzenie do problemu / definicja

W ekosystemie narzędzi do serwowania modeli językowych coraz większe znaczenie ma bezpieczeństwo łańcucha dostaw modeli AI. Krytyczna podatność CVE-2026-5760 w projekcie SGLang pokazuje, że model może być nie tylko nośnikiem danych, ale również aktywnym wektorem ataku prowadzącym do zdalnego wykonania kodu na serwerze inferencyjnym.

Problem dotyczy obsługi spreparowanych plików GGUF zawierających złośliwy wpis tokenizer.chat_template. W określonych warunkach taki artefakt może doprowadzić do wykonania dowolnego kodu Pythona w kontekście procesu SGLang.

W skrócie

  • CVE-2026-5760 otrzymała krytyczną ocenę CVSS 9.8.
  • Luka dotyczy frameworka SGLang używanego do uruchamiania modeli LLM i modeli multimodalnych.
  • Wektor ataku obejmuje endpoint /v1/rerank oraz złośliwie przygotowany plik GGUF.
  • Źródłem problemu jest renderowanie szablonów Jinja2 bez odpowiedniego sandboxingu.
  • Skutkiem może być zdalne wykonanie kodu, kradzież sekretów i przejęcie serwera inferencyjnego.

Kontekst / historia

SGLang zyskał popularność jako wydajny framework open source do obsługi nowoczesnych obciążeń AI. Wraz ze wzrostem skali wdrożeń rośnie jednak powierzchnia ataku związana z importem modeli, tokenizerów oraz szablonów promptów pochodzących z zewnętrznych repozytoriów.

CVE-2026-5760 wpisuje się w szerszą klasę błędów wynikających z traktowania artefaktów modeli jako pasywnych i zaufanych danych. W praktyce metadane modelu, szablony czatu i inne elementy konfiguracyjne mogą zostać wykorzystane do uruchomienia niepożądanej logiki, jeśli aplikacja interpretuje je bez odpowiednich zabezpieczeń.

To ważna zmiana perspektywy dla zespołów bezpieczeństwa: ryzyko nie ogranicza się już wyłącznie do bibliotek, kontenerów czy zależności, ale obejmuje także same modele AI i ich osadzone metadane.

Analiza techniczna

Istota podatności sprowadza się do użycia środowiska Jinja2 bez izolacji podczas renderowania szablonu czatu. Atakujący może przygotować plik GGUF zawierający złośliwy parametr tokenizer.chat_template, w którym osadza ładunek typu server-side template injection.

Po załadowaniu takiego modelu do SGLang i wywołaniu endpointu /v1/rerank aplikacja odczytuje szablon i renderuje go w kontekście procesu serwera. Jeśli warunki wykonania zostaną spełnione, złośliwy szablon może uruchomić arbitralny kod Pythona, co prowadzi do pełnego zdalnego wykonania kodu na hoście inferencyjnym.

Technicznie problem wynika z połączenia dwóch niebezpiecznych założeń. Po pierwsze, metadane modelu zostały potraktowane jako zaufana konfiguracja. Po drugie, silnik szablonów został wykorzystany w sposób umożliwiający wykonanie niekontrolowanych instrukcji. Taki scenariusz jest szczególnie groźny tam, gdzie serwer AI ma dostęp do kluczy API, systemu plików, sieci wewnętrznej lub innych usług produkcyjnych.

Atak nie musi być dostarczony klasycznym exploitem w pojedynczym żądaniu HTTP. Ładunek może zostać wniesiony wcześniej wraz z modelem, a aktywacja następuje dopiero podczas obsługi konkretnego workflow. To utrudnia detekcję i zwiększa ryzyko przeoczenia kompromitującego artefaktu.

Konsekwencje / ryzyko

Najpoważniejszym skutkiem podatności jest zdalne wykonanie kodu w kontekście usługi SGLang. W praktyce może to oznaczać przejęcie serwera inferencyjnego, wyciek sekretów środowiskowych, modyfikację modeli, instalację mechanizmów trwałego dostępu oraz dalsze przemieszczanie się napastnika po infrastrukturze.

Szczególnie wysokie ryzyko występuje w organizacjach, które:

  • korzystają z publicznych lub społecznościowych repozytoriów modeli,
  • wdrażają modele bez walidacji metadanych i procesu zatwierdzania,
  • udostępniają endpointy rerankingu w środowiskach produkcyjnych,
  • uruchamiają inferencję z szerokimi uprawnieniami systemowymi,
  • integrują serwery modeli z bazami wiedzy, pipeline’ami CI/CD lub danymi wrażliwymi.

Z perspektywy bezpieczeństwa jest to problem z obszaru AI supply chain. Zamiast kompromitować bibliotekę lub obraz kontenera, napastnik może dostarczyć złośliwy artefakt modelu, który zostanie uznany za legalny zasób operacyjny.

Rekomendacje

Organizacje korzystające z SGLang powinny jak najszybciej zidentyfikować wszystkie instancje obsługujące endpoint /v1/rerank i ładujące modele GGUF z zewnętrznych źródeł. Każdy niezweryfikowany model należy traktować jako potencjalnie złośliwy.

  • zrezygnować z renderowania szablonów w niesandboxowanym środowisku Jinja2,
  • wdrożyć bezpieczny mechanizm izolacji szablonów,
  • ograniczyć lub całkowicie zablokować ładowanie modeli z niezaufanych źródeł,
  • traktować pliki GGUF i metadane tokenizerów jako nieufne wejście,
  • wdrożyć formalny proces zatwierdzania modeli z kontrolą pochodzenia i skanowaniem metadanych,
  • uruchamiać serwery inferencyjne z minimalnymi uprawnieniami,
  • segmentować sieciowo infrastrukturę AI i ograniczyć ruch wychodzący,
  • monitorować nietypowe procesy, operacje na plikach i połączenia sieciowe z instancji SGLang,
  • przeprowadzić przegląd logów pod kątem anomalii po załadowaniu nowych modeli.

W środowiskach o podwyższonym profilu ryzyka warto dodatkowo stosować izolację kontenerową, polityki seccomp lub AppArmor, rozwiązania EDR na hostach GPU oraz kontrolę integralności artefaktów modeli. Jeżeli pochodzenie już wdrożonych modeli budzi wątpliwości, należy rozważyć ich ponowną walidację oraz rotację sekretów dostępnych dla usługi.

Podsumowanie

CVE-2026-5760 pokazuje, że bezpieczeństwo platform AI nie kończy się na API i bibliotece inferencyjnej. Równie istotne są metadane modeli, tokenizerów i szablonów promptów, które mogą stać się pełnoprawnym wektorem ataku prowadzącym do zdalnego wykonania kodu.

Dla zespołów bezpieczeństwa to wyraźny sygnał, że modele AI należy traktować jak potencjalnie niebezpieczne artefakty software’owe. Bez kontroli pochodzenia, walidacji zawartości i ścisłej izolacji runtime łańcuch dostaw AI może stać się jednym z najłatwiejszych punktów wejścia do infrastruktury.

Źródła

  1. The Hacker News — SGLang CVE-2026-5760 (CVSS 9.8) Enables RCE via Malicious GGUF Model Files — https://thehackernews.com/2026/04/sglang-cve-2026-5760-cvss-98-enables.html
  2. CVE Program — CVE-2026-5760 — https://www.cve.org/CVERecord?id=CVE-2026-5760
  3. GitHub — sgl-project/sglang Security Advisories — https://github.com/sgl-project/sglang/security/advisories

Modele AI przyspieszają cyberataki i wzmacniają obronę organizacji

Cybersecurity news

Wprowadzenie do problemu / definicja

Rozwój modeli sztucznej inteligencji istotnie zmienia krajobraz cyberbezpieczeństwa. Nowoczesne systemy AI, w tym modele językowe i narzędzia automatyzacji, pozwalają szybciej analizować dane, generować treści, identyfikować słabe punkty oraz wspierać operacje ofensywne i defensywne. Największe wyzwanie polega na tym, że te same mechanizmy, które zwiększają skuteczność zespołów bezpieczeństwa, obniżają również próg wejścia dla cyberprzestępców i przyspieszają realizację znanych technik ataku.

W skrócie

Modele AI są coraz szerzej wykorzystywane zarówno przez obrońców, jak i przez napastników. Trend ten nie polega wyłącznie na tworzeniu całkowicie nowych metod włamań, lecz przede wszystkim na zwiększaniu szybkości, skali i automatyzacji już znanych kampanii. AI wspiera rozpoznanie, generowanie wiarygodnych wiadomości phishingowych, analizę podatności, rozwój malware oraz automatyzację działań po uzyskaniu dostępu. Jednocześnie organizacje wykorzystują AI do detekcji zagrożeń, korelacji zdarzeń, priorytetyzacji incydentów i przyspieszania reakcji.

  • AI skraca czas przygotowania i realizacji ataków.
  • Socjotechnika staje się bardziej wiarygodna i skalowalna.
  • Obrońcy zyskują lepszą widoczność i szybszy triage incydentów.
  • Największym ryzykiem jest wzrost tempa działań przeciwnika.

Kontekst / historia

W ostatnich latach sztuczna inteligencja przeszła z etapu eksperymentalnego do powszechnego zastosowania w środowiskach biznesowych i technologicznych. Wraz ze wzrostem liczby wdrożeń zwiększyła się również powierzchnia ataku związana z modelami AI, aplikacjami korzystającymi z dużych modeli językowych oraz usługami wbudowanymi w procesy biznesowe.

Raporty branżowe wskazują, że wzrost wykorzystania AI nie ogranicza się do legalnych zastosowań. Grupy przestępcze coraz częściej używają automatyzacji i modeli generatywnych do usprawnienia socjotechniki, rekonesansu, analizy podatności oraz przyspieszania kolejnych faz ataku. Równolegle dostawcy bezpieczeństwa odnotowują skracanie czasu potrzebnego napastnikom na przejście od początkowego dostępu do ruchu bocznego i eksfiltracji danych. W praktyce oznacza to, że organizacje mają coraz mniej czasu na wykrycie incydentu i jego powstrzymanie.

Analiza techniczna

Z technicznego punktu widzenia AI wzmacnia przede wszystkim operacje oparte na danych i powtarzalnych sekwencjach. Modele językowe potrafią generować przekonujące wiadomości phishingowe, personalizować treści pod konkretną ofiarę, tłumaczyć komunikację na wiele języków i tworzyć warianty omijające klasyczne filtry oparte na sygnaturach. Dzięki temu kampanie socjotechniczne stają się bardziej skalowalne i trudniejsze do odróżnienia od legalnej komunikacji.

W obszarze rozpoznania modele AI pomagają analizować duże zbiory informacji pochodzących z otwartych źródeł, repozytoriów kodu, dokumentacji technicznej i wycieków danych. Ułatwia to identyfikację technologii używanych przez cel, potencjalnych podatności, wzorców uwierzytelniania oraz relacji między systemami. Z perspektywy napastnika oznacza to krótszy czas przygotowania kampanii i bardziej precyzyjne dobieranie wektorów ataku.

AI może również wspierać rozwój złośliwego oprogramowania, choć najczęściej nie przez tworzenie całkowicie nowych rodzin malware, lecz przez przyspieszanie modyfikacji istniejącego kodu, przygotowanie skryptów pomocniczych, pakowanie narzędzi oraz automatyzację testowania działania. W praktyce modele mogą być wykorzystywane do generowania fragmentów kodu, tworzenia mechanizmów omijania prostych zabezpieczeń czy przyspieszania iteracji podczas budowy narzędzi operatorskich.

Po uzyskaniu dostępu automatyzacja oparta na AI może wspierać priorytetyzację kolejnych działań, analizę uprawnień, mapowanie środowiska i wybór najbardziej opłacalnej ścieżki ruchu bocznego. Szczególnie niebezpieczne jest połączenie AI z narzędziami automatyzującymi operacje w czasie rzeczywistym, ponieważ skraca ono okno detekcji i zwiększa tempo eskalacji incydentu.

Po stronie obronnej AI znajduje zastosowanie w systemach XDR, SIEM, SOAR, analizie behawioralnej i zarządzaniu podatnościami. Narzędzia te wykorzystują modele do korelacji zdarzeń, redukcji szumu alarmowego, wykrywania anomalii oraz automatycznego wzbogacania alertów o kontekst zagrożenia. W dobrze wdrożonym środowisku pozwala to skrócić czas triage, poprawić jakość analizy i szybciej uruchamiać procedury reagowania.

Konsekwencje / ryzyko

Najważniejszą konsekwencją wzrostu możliwości modeli AI jest industrializacja cyberataków. Oznacza to, że znane techniki stają się tańsze, szybsze i łatwiejsze do powielania. Dla organizacji przekłada się to na większą liczbę kampanii phishingowych, bardziej wiarygodne oszustwa BEC, szybsze wykorzystanie podatności oraz wyższe ryzyko utraty danych.

Istotnym zagrożeniem jest także asymetria operacyjna. Napastnik potrzebuje jednego skutecznego wejścia, natomiast obrońca musi utrzymać widoczność i kontrolę nad całym środowiskiem. Jeżeli AI skraca czas przejścia od rozpoznania do działania, nawet niewielkie opóźnienia w monitoringu, segmentacji czy reakcji mogą prowadzić do pełnoskalowego incydentu.

Dodatkowym ryzykiem jest niekontrolowane wdrażanie narzędzi AI w organizacjach. Brak inwentaryzacji aplikacji i modeli, słaba kontrola przepływu danych, niewłaściwe uprawnienia oraz ekspozycja poufnych informacji do usług zewnętrznych mogą tworzyć nowe ścieżki ataku. Dotyczy to zarówno klasycznych zagrożeń, jak i specyficznych problemów związanych z AI, takich jak prompt injection, wycieki danych przez interfejsy modeli czy nieautoryzowane użycie narzędzi generatywnych przez pracowników.

Rekomendacje

Organizacje powinny traktować AI jako element modelu ryzyka, a nie wyłącznie narzędzie produktywności. Pierwszym krokiem powinna być pełna inwentaryzacja usług, aplikacji i procesów korzystających z AI, w tym narzędzi wdrażanych oddolnie przez zespoły biznesowe. Bez tej widoczności niemożliwe jest skuteczne zarządzanie powierzchnią ataku.

Konieczne jest wdrożenie silnych mechanizmów kontroli dostępu, segmentacji sieci i zasad najmniejszych uprawnień. Ponieważ AI zwiększa tempo działań przeciwnika, szczególnego znaczenia nabiera ograniczanie możliwości ruchu bocznego oraz szybkie blokowanie nadużytych kont i tokenów.

W obszarze poczty i komunikacji należy rozwijać zabezpieczenia przed phishingiem oparte na analizie behawioralnej, uwierzytelnianiu nadawców i wykrywaniu anomalii językowych. Sama świadomość użytkowników nie wystarczy, gdy wiadomości generowane przez AI stają się coraz bardziej przekonujące.

Zespoły SOC powinny integrować automatyzację z procesami triage i response, ale z zachowaniem nadzoru człowieka nad krytycznymi decyzjami. Warto skracać czas reakcji poprzez gotowe playbooki dla scenariuszy takich jak przejęcie konta, nadużycie poświadczeń, eksfiltracja danych czy aktywność ransomware.

Niezbędne jest również regularne zarządzanie podatnościami i ograniczanie ekspozycji usług publicznych. Jeżeli przeciwnik wykorzystuje AI do szybszego skanowania i priorytetyzacji celów, opóźnienia w łataniu systemów stają się jeszcze bardziej kosztowne.

W przypadku własnych wdrożeń AI należy stosować polityki klasyfikacji danych, filtrowanie wejścia i wyjścia modeli, testy bezpieczeństwa aplikacji wykorzystujących LLM oraz monitorowanie nadużyć interfejsów API. Bezpieczne użycie AI wymaga połączenia klasycznych praktyk AppSec, governance danych i ciągłej obserwowalności.

Podsumowanie

Sztuczna inteligencja nie zmienia całkowicie podstaw cyberataków, ale znacząco zwiększa ich tempo, skalę i efektywność. To właśnie przyspieszenie istniejących technik stanowi dziś jedno z najważniejszych wyzwań dla zespołów bezpieczeństwa. Jednocześnie AI daje obrońcom realne narzędzia do poprawy widoczności, detekcji i reakcji. Kluczowe znaczenie ma więc nie samo wdrożenie technologii, lecz sposób jej kontrolowania, monitorowania i osadzania w dojrzałym modelu cyberbezpieczeństwa.

Źródła

  • https://www.infosecurity-magazine.com/news/ai-powered-cyberattacks-up/
  • https://www.infosecurity-magazine.com/news/app-exploits-surge-ai-speeds/
  • https://www.infosecurity-magazine.com/news/ai-accelerates-attack-breakout/
  • https://www.infosecurity-magazine.com/news/ai-security-threats-loom-zscaler/
  • https://www.infosecurity-magazine.com/news/ai-supercharges-attacks-cybercrime/

Project Glasswing (Anthropic): AI, Które Znajduje I Exploituje Podatności Szybciej Niż Człowiek

Nie chodzi o model. Chodzi o zmianę zasad gry

Jeśli spojrzysz na Project Glasswing jak na kolejny launch modelu AI, przeoczysz sedno. Anthropic nie zrobiło publicznej premiery „nowego Claude’a do cybera”. Zrobiło coś dużo ciekawszego: zamknęło dostęp do modelu, uruchomiło program defensywny z udziałem AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA i Palo Alto Networks, rozszerzyło dostęp na ponad 40 kolejnych organizacji utrzymujących krytyczne oprogramowanie, dorzuciło do 100 mln USD kredytów oraz zapowiedziało publiczny raport z wnioskami i poprawkami w ciągu 90 dni. To nie wygląda jak marketing produktu. To wygląda jak zarządzanie ryzykiem wokół capability, które zaczynają mieć znaczenie systemowe dla bezpieczeństwa software’u.

Czytaj dalej „Project Glasswing (Anthropic): AI, Które Znajduje I Exploituje Podatności Szybciej Niż Człowiek”

Krytyczna luka RCE w Flowise już wykorzystywana w atakach. Zagrożone są wdrożenia AI dostępne z internetu

Cybersecurity news

Wprowadzenie do problemu / definicja

Flowise, popularna platforma open source do budowy aplikacji opartych na dużych modelach językowych oraz agentach AI, znalazła się w centrum uwagi po ujawnieniu krytycznej podatności zdalnego wykonywania kodu. Luka oznaczona jako CVE-2025-59528 pozwala na wstrzyknięcie i uruchomienie kodu JavaScript bez odpowiedniej walidacji, co może prowadzić do wykonania poleceń systemowych i uzyskania dostępu do systemu plików.

Problem jest szczególnie istotny dla organizacji, które udostępniają instancje Flowise do internetu i wykorzystują tę platformę w środowiskach produkcyjnych, integrując ją z modelami AI, bazami danych, systemami SaaS oraz wewnętrznymi źródłami wiedzy.

W skrócie

  • CVE-2025-59528 to krytyczna podatność RCE w komponencie CustomMCP platformy Flowise.
  • Błąd wynika z niebezpiecznej ewaluacji danych wejściowych w parametrze konfiguracyjnym serwera MCP.
  • Poprawka została udostępniona w wersji Flowise 3.0.6.
  • W kwietniu 2026 roku odnotowano aktywne próby wykorzystania tej luki w rzeczywistych atakach.
  • Zagrożone są szczególnie publicznie dostępne i niezałatane instancje wykorzystywane do wdrożeń AI.

Kontekst / historia

Flowise zdobył popularność jako platforma low-code do projektowania przepływów pracy opartych na LLM. Dzięki interfejsowi typu drag-and-drop narzędzie jest wykorzystywane zarówno przez zespoły programistyczne, jak i przez działy biznesowe, operacyjne oraz wsparcia klienta, które chcą szybko tworzyć chatboty, asystentów AI i rozwiązania automatyzujące pracę z dokumentami.

Podatność CVE-2025-59528 została opublikowana w bazie NVD 22 września 2025 roku, natomiast poprawka pojawiła się wcześniej w wydaniu Flowise 3.0.6 z 15 września 2025 roku. Wraz z upublicznieniem szczegółów technicznych ryzyko gwałtownie wzrosło, a w 2026 roku pojawiły się potwierdzenia, że luka jest już aktywnie wykorzystywana przez napastników.

To kolejny przykład sytuacji, w której oprogramowanie open source wdrażane w środowiskach produkcyjnych staje się celem szybkich kampanii skanowania i oportunistycznych ataków tuż po ujawnieniu podatności oraz publikacji dostępnych informacji o wektorze eksploatacji.

Analiza techniczna

Źródłem problemu jest węzeł CustomMCP, używany do konfiguracji połączeń z zewnętrznym serwerem Model Context Protocol. Mechanizm ten przetwarza parametr mcpServerConfig w sposób niebezpieczny, wykonując kod JavaScript bez uprzedniej kontroli bezpieczeństwa. W praktyce prowadzi to do klasycznego scenariusza code injection i umożliwia zdalne wykonanie kodu.

Jeżeli atakujący może dostarczyć odpowiednio spreparowaną konfigurację, jest w stanie uruchomić nieautoryzowany kod w kontekście procesu aplikacji. Skutki zależą od sposobu uruchomienia Flowise, uprawnień procesu, konfiguracji kontenera oraz dostępnych integracji.

  • wykonanie poleceń w systemie operacyjnym,
  • odczyt i modyfikacja plików lokalnych,
  • kradzież sekretów aplikacyjnych i tokenów API,
  • manipulacja przepływami AI i logiką agentów,
  • wykorzystanie serwera do dalszego ruchu bocznego w sieci.

To szczególnie niebezpieczne w środowiskach, w których Flowise przechowuje klucze dostępu do modeli, baz wektorowych, usług chmurowych, repozytoriów dokumentów lub systemów firmowych. Udane wykorzystanie RCE może więc oznaczać nie tylko kompromitację samej aplikacji, ale również przejęcie powiązanych usług i danych.

Konsekwencje / ryzyko

Ryzyko związane z CVE-2025-59528 należy traktować jako krytyczne, zwłaszcza gdy Flowise jest dostępny z internetu, działa na nieaktualnej wersji i posiada dostęp do wrażliwych zasobów. Im więcej integracji z systemami zewnętrznymi i wewnętrznymi, tym większy potencjalny zasięg incydentu.

Najpoważniejszym skutkiem może być pełne przejęcie aplikacji. W praktyce oznacza to możliwość utraty poufności danych, naruszenia integralności procesów biznesowych, podmiany logiki automatyzacji, wdrożenia tylnej furtki oraz użycia zainfekowanego hosta do dalszych działań ofensywnych.

Dla organizacji korzystających z Flowise do obsługi klientów, automatyzacji pracy z dokumentami lub orkiestracji agentów AI, skutki mogą obejmować zarówno incydent bezpieczeństwa, jak i poważne zakłócenia operacyjne. Platformy AI powinny być więc traktowane jako pełnoprawny element powierzchni ataku przedsiębiorstwa.

Rekomendacje

Podstawowym działaniem jest natychmiastowa aktualizacja Flowise co najmniej do wersji 3.0.6, a najlepiej do nowszego, wspieranego wydania. Samo wdrożenie poprawki nie powinno jednak kończyć procesu reakcji, ponieważ w części środowisk mogło już dojść do prób kompromitacji.

  • zweryfikować wszystkie publicznie dostępne instancje Flowise i ustalić ich wersje,
  • ograniczyć ekspozycję usługi do internetu, jeśli zdalny dostęp nie jest konieczny,
  • wdrożyć segmentację sieci i dodatkowe kontrole dostępu do paneli administracyjnych,
  • przeprowadzić rotację kluczy API, tokenów i innych poświadczeń przechowywanych w aplikacji,
  • przeanalizować logi pod kątem zmian konfiguracji, podejrzanych żądań i nietypowych procesów,
  • zastosować zasadę najmniejszych uprawnień dla kontenerów, hostów i wolumenów,
  • wdrożyć reguły detekcyjne dla prób wstrzyknięcia kodu i anomalii w konfiguracjach MCP,
  • objąć platformy AI regularnym procesem zarządzania podatnościami i monitoringu bezpieczeństwa.

W praktyce organizacje powinny założyć, że środowiska AI przechowują cenne sekrety oraz szerokie integracje. Dlatego po wykryciu podatnej instancji konieczne jest nie tylko patchowanie, ale także ocena potencjalnej kompromitacji i zakresu dostępu, jaki mógł uzyskać napastnik.

Podsumowanie

Aktywna eksploatacja CVE-2025-59528 pokazuje, że platformy do budowy agentów AI stają się atrakcyjnym celem cyberprzestępców. Luka w Flowise umożliwia niebezpieczne wykonanie kodu przez błędną obsługę konfiguracji CustomMCP, a skutki udanego ataku mogą wykraczać daleko poza samą aplikację.

Dla zespołów bezpieczeństwa najważniejsze działania to szybka aktualizacja, ograniczenie ekspozycji do internetu, weryfikacja logów oraz rotacja sekretów. W środowiskach produkcyjnych Flowise powinien być traktowany jak krytyczny komponent infrastruktury aplikacyjnej, a nie jedynie pomocnicze narzędzie dla zespołów rozwijających rozwiązania AI.

Źródła

  1. Max severity Flowise RCE vulnerability now exploited in attacks — https://www.bleepingcomputer.com/news/security/max-severity-flowise-rce-vulnerability-now-exploited-in-attacks/
  2. NVD – CVE-2025-59528 — https://nvd.nist.gov/vuln/detail/CVE-2025-59528
  3. Flowise Releases — https://github.com/FlowiseAI/Flowise/releases
  4. FlowiseAI/Flowise Repository — https://github.com/FlowiseAI/Flowise

Atak na łańcuch dostaw GitHub z użyciem AI: kampania „prt-scan” wykorzystuje błędną konfigurację GitHub Actions

Cybersecurity news

Wprowadzenie do problemu / definicja

Ataki na łańcuch dostaw oprogramowania coraz częściej koncentrują się nie tylko na samym kodzie, ale również na procesach CI/CD. Najnowsza kampania oznaczona jako „prt-scan” pokazuje, że błędna konfiguracja GitHub Actions może stać się bezpośrednim wektorem kompromitacji repozytorium, sekretów oraz procesu publikacji pakietów.

Kluczowym elementem nadużycia jest mechanizm pull_request_target, który przy niewłaściwej implementacji może uruchamiać workflow w kontekście głównego repozytorium także dla niezaufanych pull requestów z forków. W praktyce oznacza to ryzyko kradzieży tokenów, enumeracji sekretów i prób przejęcia dalszych etapów pipeline’u.

W skrócie

Kampania „prt-scan” była zautomatyzowaną operacją wymierzoną w projekty korzystające z podatnych workflow opartych o pull_request_target. Atakujący mieli utworzyć ponad 500 złośliwych pull requestów, wykorzystując wiele kont powiązanych z jednym operatorem oraz techniki automatyzacji wspierane przez AI.

  • Celem były repozytoria GitHub z niebezpieczną konfiguracją Actions.
  • Ładunki były dopasowywane do stosu technologicznego ofiary.
  • Potwierdzono kompromitację co najmniej dwóch pakietów npm.
  • W części incydentów doszło do wycieku krótkotrwałych poświadczeń i innych sekretów CI/CD.

Kontekst / historia

Zagrożenia wobec platform developerskich i narzędzi automatyzacji budowania rosną od kilku lat, jednak kampania „prt-scan” pokazała nowy poziom skali i personalizacji ataku. W centrum problemu znalazł się trigger pull_request_target, od dawna uznawany za funkcję wymagającą szczególnej ostrożności, ponieważ działa w kontekście repozytorium bazowego i może mieć dostęp do sekretów oraz szerszych uprawnień niż standardowy pull_request.

Według ustaleń badaczy aktywność związana z kampanią rozpoczęła się 11 marca 2026 roku i trwała falami do 2–3 kwietnia 2026 roku. Publiczne ujawnienie nastąpiło 2 kwietnia 2026 roku, choć późniejsze analizy wskazały wcześniejsze testy, kolejne iteracje technik i stopniowe zwiększanie skali operacji.

To istotny sygnał dla całego ekosystemu open source. Atak nie był pojedynczym eksperymentem, lecz częścią szerszego trendu, w którym przestępcy zaczynają systematycznie eksploatować błędy konfiguracyjne w GitHub Actions jako drogę do naruszenia software supply chain.

Analiza techniczna

Schemat działania był stosunkowo prosty, ale efektywny przy dużej liczbie prób. Operator wyszukiwał repozytoria wykorzystujące pull_request_target, forkując je i tworząc gałęzie o charakterystycznym nazewnictwie. Następnie przygotowywał pull requesty zawierające złośliwe modyfikacje w plikach, które miały wysoką szansę uruchomienia podczas CI.

Wśród wykorzystywanych plików pojawiały się między innymi conftest.py, package.json, Makefile, build.rs oraz elementy konfiguracji workflow. Zmiany były maskowane jako rutynowe poprawki związane z budowaniem, testami lub kompatybilnością projektu, co miało zmniejszyć czujność maintainerów.

Po uruchomieniu workflow złośliwy kod próbował najpierw zebrać zmienne środowiskowe i tokeny dostępne w kontekście pipeline’u. Następnie wykonywał rozpoznanie środowiska, obejmujące enumerację sekretów, workflow i potencjalnych integracji zewnętrznych. W kolejnych etapach malware podejmowało próby tworzenia tymczasowych workflow, obchodzenia kontroli bezpieczeństwa oraz opóźnionej eksfiltracji danych, na przykład przez logi lub komentarze do pull requestów.

Najbardziej niepokojącym elementem kampanii było dopasowywanie ładunku do technologii używanej przez ofiarę. Badacze odnotowali wzorce sugerujące użycie AI lub modeli LLM do automatycznego rozpoznawania języka, frameworka i procesu budowania projektu. Dzięki temu atakujący mogli generować pozornie naturalne, „idiomatyczne” zmiany dla repozytoriów Python, Node.js, Rust czy Go.

Jednocześnie sama operacja nie była perfekcyjna technicznie. W części analizowanych prób pojawiały się błędy logiczne, niewłaściwe założenia dotyczące modelu uprawnień GitHub oraz nietrafione wektory wstrzyknięcia. To ograniczyło skuteczność kampanii, ale nie zredukowało ryzyka do zera. Przy setkach zautomatyzowanych prób nawet niski odsetek powodzenia może prowadzić do realnych kompromitacji.

Konsekwencje / ryzyko

Najważniejszym skutkiem kampanii jest potwierdzenie, że błędna konfiguracja GitHub Actions może stać się praktycznym punktem wejścia do ataku na łańcuch dostaw. Nawet jeśli część udanych kompromitacji dotyczyła mniejszych projektów, skutki mogą rozlać się dalej przez zależności open source wykorzystywane w innych środowiskach.

Ryzyko ma kilka warstw. Po pierwsze, istnieje możliwość przejęcia krótkotrwałych poświadczeń workflow, które w określonych warunkach pozwalają na dalsze działania w repozytorium lub usługach zewnętrznych. Po drugie, zagrożone są sekrety CI/CD, takie jak tokeny publikacyjne, klucze API, poświadczenia do usług chmurowych czy tokeny wykorzystywane przez platformy wdrożeniowe. Po trzecie, kampanie tego typu zwiększają obciążenie maintainerów i utrudniają ręczną weryfikację pull requestów przy dużej skali ataku.

Dodatkowym problemem jest operacyjne wykorzystanie AI. Automatyzacja obniża próg wejścia dla mniej zaawansowanych aktorów, a jednocześnie zwiększa tempo i adaptacyjność ataków. To oznacza, że podobne kampanie prawdopodobnie będą się powtarzać, stając się z czasem bardziej precyzyjne i trudniejsze do wykrycia.

Rekomendacje

Organizacje utrzymujące repozytoria na GitHub powinny w pierwszej kolejności przeprowadzić audyt workflow korzystających z pull_request_target. Jeżeli ten mechanizm nie jest absolutnie niezbędny, należy zastąpić go bezpieczniejszymi wzorcami opartymi o pull_request lub ograniczyć jego użycie do ściśle kontrolowanych scenariuszy.

Kluczowe pozostaje wdrożenie zasady minimalnych uprawnień dla GITHUB_TOKEN oraz jawne definiowanie sekcji permissions w workflow. Nie należy dopuszczać do automatycznego wykonywania kodu z niezaufanych forków przy jednoczesnym dostępie do sekretów.

  • Wymuszanie ręcznego zatwierdzania workflow od first-time contributorów.
  • Ochrona branchy i obowiązkowe review przed uruchomieniem krytycznych zadań.
  • Stosowanie warunków ścieżkowych ograniczających aktywację workflow.
  • Separacja sekretów produkcyjnych od pipeline’ów build/test.
  • Monitorowanie logów workflow pod kątem anomalii i markerów eksfiltracji.
  • Regularna rotacja tokenów publikacyjnych oraz sekretów CI/CD.
  • Przegląd historii pull requestów i workflow pod kątem artefaktów kampanii.

Z perspektywy zespołów bezpieczeństwa szczególnie ważne jest wykrywanie repozytoriów, w których pull_request_target współistnieje z wykonywaniem kodu pochodzącego z forka. Taka kombinacja powinna być traktowana jako sygnał wysokiego ryzyka wymagający natychmiastowej korekty.

Podsumowanie

Kampania „prt-scan” pokazuje, że bezpieczeństwo GitHub Actions i pipeline’ów CI/CD stało się jednym z kluczowych elementów ochrony łańcucha dostaw oprogramowania. Sam wektor ataku nie jest nowy, ale połączenie go z automatyzacją wspieraną przez AI znacząco zwiększa skalę, szybkość i elastyczność działań przeciwnika.

Dla organizacji najważniejszy wniosek jest prosty: ochrona software supply chain nie kończy się na analizie kodu aplikacji. Równie istotne są konfiguracje workflow, model uprawnień, sposób uruchamiania zadań dla niezaufanych kontrybutorów oraz kontrola sekretów wykorzystywanych w procesie budowania i publikacji.

Źródła

  1. Dark Reading — AI-Assisted Supply Chain Attack Targets GitHub — https://www.darkreading.com/application-security/ai-assisted-supply-chain-attack-targets-github
  2. Wiz Blog — Six Accounts, One Actor: Inside the prt-scan Supply Chain Campaign — https://www.wiz.io/blog/six-accounts-one-actor-inside-the-prt-scan-supply-chain-campaign
  3. GitHub Docs — About pull requests — https://docs.github.com/en/pull-requests/collaborating-with-pull-requests/proposing-changes-to-your-work-with-pull-requests/about-pull-requests
  4. GitHub Docs — Events that trigger workflows — https://docs.github.com/en/actions/reference/workflows-and-actions/events-that-trigger-workflows
  5. Wiz Blog — Hardening GitHub Actions: Lessons from Recent Attacks — https://www.wiz.io/blog/github-actions-security-guide