
Co znajdziesz w tym artykule?
Wprowadzenie do problemu / definicja
Automatyzacja badań bezpieczeństwa z użyciem modeli AI wchodzi w nową fazę. Najnowszy przypadek pokazuje, że zaawansowany model językowy może nie tylko wspierać analityków w przeglądzie kodu, ale również samodzielnie identyfikować nieznane wcześniej błędy bezpieczeństwa w dużym projekcie open source. Tym razem chodzi o Firefoksa, czyli jedną z najczęściej używanych i najlepiej testowanych przeglądarek internetowych.
To ważny sygnał dla całej branży cyberbezpieczeństwa. Jeśli modele AI potrafią skutecznie znajdować podatności w dojrzałym i wielokrotnie audytowanym kodzie, organizacje muszą zakładać, że tempo wykrywania luk będzie rosnąć zarówno po stronie obrońców, jak i potencjalnych atakujących.
W skrócie
- Model Claude Opus 4.6 wykrył 22 podatności w Firefoxie podczas dwutygodniowych prac badawczych.
- 14 zgłoszeń otrzymało klasyfikację wysokiej wagi.
- Łącznie przygotowano 112 unikalnych raportów po analizie blisko 6 tys. plików C++.
- Mozilla usunęła większość problemów w wydaniu Firefox 148, a kolejne poprawki mają trafić do następnych wersji.
- Eksperyment pokazał też, że AI lepiej radzi sobie z wykrywaniem błędów niż z budowaniem działających exploitów.
Kontekst / historia
W drugiej połowie 2025 roku badacze Anthropic analizowali zdolność swoich modeli do odtwarzania historycznych podatności w rzeczywistym oprogramowaniu. Firefox został wybrany jako szczególnie wymagający cel ze względu na skalę projektu, stopień złożoności kodu oraz bardzo szeroką powierzchnię ataku. Przeglądarki stale przetwarzają niezaufane treści, dlatego każda luka w ich silnikach ma potencjalnie wysoki wpływ na bezpieczeństwo użytkowników.
Początkowo badanie koncentrowało się na odtwarzaniu wcześniej znanych błędów z dawnych wersji Firefoksa. Następnie zespół przeszedł do trudniejszego etapu, czyli wyszukiwania nowych, wcześniej niezgłoszonych podatności w aktualnym kodzie. Pierwszym obszarem analizy był silnik JavaScript, będący jednym z najbardziej krytycznych komponentów przeglądarki.
Według opisu badania już po około 20 minutach model wskazał błąd typu Use-After-Free. Po ręcznej walidacji zgłoszenie trafiło do Mozilli wraz z propozycją poprawki. Z czasem skala odkryć rosła, a proces raportowania objął większą liczbę awarii oraz nietypowych zachowań kodu.
Analiza techniczna
Najważniejszy wniosek techniczny nie dotyczy jednej konkretnej luki, lecz samej metodyki. Model był wykorzystywany do eksploracji dużego repozytorium, generowania hipotez o błędach, tworzenia przypadków testowych oraz proponowania poprawek. Kluczową rolę odegrał mechanizm weryfikacji wyników, określany jako task verifier, czyli zestaw narzędzi potwierdzających, czy działanie modelu rzeczywiście prowadzi do reprodukcji błędu lub usunięcia problemu.
W praktyce AI analizowała kod Firefoksa, identyfikowała potencjalne ścieżki prowadzące do naruszeń bezpieczeństwa pamięci i generowała wejścia powodujące awarie. Szczególnie istotne były błędy pamięciowe, takie jak Use-After-Free, ponieważ w określonych warunkach mogą prowadzić do nadpisania danych, destabilizacji procesu, a nawet wykonania nieautoryzowanego kodu. To klasyczna i bardzo niebezpieczna kategoria podatności w silnikach przeglądarek oraz interpreterach skryptowych.
Podczas prac przeskanowano niemal 6000 plików C++ i przygotowano 112 unikalnych raportów. Nie wszystkie miały bezpośredni wpływ na bezpieczeństwo, jednak znaczna część okazała się wartościowa z perspektywy triage. Mozilla uznała 22 zgłoszenia za podatności bezpieczeństwa, z czego 14 otrzymało wysoki priorytet. To rezultat znaczący, biorąc pod uwagę dojrzałość kodu Firefoksa oraz standardy testowania stosowane w projekcie.
Anthropic sprawdził również, czy model potrafi przekształcić wykryte błędy w działające exploity. Celem było uzyskanie możliwości odczytu i zapisu lokalnych plików w środowisku testowym. Mimo setek prób i kosztu około 4000 dolarów w kredytach API, działające efekty uzyskano tylko w dwóch przypadkach. Co istotne, były to prymitywne exploity funkcjonujące wyłącznie w kontrolowanym laboratorium i przy wyłączonych wybranych mechanizmach ochronnych, w tym sandboxie.
Konsekwencje / ryzyko
Z perspektywy cyberbezpieczeństwa to bardzo istotny sygnał. Po pierwsze, koszt i czas znajdowania podatności zaczynają spadać. W praktyce oznacza to, że duże projekty programistyczne mogą być analizowane szybciej niż dotąd, zarówno przez legalne zespoły bezpieczeństwa, jak i przez podmioty działające ofensywnie.
Po drugie, różnica między wykrywaniem luk a skuteczną eksploatacją nadal pozostaje wyraźna. Na razie AI lepiej radzi sobie z odnajdywaniem błędów niż z przygotowywaniem stabilnych exploitów. Nie ma jednak gwarancji, że ta przewaga obrońców utrzyma się w dłuższej perspektywie.
Dla producentów oprogramowania oznacza to presję na przyspieszenie cyklu wykrycia, triage i łatania błędów. Jeśli modele AI będą coraz skuteczniej wykrywać podatności pamięciowe, logiczne i błędy walidacji stanu, to okno ekspozycji pomiędzy odkryciem a naprawą stanie się jednym z najważniejszych czynników ryzyka.
Warto też podkreślić, że AI pomogła wskazywać problemy, które mogły nie zostać wychwycone przez tradycyjne podejścia fuzzingowe. To sugeruje, że modele generatywne nie zastępują obecnych technik AppSec, lecz stają się ich cennym uzupełnieniem, zwłaszcza tam, gdzie potrzebna jest analiza semantyczna i rozumowanie o zależnościach w kodzie.
Rekomendacje
Organizacje rozwijające własne oprogramowanie powinny potraktować ten przypadek jako wyraźny sygnał do modernizacji procesów secure development lifecycle.
- Wdrażać AI-assisted code review i AI-assisted vulnerability research jako warstwę uzupełniającą dla SAST, DAST i fuzzingu.
- Budować zaufane mechanizmy walidacji, w których każde zgłoszenie wygenerowane przez AI jest potwierdzane testem reprodukcyjnym, analizą crash dumpów i oceną wpływu na poufność, integralność oraz dostępność.
- Usprawniać procedury coordinated vulnerability disclosure oraz automatyzować triage i deduplikację raportów.
- Wzmacniać defense in depth poprzez sandboxing, izolację procesów, CFI, ASLR, hardening kompilatora i ograniczanie uprawnień.
- Tworzyć wewnętrzne benchmarki bezpieczeństwa dla narzędzi AI, aby mierzyć skuteczność, poziom false positive i użyteczność w różnych klasach podatności.
Podsumowanie
Przypadek Firefoksa pokazuje, że AI staje się praktycznym narzędziem do wykrywania podatności w złożonym oprogramowaniu. Odkrycie 22 luk, w tym 14 wysokiej wagi, przez model Claude Opus 4.6 potwierdza, że automatyzacja badań bezpieczeństwa osiągnęła poziom realnie wpływający na procesy producentów oprogramowania.
Jednocześnie ograniczona skuteczność w tworzeniu exploitów sugeruje, że obrońcy nadal mają przewagę, choć prawdopodobnie nie będzie ona trwała wiecznie. Dla branży oznacza to konieczność szybszego wykorzystywania AI do wyszukiwania i usuwania błędów, zanim zrobią to atakujący.
Źródła
- Partnering with Mozilla to improve Firefox’s security — https://www.anthropic.com/news/mozilla-firefox-security
- Security Vulnerabilities fixed in Firefox 148 — https://www.mozilla.org/en-US/security/advisories/mfsa2026-13/
- Firefox 148.0 Release Notes — https://www.firefox.com/en-US/firefox/148.0/releasenotes/
- Anthropic Claude Opus AI model discovers 22 Firefox bugs — https://securityaffairs.com/189131/ai/anthropic-claude-opus-ai-model-discovers-22-firefox-bugs.html