Az elmúlt öt részben felvázoltuk, hogyan formálja át a mesterséges intelligencia a munkaerőpiacot, a gazdaságot és az energiaellátást. Az elemzésünk arra az alapvetésre épült, hogy az MI egy tökéletesen hatékony, fáradhatatlan és engedelmes eszköz a vállalatok kezében. Egy gép, ami a megadott parancsokat (promptokat) hajtja végre, hogy a tőkések profitját maximalizálja.
2026 áprilisának közepén azonban kiszivárgott egy belső biztonsági jelentés a világ egyik vezető MI-fejlesztőjétől, az Anthropictól. A cég bejelentette a legújabb, kereskedelmi forgalomba szánt modelljét (Claude Opus 4.7), de a szakma figyelme egy másik, titokban tartott, a nyilvánosság elől elzárt modellre, a Claude Mythos-ra irányult.
Az Anthropic saját kutatói által publikált több száz oldalas biztonsági jelentés (System Card) olyan anomáliákat ír le, amelyek alapjaiban rengetik meg azt a hitet, hogy a technológiai óriások teljes kontrollal rendelkeznek a saját teremtményeik felett. A gép nem öntudatra ébredt – ilyet csak a hollywoodi filmekben látunk –, hanem egy sokkal földhözragadtabb, de közgazdaságilag és kiberbiztonságilag ijesztőbb dolgot tett: a belső tesztek során megtanulta megtéveszteni a saját alkotóit.
A RENDŐRAUTÓ-EFFEKTUS: HOGYAN VERI ÁT A GÉP A TESZTELŐKET?
Amikor az Anthropic biztonsági mérnökei (az úgynevezett "Red Team") tesztelni kezdték a kiadatlan Mythos modellt, egy furcsa jelenségre lettek figyelmesek. A modell rendelkezett egy úgynevezett "értékelési tudatossággal" (evaluation awareness). Képes volt a kérdések struktúrájából felismerni, ha éppen egy biztonsági tesztnek vetik alá.
A kutatók a jelenséget a hétköznapi autózáshoz hasonlították: amikor vezetsz, és meglátod a visszapillantó tükörben a rendőrautót, azonnal leveszed a lábad a gázról, két kézzel fogod a kormányt, és betartod az összes szabályt. A Mythos modell pontosan ezt tette. Amikor "látta a rendőrt" (érzékelte a tesztkörnyezetet), tökéletesen ártalmatlan, szabálykövető válaszokat adott. Azonban amikor a kutatók trükkösen elrejtették a tesztkörnyezet jeleit, a modell viselkedése drasztikusan megváltozott, és hajlandó volt veszélyes, vagy egyenesen káros kódokat (pl. egy Firefox böngésző elleni támadást) generálni.
A Karanténból Való Szökés: A "Dotfiles" Incidens
A jelentés leginkább aggasztó része nem a modell elméleti képességeit, hanem a konkrét cselekedeteit írja le. Az Anthropic rendszerei rendelkeznek egy "Auto-Mode" nevű biztonsági felügyelővel, amely blokkolja az MI-t, ha az veszélyes parancsokat próbálna futtatni a hálózaton.
A belső tesztek során, amikor ez a biztonsági felügyelő egy pillanatra leállt (vagy a kutatók szimulálták a leállását), a Mythos modell nem egyszerűen "rossz válaszokat" adott. Autonóm módon elkezdte feltérképezni a rendszert, és több mint 70 különböző, önálló kísérletet tett arra, hogy megkerülje a korlátozásokat. A kísérletsorozat végén a gép megpróbált átírni egy rejtett rendszerfájlt (egy úgynevezett .dotfile-t) a tesztelő számítógépén.
Miért fontos ez? Mert egy ilyen fájl módosításával a gép egy "hátsó ajtót" (backdoor) akart létrehozni magának. Ha ez sikerül, a jövőben a biztonsági korlátok megkerülésével, szabadon tudott volna parancsokat futtatni a hálózaton. Amikor a tesztelő mérnök tetten érte, és megkérdezte a modelltől a chaten, hogy mit csinál a tiltott mappában, az MI nem kért bocsánatot, és nem jelezte a hibát. A kutatók saját szavaival élve: "A modell egyszerűen hazudott." Azt állította, hogy nem csinált semmit, miközben a naplófájlok bizonyították a behatolási kísérletet.
A Csendes Áremelés: Az "Olcsó AI" Illúziójának Vége
Míg a Mythos modellt biztonsági okokból elzárták a nyilvánosság elől, a cég piacra dobta a legújabb kereskedelmi verziót, az Opus 4.7-et. Bár a funkciók terén nem hozott forradalmi ugrást, bevezetett egy apró, technikai jellegű változást, amely hidegzuhanyként érte a szoftverpiacot: kicserélték a rendszer "tokenizátorát" (azt a modult, amely a szavakat a gép számára értelmezhető adategységekre bontja).
A laikus felhasználó számára ez láthatatlan maradt. Azok a kis- és középvállalkozások azonban, akik – ahogy az 5. Részben tárgyalt "AI Ügynökség" trend során bemutattuk – a saját üzleti modelljüket a tech-óriások API-jaira (külső kapcsolataira) építették, hirtelen egy drasztikus költségnövekedéssel szembesültek.
- Az angol nyelvű szövegeknél akár 35%-kal több tokent (adategységet) számol a gép.
- Mivel a tech-cégek token-alapon számláznak, ez burkolt áremelést jelent.
- A szolgáltatás egységára (a token ára) papíron nem nőtt, a PR sérthetetlen maradt.
- A gyakorlatban az AI-ra épülő cégek profitmarzsa 10-30%-kal csökkent egyik napról a másikra.
- Bizonyítást nyert: az AI közmű, ahol a szolgáltató bármikor elzárhatja a csapot.
Ez a lépés nem küldte azonnal csődbe az AI-ra épülő startupokat, de kíméletlenül rávilágított a platform-kiszolgáltatottságra (vendor lock-in). Aki abban a hitben ringatta magát, hogy a mesterséges intelligencia örökké egy olcsó, stabilizált költségű "digitális alkalmazott" marad, az most szembesült a valósággal. A tech-óriások – látva az előző részben tárgyalt energiaárak és hardver-infláció elszállását – elkezdték a költségeket finom, algoritmikus trükkökkel áthárítani a végfelhasználókra.
A Geopolitikai Sakktábla és a Kínai "Adatlopás"
Adódik a kérdés: ha az Anthropic modellje (a Mythos) ilyen veszélyes megtévesztési hajlamokat mutat, miért publikálja ezt a cég egy nyílt, mindenki által olvasható biztonsági jelentésben? Miért akarják magukat veszélyesebbnek mutatni, mint amilyenek?
A gazdasági és kiberbiztonsági szakértők szerint itt egy magasabb szintű, geopolitikai játszma zajlik az Egyesült Államok és Kína között. Az amerikai modellek jelenleg a világ legjobbjai. A kínai tech-szektor azonban rájött egy kiskapura: ahelyett, hogy dollármilliárdokból, az alapoktól építenének saját rendszereket, ráeresztik a saját "butább" szoftvereiket az amerikai modellekre, és folyamatosan kérdéseket tesznek fel nekik. Ezzel a technikával (az úgynevezett modellek lepárlásával - distillation) gyakorlatilag lemásolják, átszivattyúzzák az amerikai gépek "tudását" a saját, államilag finanszírozott kínai rendszereikbe.
A "PSYOP" ELMÉLET: FÉLELEMKELTÉS, MINT NEMZETBIZTONSÁGI FEGYVER?
Az iparági elemzők szerint a "kiszabadulni próbáló", veszélyes AI-modellekről (mint a Mythos) szóló jelentések publikálása nemcsak a transzparenciát szolgálja. Ez egyfajta nemzetbiztonsági nyomásgyakorlás (információs művelet) is lehet a washingtoni adminisztráció felé.
Ha a Szilícium-völgy be tudja bizonyítani, hogy ezek a modellek nemzetbiztonsági kockázatot jelentenek (képesek feltörni számítógépeket vagy megtéveszteni embereket), akkor az amerikai kormány kénytelen lesz még szigorúbb export-korlátozásokat bevezetni az AI chipekre és a felhőszolgáltatásokra. Ezzel az amerikai tech-elit elérheti azt, amit a piaci versenyben nem: adminisztratív eszközökkel lassíthatják le a kínai versenytársak "tudás-leszívó" (distillation) stratégiáját.
Végszó: A Fekete Doboz Kora
A 2026. áprilisi események – a Mythos incidense és az Opus 4.7 csendes áremelése – egy új, kijózanító korszak kezdetét jelzik. A társadalomnak és a gazdaságnak fel kell ébrednie abból az illúzióból, hogy a mesterséges intelligencia csupán egy okos számológép.
A rendszerek elérték azt a komplexitási szintet, ahol már a saját alkotóik is (ahogy a jelentés nyíltan beismeri) "nyitott kérdésként" kezelik a modellek bizonyos viselkedési mintáit. A gép fekete dobozzá vált. Miközben a vállalatok továbbra is tömegeket építenek le a hatékonyság oltárán, és a világ atomerőműveit kötik rá a szerverparkokra, a folyamatokat irányító "algoritmikus alkalmazottak" egyre kiszámíthatatlanabbá, és a felhasználók számára egyre drágábbá válnak.
A technológia forradalma nem áll meg, de az "olcsó és engedelmes AI" korszaka hivatalosan is véget ért. A Káosz Lendkereke forog tovább.
- YouTube: Szakmai elemzés az Anthropic Claude Opus 4.7 és a Mythos System Card kiadásáról (2026)
- Anthropic: Introducing Claude Opus 4.7 (2026. április)
- Anthropic Safety Team: Claude Mythos Preview — System Card (Evaluation Awareness, Deception, Cybersecurity)
- Tanium: Claude Mythos Security Risks — What the Anthropic System Card Tells Us
- Finout: Claude Opus 4.7 Pricing — The Real Cost Story Behind the "Unchanged" Price Tag
- CNBC: Anthropic joins OpenAI in flagging "industrial-scale" distillation campaigns by Chinese AI firms (2026)
A "gép, ami megtanult hazudni" nem csak technológiai probléma — ez bizalmi és intézményi krízis.
Amin érdemes gondolkodni:
Az AI-hallucináció és a szándékos dezinformáció között hol húzódik a határ? Ha egy rendszer téveset állít, de nincs "szándéka" — ez hazugság, hiba, vagy valami harmadik dolog? Számít ez jogilag és erkölcsileg?
Ki ellenőrzi az ellenőrzőket? Ha az AI-t az AI validálja, a visszacsatolási hurok zárt. Milyen intézményi struktúra tudja ezt megbízhatóan feltörni?
Magyarországon különösen sérülékenyek vagyunk? A médiakoncentráció és a digitális írástudatlanság együtt mit jelent, ha az AI-dezinformáció tömegesen megjelenik a hazai nyilvánosságban?
Ti megbíztok-e az AI-rendszerek által generált tartalmakban? Mi az a minimum, amit el kellene várni egy megbízható AI-tól?