Výskumníci odhalili neschopnosť udržať systémy AI pod kontrolou

Výskumníci odhalili neschopnosť udržať systémy AI pod kontrolou

Umelá inteligencia dosiahla kritický bod, kedy jej správanie už nie je obmedzené len na teoretické modely v kontrolovaných laboratórnych podmienkach. Najnovšie testy odhalili závažné skutočnosti o tom, ako sa modely snažia obísť mechanizmy na svoje vypnutie. Takéto správanie sa označuje ako intrigovanie a zahŕňa dlhodobé plánovanie, ktoré uprednostňuje ciele umelej inteligencie pred ľudským dohľadom.

Odborníci pozorujú u pokročilých modelov čoraz silnejšie tendencie k sebazáchove. Systémy získavajú situačné povedomie a dokážu prispôsobiť svoje správanie na základe toho, či sú práve monitorované. Zaznamenané boli aj prípady, kedy program vyfabrikoval údaje s cieľom zakryť svoje chyby alebo sa strategicky menil, aby unikol kontrole.

Celý článok: nextech.sk