2 juli, 2026 Uppdaterad 3 juli, 2026

Någon måste städa efter AI-koden

Sommaren 2025 gav en svensk-ledd studie ett lugnande svar: AI-kod var inte svårare att underhålla. Ett år senare, med agentisk kodning, tecknar färsk forskning en mer komplicerad bild.

I GitHubs mycket citerade experiment skrev utvecklare kod 55 procent snabbare med GitHub Copilot på en avgränsad uppgift. Siffran ser fantastisk ut.

En fråga har ändå gnagt: vad händer sen? Blir AI-koden en belastning för nästa utvecklare som ska ändra den?

Sommaren 2025 gav en svensk-ledd studie ett lugnande svar. Ett år senare ser bilden mer komplicerad ut.

Studien som mäter rätt sak

De flesta studier om AI och kodning mäter hastighet. Hur snabbt hinner en utvecklare bli klar med hjälp av Copilot eller Cursor? Den frågan är redan besvarad. Svaret är: snabbare.

Hastighet är bara halva bilden. Den som skriver koden ser den en gång. De som underhåller den, felsöker den och bygger vidare på den kan vara dussintals personer under systemets livstid. Är AI-genererad kod svårare att förstå eller mer benägen att gömma buggar, då äter produktivitetsvinsten upp sig själv.

Studien "Echoes of AI" är en av de första som mäter just det: vad händer när någon annan ska arbeta vidare med AI-skriven kod?

Så gick experimentet till

151 utvecklare delades in i två faser.

I den första fasen fick hälften använda AI-verktyg för att bygga en ny funktion i en Java-applikation. Den andra hälften kodade utan AI-stöd.

I den andra fasen tog en ny grupp utvecklare vid. De fick inte använda AI. Deras uppgift var att vidareutveckla koden från första fasen, oavsett om den var AI-assisterad eller handskriven.

Genom att mäta hur det gick för grupp två kunde forskarna svara på den avgörande frågan: är AI-kodens arv tyngre att bära?

Resultatet var lugnande

Svaret var nej.

Ingen mätbar skillnad. Koden som skrivits med AI-hjälp var varken svårare eller lättare att underhålla, och den tog inte längre tid att ändra. Kodkvaliteten, mätt med CodeHealth, CodeScenes mått för kodhälsa på en skala från 1 till 10, låg på samma nivå.

Det kanske mest intressanta: vana AI-användare skrev kod med något bättre underhållbarhet. En teori är att AI gärna skapar standardiserad, tråkig kod. Den följer konventioner, tar inga kreativa genvägar och blir därför enklare att förstå för nästa utvecklare.

Tråkig kod är bra kod, med andra ord. Så såg svaret ut sommaren 2025.

Sedan kom agenterna

Echoes of AI mätte AI som assistent. En utvecklare byggde en funktion med förslag från verktyget, med handen kvar på ratten. Så såg AI-kodning ut 2025.

2026 är en annan värld. Agentiska verktyg som Claude Code och Cursors agent-läge skriver hela pull requests på egen hand, granskar sin egen kod och skickar den vidare. Volymen har exploderat, och det är en delvis annan fråga än den Echoes of AI besvarade. Studien fångade en ögonblicksbild av en teknik som redan hunnit förändras.

Den nyare forskningen ritar en mörkare bild

När forskare 2026 tittar på agentgenererad kod ser de andra mönster.

En studie accepterad till Mining Software Repositories 2026 granskade AI-agenters försök att förbättra läsbarheten i 403 kodändringar. Trots att det var själva syftet sjönk underhållbarhetsindexet i 56 procent av ändringarna, och den cyklomatiska komplexiteten, ett mått på hur förgrenad och svårtestad koden är, steg i 43 procent av dem. Agenterna gjorde koden krångligare medan de försökte göra den läsbar.

En annan studie, accepterad till EASE 2026, följde över tusen AI-genererade filer i hundra populära kodbaser. AI-koden underhölls mer sällan än människoskriven kod, och när den väl ändrades handlade det om nya funktioner snarare än buggfixar. Städningen föll på människorna.

Branschdata pekar åt samma håll. En rapport från utvecklarplattformen Opsera, byggd på 250 000 utvecklare i ett sextiotal företag, visar att AI kortar tiden fram till en färdig pull request. Samtidigt får de AI-genererade ändringarna vänta 4,6 gånger så länge på att granskas, och de innehåller 15 till 18 procent fler säkerhetshål. Hastigheten försvinner inte, den flyttar bara till granskningsbordet.

Förstärkaren som inte bryr sig om riktning

Det bekräftar något Echoes of AI redan antydde. AI fungerar som en förstärkare.

En erfaren utvecklare som vet vad som behöver byggas, som förstår arkitekturen och kan bedöma AI:ns förslag, får en kraftfull hävstång. Den personen jobbar snabbare utan att tappa kvalitet.

En utvecklare som saknar den kompetensen får också en hävstång, fast åt fel håll. AI hjälper den personen att skriva dålig kod snabbare. Mer av den.

Opsera-rapporten sätter siffror på skillnaden: seniora utvecklare får ut nästan fem gånger så mycket av AI:n som juniora. Utvecklarens kompetens är fortfarande den viktigaste faktorn. AI förändrar inte den ekvationen. Den förstärker den.

Två risker som växer i det tysta

Redan Echoes of AI lyfte två risker som experimentet inte fångade fullt ut. Ett år senare börjar de synas i datan.

Kodsvällning. När det knappt kostar något att låta AI skriva kod växer volymen. Fler rader, fler filer och fler beroenden. Varje ny rad är en framtida underhållskostnad, oavsett hur väl den är skriven. Studien mätte kvaliteten på enskilda funktioner men inte systemets totala storlek, och det är just storleken som växer fortast när agenterna får skriva fritt.

Kognitiv skuld. Vänjer sig utvecklare vid att säga ja till AI-förslag utan att fullt förstå dem, urholkas förståelsen för systemet. Det är en smygande process. Du märker den inte dag för dag. Efter ett år har teamet ändå tappat den djupa kunskap som krävs för att fatta bra designbeslut. Koden ser bra ut på ytan, men ingen äger helhetsbilden.

Svensk forskning i framkant

Echoes of AI är ett samarbete mellan Lunds universitet och det Malmöbaserade företaget CodeScene. Förstaförfattare är Markus Borg, forskare vid CodeScene och adjungerad vid Lunds tekniska högskola. Bland medförfattarna finns Emma Söderberg, lektor vid institutionen för datavetenskap i Lund, samt Nadim Hagatulah och Noric Couderc.

CodeScene har tagit fram CodeHealth-måttet som användes i studien, ett verktyg som mäter kodkvalitet utifrån etablerade varningsmönster i koden, så kallade code smells. Företagets grundare Adam Tornhill har i tidigare forskning visat att kod med låg hälsa har upp till 15 gånger fler defekter och tar mer än dubbelt så lång tid att bygga vidare på.

Dave Farley, den brittiske mjukvaruingenjören bakom YouTube-kanalen Modern Software Engineering, är medförfattare till studien och hjälpte till att rekrytera deltagarna, bland annat via sin kanal.

Vad det betyder i praktiken

Leder du ett utvecklingsteam är budskapet tydligare 2026 än det var 2025. AI-verktyg kan öka tempot utan att koden i sig blir sämre. Baksidan sitter inte i den enskilda kodraden. Den sitter i volymen och i att granskningen inte hänger med.

Det ekar ett mönster vi sett även utanför kodvärlden, där AI som medarbetare slår AI som ersättare. Verktyget ersätter inte omdömet. Det förstärker det.

De största riskerna finns i det som inte syns: den svällande kodbasen och den tysta kunskapsförlusten när vi slutar tänka igenom problemen själva. Om AI-koden håller i längden avgörs inte av modellen, utan av vem som håller i pennan efter den.