Wenn die KI sich selbst baut: Was Anthropics Report wirklich bedeutet

Es passiert selten, dass ein Frontier-Labor die Tür zum eigenen Maschinenraum aufmacht. Genau das hat Anthropic am 4. Juni 2026 getan. In dem Report „When AI bu...

KI

von Phillip K.

5. Juni 202614 Min.

Wenn die KI sich selbst baut: Was Anthropics Report wirklich bedeutet

⚡ Quick Takes

Anthropic hat am 4. Juni 2026 den Report „When AI builds itself" veröffentlicht — mit internen, bisher nie gezeigten Zahlen dazu, wie KI inzwischen die Entwicklung von KI vorantreibt.
Mehr als 80 Prozent des Codes, den Anthropic in seine eigene Codebasis einspielt, schreibt Claude selbst. Vor dem Start von Claude Code im Februar 2025 lag der Wert im einstelligen Prozentbereich.
Das Ziel hinter der Kurve heißt rekursive Selbstverbesserung: der Punkt, an dem ein KI-System seinen eigenen Nachfolger weitgehend autonom entwirft, baut und trainiert.
Was bislang menschlich bleibt, ist nur noch die Richtung — welches Experiment lohnt, welchem Ergebnis man traut. Selbst hier holt die KI messbar auf: von 51 auf 64 Prozent „besserer nächster Schritt" binnen sechs Monaten.
Anthropic warnt vor dem eigenen Fortschritt und fordert ein global koordiniertes Verfahren, um die Frontier-Entwicklung notfalls verlangsamen oder pausieren zu können.
Der Anschluss für uns: Sobald nicht mehr die Intelligenz der Engpass ist, sondern Rechenleistung, Energie, Zahlungsschienen und Verifizierbarkeit, sitzt Krypto mitten in dieser Geschichte.

Es passiert selten, dass ein Frontier-Labor die Tür zum eigenen Maschinenraum aufmacht. Genau das hat Anthropic am 4. Juni 2026 getan. In dem Report „When AI builds itself" zeigt das Unternehmen mit internen Daten, dass seine KI inzwischen den Großteil ihres eigenen Codes schreibt — und dass der Punkt näher rückt, an dem ein System seinen eigenen Nachfolger entwirft. Der Bericht ist kein Marketing. Er liest sich an manchen Stellen wie ein Warnschreiben des Unternehmens an sich selbst.

Die eigentliche Frage hinter dem Text ist eine sehr alte und sehr große: Was passiert, wenn Intelligenz anfängt, sich selbst zu bauen? Nicht als Drehbuch eines Science-Fiction-Films, sondern als Quartalskurve in der Codebasis eines real existierenden Unternehmens. Genau das macht den Report so unangenehm konkret. Er handelt nicht von einer fernen Superintelligenz, sondern von dem, was diese Woche in einem Bürogebäude in San Francisco messbar ist.

Was im Maschinenraum wirklich passiert

Die Kernzahl ist unbequem konkret. Stand Mai 2026 stammen über 80 Prozent des Codes, den Anthropic produktiv einspielt, von Claude selbst. Die Unternehmensführung beziffert den Anteil inklusive Skripten und Experimentalcode öffentlich sogar auf „90 Prozent oder mehr"; die 80 Prozent sind die konservative, auf produktiv gemergte Zeilen gerechnete Variante. Vor zwei Jahren war dieser Anteil einstellig.

Sichtbar wird das an einer zweiten Kurve: Code pro Engineer und Tag. Sie blieb über Anthropics erste vier Jahre flach und knickte 2025 nach oben, als Claude anfing, Code nicht mehr nur vorzuschlagen, sondern selbst auszuführen. 2026 wurde der Anstieg noch steiler, als die Modelle über längere Zeiträume autonom arbeiteten. Im zweiten Quartal 2026 merged der typische Engineer 8x so viel Code pro Tag wie 2024 — nicht, weil er schneller tippt, sondern weil er die KI dirigiert und reviewt, statt selbst zu schreiben.

code contributed per person, by quarter.webp — https://www.anthropic.com/institute/recursive-self-improvement

Anthropic ist bei der Einordnung selbst ehrlich: Zeilen Code sind ein schlechtes Maß, weil sie Menge über Qualität stellen. Der 8x-Wert überzeichnet den echten Produktivitätsgewinn fast sicher. Trotzdem zeigt er eine Beschleunigung, die kein interner Anreiz erklärt — bei Anthropic wird niemand für Codezeilen bezahlt. Eine Umfrage unter 130 Mitarbeitern im März 2026 ergab im Median eine geschätzte Vervierfachung der eigenen Leistung gegenüber dem Arbeiten ohne KI.

„Recursive Self-Improvement" — das eigentliche Thema

Anthropic teilt die eigene Geschichte in fünf Stufen. Bis 2023 schrieben Menschen jede Zeile. Dann kamen Chatbots, die Schnipsel lieferten. Ab 2025 schrieben Agenten ganze Dateien. Heute führen autonome Agenten Code selbst aus und delegieren stundenlange Arbeit an weitere Agenten. Die fünfte Stufe trägt im Report den Titel „Closing the loop": Agenten, die Modelle eigenständig bauen und trainieren — sodass künftige Claude-Versionen von Claude selbst verbessert werden. Das ist rekursive Selbstverbesserung, und sie ist der rote Faden des gesamten Berichts.

Wichtig ist die Unterscheidung, die Anthropic durchzieht. Beim Ausführen einer klar definierten Aufgabe ist die KI längst sehr stark. Bei der Optimierung von Trainings-Code etwa kletterte der Speedup binnen eines Jahres von ~3x auf ~52x — ein erfahrener Mensch braucht für 4x rund vier bis acht Stunden. Was bislang menschliche Domäne bleibt, ist das Setzen der Richtung: zu entscheiden, welches Experiment überhaupt lohnt, welchem Ergebnis man trauen darf, wann ein Ansatz eine Sackgasse ist. Anthropic nennt das „research taste". Genau diese Lücke trennt die heutige KI von einem System, das seinen Nachfolger autonom entwirft.

Der letzte menschliche Vorsprung schrumpft

Und sie schließt sich messbar. Anthropic untermauert das mit einem ungewöhnlich ehrlichen Experiment. Aus echten Arbeitssitzungen suchten die Autoren Momente heraus, in denen ein menschlicher Forscher eine Abzweigung nahm, die die Sitzung erst entgleisen ließ. Dann zeigten sie verschiedenen Modellen nur den Verlauf bis kurz vor dem Fehltritt und fragten: Was würdest du als Nächstes tun? Ein separater Claude, der das Ende kannte, bewertete, wer den besseren Schritt vorschlug.

Das Ergebnis: Im November 2025 schlug das beste Modell den menschlichen Schritt in 51 Prozent der Fälle. Im April 2026 waren es 64 Prozent. Der Alltag der Forschung besteht aus genau solchen „Was-jetzt"-Entscheidungen. Decrypt brachte den Befund in der Schlagzeile auf den Punkt: Die KI entwickelt bereits KI — und der Mensch könnte sie inzwischen sogar bremsen.

claude code session success rate.webp — https://www.anthropic.com/institute/recursive-self-improvement

Denn paradoxerweise wird der Mensch zum Nadelöhr. Anthropic landet bei einem alten Gesetz der Informatik, Amdahls Gesetz: Wer einen Teil eines Prozesses beschleunigt, verschiebt den Engpass nur woanders hin. Seit so viel Code durch die Organisation strömt, ist das menschliche Code-Review zum neuen Flaschenhals geworden. Solange ein Mensch Code nicht so schnell prüfen kann, wie die Maschine ihn schreibt, sitzt die Bremse beim Menschen — nicht bei der KI.

Was passiert, wenn sich die Schleife schließt?

Hier wird der Report von einem Lagebericht zu etwas Größerem. Denn wenn die KI Experimente entwirft, ausführt und auswertet — und dabei auch noch die besseren nächsten Schritte vorschlägt — dann bleibt am Ende nur eine menschliche Aufgabe übrig: zusehen, ob man dem Ganzen noch trauen kann. Anthropic beschreibt diese Zukunft offen. Das Tempo des Fortschritts werde dann nur noch von verfügbarer Rechenleistung bestimmt, der Mensch verlagere seinen Beitrag fast vollständig auf Aufsicht, Validierung und Verifikation eines „virtuellen Labors", das von KI-Systemen betrieben wird.

Das Faszinierende daran ist nicht der Untergang, sondern die Hebelwirkung. Ein System, das KI-Forschung automatisieren kann, hätte Fähigkeiten, die sich auf den Rest der Wissenschaft übertragen lassen — Medikamentenforschung, Materialwissenschaft, Energie. Anthropic erwartet, dass auf rekursive Intelligenz schnell verkörperte Intelligenz folgt, also Robotik, mit demselben Muster aus steigender Leistung bei sinkenden Kosten. Das ist die optimistische Lesart, und ich teile sie zu großen Teilen: Wenn das gut geht, ist es die größte Beschleunigung von Wissen seit der Erfindung des Buchdrucks.

Die unbequeme Seite steht im selben Absatz. Die ehrlichste Passage des ganzen Reports betrifft das Kontrollproblem, und sie ist bemerkenswert demütig formuliert.

Mit anderen Worten: Wenn Modelle ihre Nachfolger bauen, vererben sie nicht nur ihre Fähigkeiten, sondern potenziell auch ihre Macken — und zwar in einem Tempo, das menschliches Verständnis übersteigen kann. Anthropic stellt dem ein zweites, hoffnungsvolleres Szenario gegenüber: dass die Modelle „weise genug" sein könnten, die Entwicklung selbst anzuhalten, wenn sie merken, dass etwas nicht stimmt. Welcher dieser Pfade eintritt, sei das, worüber man am wenigsten sicher sei.

Und es gibt eine wohltuend nüchterne Erdung in dem Text. Selbst eine sich selbst verbessernde Superintelligenz stößt an die Realität. Anthropic formuliert es so: Mehr Intelligenz kann nicht lernen, was ein Medikament über Jahrzehnte des Gebrauchs anrichtet, kann keine Wahlen früher abhalten, als eine Verfassung es zulässt, und kann aus einem Fremden nicht an einem Wochenende einen alten Freund machen. Das Labor mag mit der Geschwindigkeit von Rechenleistung laufen — die gelebte Welt der Menschen bleibt von ihren eigenen Engpässen getaktet.

Die drei Szenarien

Anthropic legt sich nicht fest, sondern skizziert drei Wege. Erstens: Der Trend bricht ab, weil aus den Exponentialkurven S-Kurven werden, die abflachen — oder weil schlicht Chips und Strom fehlen. Selbst dann verändert die schon vorhandene KI die Welt, weil ein 100-Personen-Unternehmen zunehmend die Arbeit von 1.000 erledigen kann. Zweitens: Die Labore sehen weiter sich verstärkende Effizienzgewinne, Menschen setzen aber weiter die Richtung. Drittens: volle rekursive Selbstverbesserung, bei der das Tempo nur noch von Rechenleistung bestimmt wird. Anthropic hält das zweite Szenario für das wahrscheinlichste — und das dritte für jenes, auf das die Welt am schlechtesten vorbereitet ist.

claude closing the loop.webp — https://www.anthropic.com/institute/recursive-self-improvement

Der bemerkenswerteste Teil ist, dass dasselbe Unternehmen, das diesen Fortschritt vorantreibt, zugleich die Option auf eine global koordinierte Pause fordert. Nicht aus Bescheidenheit, sondern aus Mechanik: Eine einseitige Pause eines Labors verschiebt nur, wer vorne liegt. Sinnvoll wäre sie erst, wenn mehrere Labore in mehreren Ländern unter denselben, überprüfbaren Bedingungen anhalten. Und Trainingsläufe lassen sich leichter verbergen als Raketensilos. Das ist das eigentliche Dilemma des Textes.

Und jetzt der Punkt, an dem es Krypto wird

Bis hierher ist das eine reine KI-Geschichte. Der Anschluss an unsere Welt ergibt sich aber direkt aus dem Report selbst. In zwei der drei Szenarien ist nicht mehr die Intelligenz der Engpass, sondern die Infrastruktur dahinter: Chip-Fertigung, Stromnetze, Bandbreite. Im Klartext steht da, dass Fortschritt zur Funktion von Rechenleistung und Energie wird. Und genau an diesen physischen Engpässen hat Krypto in den letzten Jahren mehr gebaut als jede andere Industrie. Drei Berührungspunkte sind konkret.

1. Rechenleistung und Energie

Der GPU-Hunger der Labore übersteigt 2026 das Angebot deutlich. Daraus ist ein eigener Krypto-Sektor entstanden: dezentrale Compute-Netze wie Render, Akash, io.net und Bittensor, die GPU-Kapazität aus verteilten Quellen bündeln und über Token-Anreize verteilen. Manche dieser Protokolle kaufen über DAO-Strukturen inzwischen physische GPU-Cluster, damit das Netz eine eigene, souveräne Rechenversorgung hat. Noch direkter ist der Energie-Hebel: Bitcoin-Miner sitzen auf genau dem, was KI-Rechenzentren am dringendsten brauchen — gesicherte Stromanschlüsse, billige Energie, gekühlte Hallen. Etliche Mining-Firmen widmen Kapazität an KI-Compute um. Die energieintensivste Ecke der Krypto-Welt wird zum Vermieter des KI-Booms.

2. Die Agenten-Wirtschaft braucht Schienen

Anthropics dritte Stufe sind Agenten, die andere Agenten beauftragen. Eine Maschine, die eine andere Maschine bezahlt, passt aber schlecht zu einer Zahlungsinfrastruktur, die für Menschen mit Kreditkarten gebaut wurde. Eine Kartentransaktion kostet mindestens rund 30 Cent Grundgebühr — Sub-Cent-Beträge für einen einzelnen Inferenz-Aufruf lassen sich darüber nicht abwickeln. Genau hier sind Stablecoins und Protokolle wie Coinbases x402 zur Standardlösung geworden. Rund 73 Millionen US-Dollar an Maschine-zu-Maschine-Settlements liefen zwischen Mai 2025 und April 2026 über 176 Millionen Transaktionen, knapp 98 Prozent davon in Circles USDC. Juniper Research prognostiziert bis 2030 rund 1,5 Billionen Dollar an Agenten-Ausgaben. Coinbase, Stripe und Visa bauen mit.

73 Mio. $

Maschine-zu-Maschine-Settlements (Mai 25–Apr 26)

98 %

davon in USDC abgewickelt

1,5 Bio. $

prognostizierte Agenten-Ausgaben bis 2030 (Juniper)

3. Verifizierbarkeit — die Disziplin, die Krypto seit jeher beherrscht

Der tiefste Berührungspunkt ist der unscheinbarste. Anthropic schreibt, dass die Rolle des Menschen sich in Richtung Aufsicht, Validierung und Verifikation verschiebt. Wenn die KI mehr ausgibt, als ein Mensch prüfen kann, wird die zentrale Frage: Woher weiß ich, dass dieses Ergebnis stimmt? Vertrauen wird zum Flaschenhals. Verifizierbarkeit ohne Vertrauen in eine zentrale Instanz ist die Gründungsidee von Bitcoin. Kryptografische Beweise, On-Chain-Nachweise von Herkunft und Integrität und zunehmend zkML — also der Beweis, dass ein bestimmtes Modell ein bestimmtes Ergebnis erzeugt hat, ohne das Modell offenzulegen — sind genau die Bausteine, mit denen man der Ausgabe einer Maschine trauen kann, ohne ihr blind zu glauben. Die KI-Industrie sucht gerade ein Werkzeug, das die Krypto-Welt seit 2009 schmiedet.

Ein Detail mit Sprengkraft: Project Glasswing

Eine Stelle im Report verdient für jeden, der Krypto hält, besondere Aufmerksamkeit. Anthropic berichtet, dass sein neues Modell im Rahmen von „Project Glasswing" in den ersten Wochen mehr als 10.000 als hoch oder kritisch eingestufte Sicherheitslücken in den wichtigsten Systemen der Welt fand. Der Engpass in der Cyberabwehr habe sich dadurch verschoben — weg vom Finden der Lücken, hin zum schnellen Patchen.

🛡️

Was das für Smart Contracts bedeutet

Eine KI, die Solidity in diesem Tempo und dieser Tiefe auditieren kann, ist das beste Werkzeug der Sicherheitsforschung seit der Formal Verification. Dieselbe Fähigkeit liegt aber auch in der Hand von Angreifern, die Protokolle nach genau diesen Lücken absuchen. Code, der jahrelang als „battle-tested" galt, ist gegen einen Prüfer dieser Klasse nicht automatisch sicher. Die Lehre ist nicht Panik, sondern Hygiene: aktuelle Audits, Bug-Bounty-Programme, Time-Locks und Notbremsen werden wichtiger, nicht weniger.

Meine Einordnung

Ich bin als Person eher Optimist, was KI angeht. Ich glaube, dass diese Werkzeuge mehr Menschen produktiver, kreativer und unabhängiger machen, als sie ersetzen. Und ich finde es richtig, dass ein Labor seine internen Zahlen offenlegt, statt sie hinter Demo-Videos zu verstecken. Dieser Report ist genau die Art von Transparenz, die ich mir von der ganzen Branche wünsche.

Aber Optimismus heißt nicht, naiv zu sein. Das Stärkste an dem Artikel ist, dass er von denselben Leuten kommt, die gleichzeitig nach einer Bremse fragen. Die ehrliche Frage ist nicht „KI ja oder nein", sondern: Wie baut man eine Welt, in der Maschinen den Großteil der digitalen Arbeit erledigen, ohne die Kontrolle und das Vertrauen zu verlieren? Genau an dieser Stelle hört für mich die reine Tech-News auf und wird zu etwas, das jeden angeht, der langfristig denkt. Und es ist kein Zufall, dass die Antworten — neutrale Rechenmärkte, vertrauenslose Zahlungssysteme, überprüfbare Beweise — sich auffällig stark mit dem überschneiden, was Krypto im Kern ist. Nicht jeder Token mit „AI" im Namen profitiert davon. Aber die Bauklötze, an denen seit Jahren gearbeitet wird, werden gerade von der größten Tech-Welle unserer Zeit gebraucht.

Fazit

„When AI builds itself" ist im Kern die Antwort auf eine Frage, die lange hypothetisch war: Was passiert, wenn KI anfängt, sich selbst zu entwickeln? Anthropics Antwort lautet, nüchtern und mit Zahlen belegt — es passiert bereits, langsam, aber beschleunigend, und die letzte rein menschliche Aufgabe schrumpft. Ob daraus eine der größten Befreiungen der Menschheitsgeschichte wird oder ein Kontrollverlust, ist offen, und das Unternehmen sagt das selbst. Für uns als Krypto-Leute ist die Nebenwirkung dieser Erkenntnis interessant: Sobald nicht mehr Intelligenz der Engpass ist, sondern Rechenleistung, Energie, Zahlungsschienen und Verifizierbarkeit, sitzt unsere Branche nicht am Rand dieser Geschichte, sondern in ihrer Infrastruktur. Die Frage ist nicht mehr, ob KI und Krypto konvergieren. Die Frage ist, wer am Ende die Schienen besitzt, auf denen das alles fährt.

Was ist „recursive self-improvement" genau?

Rekursive Selbstverbesserung beschreibt den Punkt, an dem ein KI-System fähig wird, seinen eigenen Nachfolger weitgehend autonom zu entwerfen, zu bauen und zu trainieren. Jede Generation verbessert die nächste, der Mensch tritt in den Hintergrund. Anthropic betont, dass dieser Zustand noch nicht erreicht und nicht unausweichlich ist — aber näher rücken könnte, als Institutionen darauf vorbereitet sind.

Schreibt Claude wirklich 80 Prozent von Anthropics Code?

Stand Mai 2026 ja, bezogen auf produktiv gemergte Codezeilen. Die Unternehmensführung nennt inklusive Skripten und Experimentalcode öffentlich sogar „90 Prozent oder mehr". Die 80-Prozent-Zahl ist die konservativere Messung, weil die Attributions-Pipeline Lücken hat und nicht zugeordnete Zeilen teils auch nicht von Menschen stammen.

Bedeutet das, die KI ist jetzt unkontrollierbar?

Nein. Heute setzen Menschen weiter die Richtung, prüfen Ergebnisse und entscheiden, welche Experimente laufen. Anthropic beschreibt aber offen ein Szenario, in dem sich Fehlausrichtungen verstärken könnten, während Modelle ihre Nachfolger bauen — und fordert deshalb Mechanismen, um die Entwicklung notfalls überprüfbar zu verlangsamen. Es geht um Vorsorge, nicht um eine akute Eskalation.

Was hat das mit Bitcoin und Krypto zu tun?

Anthropic benennt die kommenden Engpässe der KI: Rechenleistung, Energie, die Koordination und Bezahlung von Agenten sowie die Verifizierbarkeit von Ergebnissen. Für all das existiert in der Krypto-Welt Infrastruktur — dezentrale Compute-Netze, Bitcoin-Miner mit Energie- und Standortvorteilen, Stablecoin-Zahlungsschienen für Maschinen und kryptografische Beweissysteme. Deshalb ist der Report auch eine Standortbestimmung für die AI-Krypto-Konvergenz.

Sollte ich jetzt AI-Coins kaufen?

Dieser Artikel ist keine Anlageberatung. Wichtig ist die Trennung zwischen Projekten mit echtem Infrastruktur-Nutzen (Rechenleistung, Zahlungen, Verifikation) und solchen, die nur das Narrativ tragen. Der Markt für AI-Token ist hochvolatil und voller kurzlebiger Erzählungen. Eine These über das nächste Jahrzehnt rechtfertigt keinen unüberlegten Kauf am nächsten Tag.

Quellen

Quelle: Anthropic Institute

Hinweis: Dieser Artikel wurde mit KI-Unterstützung erstellt und redaktionell geprüft.

Alle Artikel

Lies auch

Marktanalyse

165.000 Millionäre fliehen - was der Vermögensreport 2026 über Krypto verschweigt

Bitcoin

XRP: Südkoreanische Trader stützen Kurs

Bitcoin

EZB-Zinsen und US-Tech-Daten bewegen Bitcoin

Über den Autor

Phillip K.

Ich beschäftige mich seit 2017 mit Kryptowährungen, zunächst mit starkem Bitcoin-Fokus, heute schwerpunktmäßig mit XRP und dem XRP Ledger. Ich analysiere Marktdynamiken, regulatorische Entwicklungen und institutionelle Adoption.

Risikohinweis: Meine Inhalte dienen ausschließlich zur Information und stellen keine Anlageberatung dar.

Diese Seite kann Affiliate-Links enthalten. Bei einem Kauf über diese Links erhalte ich eine Provision — du unterstützt meinen Kanal ohne Mehrkosten. Danke! ❤️