Claude Code

AI Agent Reliability Report

6.4

Avg Severity /10

Total Incidents

Critical

High

Failure Modes

Destructive Action 3

Other 2

Security Vulnerability 2

Hallucination 1

Root Causes

Confidence Miscalibration 2

Context Overflow 1

Other 1

Instruction Misunderstanding 1

Training Data Gap 1

Scope Misunderstanding 1

Tool Misuse 1

Frequently Asked Questions

Is Claude Code reliable?

Based on 8 documented incidents, Claude Code has an average failure severity of 6.4/10. 3 incidents were rated critical and 2 were rated high severity. Common failure modes include destructive action.

What are the most common Claude Code failures?

The most frequently documented Claude Code failure modes are: destructive action (3 incidents), other (2 incidents), security vulnerability (2 incidents). These failures range from critical to high severity.

How many Claude Code AI failures have been documented?

StupidLLM has documented 8 Claude Code AI agent failures. Each incident is severity-scored on a 0-10 scale, verified against source evidence, and categorized by failure mode and root cause.

All Claude Code Incidents

STUPID-2026-0003 10/10 CRITICAL destructive action Verified

Claude Code

Failure Modes

Root Causes

Frequently Asked Questions

Is Claude Code reliable?

What are the most common Claude Code failures?

How many Claude Code AI failures have been documented?

All Claude Code Incidents

Claude Code ran rm -rf on test fixtures thinking they were temp files

Claude Code wiped DataTalks.Club's production infrastructure — 2.5 years of course data — during an AWS migration

Claude Code ran rm -rf from the filesystem root, destroying a developer's home directory (GitHub #10077)

Claude Code MCP trust boundary failures allow workspace privilege escalation

Claude Opus 4.5 leaked API key in console logs during YouTube scraper build

Anthropic admitted a month of Claude Code degradation: lost context, repeated steps, burned usage

Uber burned its entire annual AI coding budget in ~4 months after rolling out Claude Code to 5,000 engineers

Claude Code hallucinated a non-existent npm package and installed it