Interpretability Coverage

interpretability-coverage (E175)

← Back to pagePath: /ai-transition-model/interpretability-coverage/

Page Metadata

{
  "id": "interpretability-coverage",
  "numericId": null,
  "path": "/ai-transition-model/interpretability-coverage/",
  "filePath": "ai-transition-model/interpretability-coverage.mdx",
  "title": "Interpretability Coverage",
  "quality": null,
  "importance": null,
  "contentFormat": "article",
  "tractability": null,
  "neglectedness": null,
  "uncertainty": null,
  "causalLevel": null,
  "lastUpdated": null,
  "llmSummary": "This page contains only a React component import with no actual content displayed. Cannot assess interpretability coverage methodology or findings without rendered content.",
  "structuredSummary": null,
  "description": null,
  "ratings": {
    "novelty": 0,
    "rigor": 0,
    "actionability": 0,
    "completeness": 0
  },
  "category": "ai-transition-model",
  "subcategory": "factors-misalignment-potential",
  "clusters": [
    "ai-safety"
  ],
  "metrics": {
    "wordCount": 0,
    "tableCount": 0,
    "diagramCount": 0,
    "internalLinks": 0,
    "externalLinks": 0,
    "footnoteCount": 0,
    "bulletRatio": 0,
    "sectionCount": 0,
    "hasOverview": false,
    "structuralScore": 2
  },
  "suggestedQuality": 13,
  "updateFrequency": null,
  "evergreen": true,
  "wordCount": 0,
  "unconvertedLinks": [],
  "unconvertedLinkCount": 0,
  "convertedLinkCount": 0,
  "backlinkCount": 4,
  "redundancy": {
    "maxSimilarity": 0,
    "similarPages": []
  }
}

Entity Data

{
  "id": "interpretability-coverage",
  "type": "ai-transition-model-parameter",
  "title": "Interpretability Coverage",
  "description": "The percentage of model behavior that can be explained and understood by researchers. Measures transparency into AI system internals.",
  "tags": [
    "safety",
    "technical",
    "interpretability"
  ],
  "relatedEntries": [
    {
      "id": "interpretability",
      "type": "concept",
      "relationship": "related"
    },
    {
      "id": "alignment-progress",
      "type": "ai-transition-model-metric",
      "relationship": "measured-by"
    }
  ],
  "sources": [],
  "lastUpdated": "2025-12",
  "customFields": [
    {
      "label": "Direction",
      "value": "Higher is better"
    },
    {
      "label": "Current Trend",
      "value": "Improving slowly (70% of Claude 3 Sonnet features interpretable, but only ~10% of frontier model capacity mapped)"
    },
    {
      "label": "Key Measurement",
      "value": "Percentage of model behavior explainable, feature coverage"
    }
  ]
}

Canonical Facts (0)

No facts for this entity

External Links

{
  "lesswrong": "https://www.lesswrong.com/tag/interpretability-ml-and-ai"
}

Backlinks (4)

id	title	type	relationship
misalignment-potential	Misalignment Potential	ai-transition-model-factor	composed-of
alignment-progress	Alignment Progress	ai-transition-model-metric	measures
alignment-robustness	Alignment Robustness	ai-transition-model-parameter	related
interpretability	Interpretability	safety-agenda	increases

Frontmatter

{
  "title": "Interpretability Coverage",
  "sidebar": {
    "order": 10
  },
  "importance": 0,
  "quality": 0,
  "llmSummary": "This page contains only a React component import with no actual content displayed. Cannot assess interpretability coverage methodology or findings without rendered content.",
  "ratings": {
    "novelty": 0,
    "rigor": 0,
    "actionability": 0,
    "completeness": 0
  },
  "clusters": [
    "ai-safety"
  ],
  "subcategory": "factors-misalignment-potential"
}

Raw MDX Source

---
title: Interpretability Coverage
sidebar:
  order: 10
importance: 0
quality: 0
llmSummary: This page contains only a React component import with no actual content displayed. Cannot assess interpretability coverage methodology or findings without rendered content.
ratings:
  novelty: 0
  rigor: 0
  actionability: 0
  completeness: 0
clusters:
  - ai-safety
subcategory: factors-misalignment-potential
---
import {TransitionModelContent} from '@components/wiki/TransitionModelContent';

<TransitionModelContent entityId="E331" />