wiki-ingest

karpathy-wiki-pattern plugin 的核心 skill——把單份 raw/ 素材編譯成 wiki/entities/ 原子化概念頁。vault 大半的 entity 都從這個 skill 來的

為什麼存在

Karpathy LLM Wiki 模式 提出「raw → LLM 編譯 → wiki」三層架構,但具體怎麼編譯沒寫死。wiki-ingest 是這個 pattern 的主要實作工具——把使用者從「我看到一篇文章想存」到「wiki 多了 1-5 個 entity」中間的所有動作自動化:

→ 一個 ingest 動作背後是 10+ 個自動化步驟

觸發

中文 英文
「ingest raw/xxx」 "ingest raw/xxx"
「處理 raw/articles/yyy」 "process raw/yyy"
「依 CLAUDE.md ingest 這份」 "ingest this article"
「把這份素材編譯進 wiki」 "compile xxx into wiki"

它做什麼(v1.3.2 完整 12 步)

1. Locate source         識別 raw/ 路徑
2. Pass A 掃描           找既有 entity(避免重建)
3. Pass B 抽概念         LLM 主處理:摘要 + 抽 1-5 個原子概念
4. Collision check       檢查同 basename 是否已在他處(避免歧義)
5. Write entities        按 ENTITY_TEMPLATE 寫 + 強/推/外部三組相關概念
6. Append to log         wiki/log.md 加一筆
7. Update index          wiki/index.md 加新 entity + bump 計數 + 最後更新
8. Track entities        記錄這次 ingest 產出哪些 entity(給 step 9 用)
9. Decide PARA route     raw 檔該搬到哪個 PARA tier
10. Move raw             執行搬遷
11. Update sources        更新所有引用該 raw 的 entity
12. Log routing          log.md 補搬檔紀錄

v1.2 / v1.3 / v1.3.2 演進

版本 加了什麼
v1.0-1.1 基礎 ingest(單頁產生、加 backlinks、自動歸檔 archive)
v1.2 三段式 pipeline(Pass A/B/C)+ 連結 provenance(強/推/外部)+ Audit report(INGEST_*.md)
v1.3.0 entity 階層化 <domain>/<type>/PARA Routing(raw 分流到 20-Projects/30-Areas/40-Resources) + Mode B backfill(一次性遷移舊 entity)
v1.3.2 step 7 明寫 wiki/index.md 同步(header + 條目)+ collision pre-check(v1.3.2 lint 配對)

跟其他 skill 的分工(vault 6 個 wiki-* skill)

寫入流程:
  raw → wiki-ingest(單檔) → wiki entities
  raw → wiki-compile(長文 + map) → wiki entities + maps

檢查 / 維護:
  wiki entities → wiki-lint(偵測) → 報告
                ↓
                wiki-repair(修補) → 修好的 wiki

讀取:
  wiki entities → wiki-query(雙鏈引用) → 給使用者答案
                ↓
                wiki-notion-sync(推送) → Notion 副本
Skill 方向 寫嗎 規模
wiki-ingest raw → wiki ✅ 寫 單檔 1-5 entity
wiki-compile 長文 → wiki + map ✅ 寫 10-30 entity
wiki-lint wiki 自身 ❌ 讀 -
wiki-repair wiki → wiki ✅ 修 修問題
wiki-query wiki → 答案 ❌ 讀 -
wiki-notion-sync wiki → Notion ❌ 推 -

三段式 pipeline(v1.2 核心)