<aside>
🔗 プロジェクト概要はプロジェクトプロパティのリンクから閲覧できます。

</aside>
2020~2021年にやっていた「シビックテック俯瞰図鑑」の後継プロジェクトで、東大シビックテック・デザイン学寄付研究部門(CTDI)の活動の一部として再始動しました。いろんなシビックテック事例やそのライフサイクル、系統樹なんかを追えるようなナレッジグラフを作ってオープンデータにすることで、みんなのシビックテック活動に役立つ分析をしたりできるのではないかと。あと、最近はGeminiなどLLMを使ったクローリングでWebから事例を収集できるので、シビックテックっぽい最新事例を収集するクローラーも作る予定。
「アナーカイブ (anarchive) 」というのは、静的データであるアーカイブに対して「リアルタイムで生成・変化し続けるデータ群を指す概念」らしいです。会津の藤井さんに教えてもらいました。シビックテックプロジェクトが動的に少しずつ変化していくプロセスを追えるようにしたいので、「シビックテック・アナーカイブ」としました。
これまでにも、Civic Tech Field Guildやセーブポイント、Wikidataの「シビックテック俯瞰図鑑」など似たようなプロジェクトがいっぱいあるので、それらともうまく連携しつつ、良いデータスキーマを設計し、LLMで事例を自動収集したい。
今日の作業内容 Today’s Mission:
- ナレッジグラフのスキーマを検討する:
これまでにも、Civic Tech Field Guildやセーブポイント、Wikidataの「シビックテック俯瞰図鑑」など似たようなプロジェクトがいっぱいあるので、それらを参考にしつつ、シビックテックプロジェクトの動的かつ細かい変化を追えるようなデータスキーマを考える
- どんな情報ソースから集め、どんなアウトプットを作り、どのように利用するのか?
- LLMでクローラーを作る:
上記ナレッジグラフのデータスキーマを踏まえ、シビックテック事例をクローリングするスクリプトをGemini APIで試作する
- 使い道を妄想する:
いい感じのアナーカイブナレッジグラフができたら、どんな分析ができそうか、何に使えそうかを妄想する
- どんな地域の活動が長く続くのか?を分析したい
- プロジェクトのライフサイクルを分析して、失敗するアンチパターンを明らかに
- 分野ごとにプロジェクトの難しさを評価?
こんな人にきて欲しい People needed:
- シビックテックプロジェクトの事例収集や分析に興味のある方
- 事例をWebクローリングするLLMエージェントを作ってみたい方
- ナレッジグラフで「アナーカイブ (anarchive)」を実装するという世界初の試みに興味のある方
本日の成果 Today’s Outcome:
-
中間報告

Pythonで収集したCivic Techプロジェクトをカテゴリごとにマッピングして、各プロジェクトに活動状況タグ(Started, Ongoing, Released, Cancelled, Archived etc.)を付与し、カテゴリごとのプロジェクトの達成状況を確認できるようにする。
→プロジェクト数が多くても、プロトタイプまで至らない=実現が難しいカテゴリにコミットする人が増える?
→なぜキャンセルが多いか原因調査をすることができ、状況の改善につながる。
-
最終報告
- シビックテックプロジェクトの動的な変化を捉えられるようなナレッジグラフのデータスキーマ案を試作
- Geminiでシビックテック事例を収集するWebクローラーを試作
- とりあえずJSON-LDの形で出力できることを確認
- 「シビックテック」という語がクエリに含まれていると、見つかる事例が偏ってしまう問題が明らかに
- 有名なおなじみのアプリやプロジェクトばかりが収集されてしまう
- 世の中には、シビックテックだと思わずにシビックテックっぽい活動をしている事例がいっぱいあるはず
- そこで、教育分野のシビックテックプロジェクトを例に、「シビックテック」という語を含まないクエリの方が幅広く事例収集できることを確認した
本日の嬉しかったこと・ありがとう Today’s Flyinghigh: