本サイトで使う用語
AI関連スコア・採用率・シグネチャファイル等、各ページに登場する固有用語の定義をまとめています。詳しい計算式は算出方法ページを参照。
SCORING スコア関連
AI関連スコア
各リポジトリの「AIっぽさ」を 0-100 で表すスコア。name/description/topics/README に AIキーワードが含まれるかをチェック。閾値 40 以上で詳細追跡対象。
個人開発候補スコア
0-100。owner_type=User、followers が少ない、README あり、複数 push あり、homepage あり等のヒューリスティックで集計。閾値 60 以上で「個人開発候補」。
Web公開候補スコア
0-100。homepage URL の有無 + Vercel/Netlify 等にデプロイ済み + READMEに demo URL/landing keywords が含まれるか。閾値 50 以上で「Web公開候補」。
総合スコア
各構成要素を 2021年平均=100 で正規化し、重み付き合算した参考値。サイトの主役は具体的な数(言及Repo数等)。総合スコアは補助。
継続開発率
対象月の3ヶ月前に作成されたAI関連Repoのうち、対象月の直近30日内に push があった Repo の割合。0.0-1.0、母集団が0なら null。
採用率 / 占有率
13カテゴリ各々の中で、各キーワードを言及している Repo 数とそのカテゴリ内シェア(%)。description / topics / READMEのAI要約を結合した検索コーパスへの部分文字列マッチで集計。
DETECTION 検出関連
シグネチャファイル
AIコーディングツールが生成・参照する設定ファイル。Repo でこれが置かれていれば、そのツール利用の痕跡として検出される:
CLAUDE.md / AGENTS.md / .cursorrules / .windsurfrules / .github/copilot-instructions.md / .aider.conf.yml / .clinerules
AIキーワード辞書
13カテゴリの追跡対象キーワード集 (`ai_keywords` テーブル)。LangChain / OpenAI / pgvector / Claude 等。短くて誤マッチしやすい語(Lit / Bun 等)は無効化済み。
AI要約
OpenAI gpt-5-mini により生成された500-1000字のREADME要約。日英両方を保持。月予算 $3 内で段階的に生成。
検出されたAIスタック
各Repo詳細ページに表示される、そのRepoの description / topics / 要約に登場した AI関連キーワードのカテゴリ別リスト。
SOURCES データソース関連
GitHub GraphQL / REST
GitHub公式の2系統API。GraphQLでRepo詳細・READMEを一括取得、REST Searchで新規Repo発見、REST Code Searchで全GitHubのシグネチャ件数。
GH Archive
GitHubの公開イベント(create / push / fork / watch 等)を時系列で記録している第三者プロジェクト。BigQueryの公開データセットとして無料で誰でもクエリ可能。
BigQuery
Google Cloud のデータウェアハウスサービス。本サイトでは GH Archive 月次テーブル参照に利用。月1TiBの無料枠内で運用。
月次パーティション
`repo_metric_snapshots` 等の主要時系列テーブルは MySQL の `PARTITION BY RANGE (TO_DAYS(month))` で月別分割。古い月の削除・参照効率のため。