AI開発影響研究所 EN
用語集
用語集

本サイトで使う用語

AI関連スコア・採用率・シグネチャファイル等、各ページに登場する固有用語の定義をまとめています。詳しい計算式は算出方法ページを参照。

SCORING スコア関連

AI関連スコア

各リポジトリの「AIっぽさ」を 0-100 で表すスコア。name/description/topics/README に AIキーワードが含まれるかをチェック。閾値 40 以上で詳細追跡対象。

→ 計算式

個人開発候補スコア

0-100。owner_type=User、followers が少ない、README あり、複数 push あり、homepage あり等のヒューリスティックで集計。閾値 60 以上で「個人開発候補」。

Web公開候補スコア

0-100。homepage URL の有無 + Vercel/Netlify 等にデプロイ済み + READMEに demo URL/landing keywords が含まれるか。閾値 50 以上で「Web公開候補」。

総合スコア

各構成要素を 2021年平均=100 で正規化し、重み付き合算した参考値。サイトの主役は具体的な数(言及Repo数等)。総合スコアは補助。

継続開発率

対象月の3ヶ月前に作成されたAI関連Repoのうち、対象月の直近30日内に push があった Repo の割合。0.0-1.0、母集団が0なら null。

採用率 / 占有率

13カテゴリ各々の中で、各キーワードを言及している Repo 数とそのカテゴリ内シェア(%)。description / topics / READMEのAI要約を結合した検索コーパスへの部分文字列マッチで集計。

DETECTION 検出関連

シグネチャファイル

AIコーディングツールが生成・参照する設定ファイル。Repo でこれが置かれていれば、そのツール利用の痕跡として検出される: CLAUDE.md / AGENTS.md / .cursorrules / .windsurfrules / .github/copilot-instructions.md / .aider.conf.yml / .clinerules

→ ツール採用率

AIキーワード辞書

13カテゴリの追跡対象キーワード集 (`ai_keywords` テーブル)。LangChain / OpenAI / pgvector / Claude 等。短くて誤マッチしやすい語(Lit / Bun 等)は無効化済み。

AI要約

OpenAI gpt-5-mini により生成された500-1000字のREADME要約。日英両方を保持。月予算 $3 内で段階的に生成。

検出されたAIスタック

各Repo詳細ページに表示される、そのRepoの description / topics / 要約に登場した AI関連キーワードのカテゴリ別リスト。

SOURCES データソース関連

GitHub GraphQL / REST

GitHub公式の2系統API。GraphQLでRepo詳細・READMEを一括取得、REST Searchで新規Repo発見、REST Code Searchで全GitHubのシグネチャ件数。

GH Archive

GitHubの公開イベント(create / push / fork / watch 等)を時系列で記録している第三者プロジェクト。BigQueryの公開データセットとして無料で誰でもクエリ可能。

BigQuery

Google Cloud のデータウェアハウスサービス。本サイトでは GH Archive 月次テーブル参照に利用。月1TiBの無料枠内で運用。

月次パーティション

`repo_metric_snapshots` 等の主要時系列テーブルは MySQL の `PARTITION BY RANGE (TO_DAYS(month))` で月別分割。古い月の削除・参照効率のため。

EXPLORE 関連ページ

🧮

算出方法

各用語の計算式と検出ロジック

🔌

データソース

各APIの使い分けとレート制限

ℹ️

このサイトについて

サイトの目的と方針