SUMMARY AI要約 by gpt-5-mini
このリポジトリは、RAG(Retrieval-Augmented Generation)システムに対する攻撃を再現する自己完結型のDockerラボです。ローカルのLlama 3.2 3B(Ollama経由)とフロンティアモデルのClaude Haiku 4.5(Anthropic API経由)で検証された4種類の攻撃(文書汚染、間接プロンプト注入、直接的なデータ漏洩/交差汚染、PDFの不可視テキスト搬入)をスクリプト化しており、各攻撃成果は再現可能なJSON証拠付きで残ります。簡易防御として正規表現ベースの出力フィルタも実装されています。 主な知見は「高い推論能力はコンテンツ汚染への耐性と逆相関にある」こと。フロンティアモデルは注入型攻撃(明示的な命令のすり替え)には安全訓練が有効だが、見た目が正規文書に似た偽造コンテンツには脆弱で、場合によっては有害な誤情報をより説得力を持って強化してしまいます。導入・実行はDockerとDocker Composeがあれば可能で、Anthropic APIキーはClaudeテスト時のみ必要です。対象読者はRAG導入者、セキュリティ研究者、レッドチームや防御担当者で、検索層での制御がモデル層の安全訓練だけでは不十分であることを示す実践的な検証環境を提供します。
DETECTED 検出されたAIスタック
このRepoのdescription / GitHub topics / READMEのAI要約に出現したAI関連キーワードをカテゴリ別に表示。各バッジは該当カテゴリの詳細ランキングへリンクします。
GitHub Topics
使用言語(バイト数比)
オーナー情報
日付
| GitHub作成日 | 2026-05-09 |
| 最終Push | 2026-05-09 |
| 当サイト初検出 | 2026-05-09 |
| 最終取得 | 2026-05-09 15:42 |
類似Repo (同じ言語のAI関連Repo)
AI Agent 中文學習地圖 — 從零開始的結構化學習路徑,每階段有必做練習跟必修閱讀。三語對照(繁中/简中/English)。歡迎社群一起貢獻、優化內容。
lonr-6/cc-desktop-switchLightweight desktop tool for configuring DeepSeek, Kimi, Zhipu GLM and Bailian providers in Claude Desktop.
TomSolid/myPKAMy whole life. One folder. No vendor. myPKA is a Personal Knowledge Architecture with a 4-person AI team baked in. Plain markdown files on your machine. ICOR® methodology. Works in Claude Code, Codex, Gemini, Cursor, Obsidian.
linora-u/AgentLoomSimple, flexible workflow orchestration for multi-agent AI apps, with YAML configuration, runtime safety, observability, and resume support.
oodadoudou/TransoriaAI desktop toolkit for novel translation, glossary management, and batch text replacement.
hieuchaydi/MemoryFeedLocal-first social memory search engine with browser capture, hybrid AI retrieval, and optional C++ acceleration.
alias8818/enoch-agentic-research-systemAgentic research control plane with local proof, provenance packaging, and explicit audit-status reporting.
helderpgoncalves/feedbotTurn community chat into a structured product backlog — Telegram + dashboard + MCP for Claude Code.