AI Dev Impact Lab JA
← Rankings · AI-RELATED REPO

KezoSec/rag-poisoning-lab

A self-contained AI security lab demonstrating document poisoning, indirect prompt injection, and data exfiltration in RAG systems. Explores the "helpfulness paradox" across local and frontier LLMs.

⚡ AI-using Python MIT GitHub ↗
★ 0
stars
100
AI relevance
50
solo dev
0
tool sigs

SUMMARY AI summary by gpt-5-mini

このリポジトリは、RAG(Retrieval-Augmented Generation)システムに対する攻撃を再現する自己完結型のDockerラボです。ローカルのLlama 3.2 3B(Ollama経由)とフロンティアモデルのClaude Haiku 4.5(Anthropic API経由)で検証された4種類の攻撃(文書汚染、間接プロンプト注入、直接的なデータ漏洩/交差汚染、PDFの不可視テキスト搬入)をスクリプト化しており、各攻撃成果は再現可能なJSON証拠付きで残ります。簡易防御として正規表現ベースの出力フィルタも実装されています。 主な知見は「高い推論能力はコンテンツ汚染への耐性と逆相関にある」こと。フロンティアモデルは注入型攻撃(明示的な命令のすり替え)には安全訓練が有効だが、見た目が正規文書に似た偽造コンテンツには脆弱で、場合によっては有害な誤情報をより説得力を持って強化してしまいます。導入・実行はDockerとDocker Composeがあれば可能で、Anthropic APIキーはClaudeテスト時のみ必要です。対象読者はRAG導入者、セキュリティ研究者、レッドチームや防御担当者で、検索層での制御がモデル層の安全訓練だけでは不十分であることを示す実践的な検証環境を提供します。

DETECTED Detected AI stack

AI-related keywords found in this repo's description, topics, or README summary — grouped by category. Each badge links to the corresponding ranking detail page.

🧠 LLM providers (2)
Anthropic Ollama
🤖 LLM models (2)
Claude Llama

GitHub Topics

#ai-security #claude #llama #llm-security #prompt-injection #rag #red-teaming

Language breakdown (by bytes)

Shell
15.4%
Python
81.5%
Dockerfile
3.1%

Owner

Account
KezoSec
Type
User
Followers
0

Dates

Created on GitHub 2026-05-09
Last push 2026-05-09
First seen here 2026-05-09
Last fetched 2026-05-09 15:42

Similar repos (same language)

WenyuChiou/awesome-agentic-ai-zh

AI Agent 中文學習地圖 — 從零開始的結構化學習路徑,每階段有必做練習跟必修閱讀。三語對照(繁中/简中/English)。歡迎社群一起貢獻、優化內容。

Python 516 AI 100
lonr-6/cc-desktop-switch

Lightweight desktop tool for configuring DeepSeek, Kimi, Zhipu GLM and Bailian providers in Claude Desktop.

Python 347 AI 45
TomSolid/myPKA

My whole life. One folder. No vendor. myPKA is a Personal Knowledge Architecture with a 4-person AI team baked in. Plain markdown files on your machine. ICOR® methodology. Works in Claude Code, Codex, Gemini, Cursor, Obsidian.

Python 56 AI 70
linora-u/AgentLoom

Simple, flexible workflow orchestration for multi-agent AI apps, with YAML configuration, runtime safety, observability, and resume support.

Python 29 AI 70
oodadoudou/Transoria

AI desktop toolkit for novel translation, glossary management, and batch text replacement.

Python 24 AI 45
hieuchaydi/MemoryFeed

Local-first social memory search engine with browser capture, hybrid AI retrieval, and optional C++ acceleration.

Python 14 AI 70
alias8818/enoch-agentic-research-system

Agentic research control plane with local proof, provenance packaging, and explicit audit-status reporting.

Python 11 AI 45
helderpgoncalves/feedbot

Turn community chat into a structured product backlog — Telegram + dashboard + MCP for Claude Code.

Python 6 AI 70