firefrost-gaming/skill-seekers-reference

Files

yusyus a1eab63daf docs: add ecosystem section linking all Skill Seekers repos

Add cross-repo discoverability for the 6 related repositories
(website, configs, GitHub Action, plugin, Homebrew tap, MCP servers).

- README.md: ecosystem table, Trendshift badge, pepy.tech downloads badge
- All 11 translated READMEs: translated ecosystem sections
- CONTRIBUTING.md: related repositories table for contributors
- pyproject.toml: ecosystem URLs in [project.urls] for PyPI sidebar

Addresses contributor feedback about difficulty finding the website repo.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-03-22 19:22:16 +03:00

45 KiB

Raw Blame History

Skill Seekers

⚠️ Hinweis zur maschinellen Übersetzung

Dieses Dokument wurde automatisch durch KI übersetzt. Trotz Bemühungen um Qualität können ungenaue Ausdrücke vorkommen.

Gerne können Sie über GitHub Issue #260 zur Verbesserung der Übersetzung beitragen! Ihr Feedback ist uns sehr wertvoll.

Die Datenschicht für KI-Systeme. Skill Seekers verwandelt Dokumentationswebsites, GitHub-Repositories, PDFs, Videos, Jupyter-Notebooks, Wikis und über 10 weitere Quelltypen in strukturierte Wissensressourcen — bereit für KI-Skills (Claude, Gemini, OpenAI), RAG-Pipelines (LangChain, LlamaIndex, Pinecone) und KI-Programmierassistenten (Cursor, Windsurf, Cline) in Minuten statt Stunden.

Besuchen Sie SkillSeekersWeb.com - Durchsuchen Sie über 24 vorgefertigte Konfigurationen, teilen Sie Ihre Konfigurationen und greifen Sie auf die vollständige Dokumentation zu!

Entwicklungsroadmap und Aufgaben ansehen - 134 Aufgaben in 10 Kategorien — wählen Sie eine beliebige zum Mitwirken!

🌐 Ökosystem

Skill Seekers ist ein Multi-Repository-Projekt. Hier finden Sie alles:

Repository	Beschreibung	Links
Skill_Seekers	Kern-CLI & MCP-Server (dieses Repo)	PyPI
skillseekersweb	Website & Dokumentation	Web
skill-seekers-configs	Community-Konfigurationsrepository
skill-seekers-action	GitHub Action für CI/CD
skill-seekers-plugin	Claude Code Plugin
homebrew-skill-seekers	Homebrew Tap für macOS
awesome-mcp-servers	Kuratierte MCP-Server-Liste

Möchten Sie beitragen? Die Website- und Konfigurations-Repos sind ideale Einstiegspunkte für neue Mitwirkende!

Die Datenschicht für KI-Systeme

Skill Seekers ist die universelle Vorverarbeitungsschicht, die zwischen Rohdokumentation und jedem KI-System steht, das diese konsumiert. Ob Sie Claude-Skills, eine LangChain-RAG-Pipeline oder eine Cursor-.cursorrules-Datei erstellen — die Datenaufbereitung ist identisch. Sie führen sie einmal durch und exportieren für alle Zielplattformen.

# Ein Befehl → strukturierte Wissensressource
skill-seekers create https://docs.react.dev/
# oder: skill-seekers create facebook/react
# oder: skill-seekers create ./my-project

# Export in jedes KI-System
skill-seekers package output/react --target claude      # → Claude AI Skill (ZIP)
skill-seekers package output/react --target langchain   # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor      # → .cursorrules

Was erstellt wird

Ausgabe	Ziel	Einsatzbereich
Claude Skill (ZIP + YAML)	`--target claude`	Claude Code, Claude API
Gemini Skill (tar.gz)	`--target gemini`	Google Gemini
OpenAI / Custom GPT (ZIP)	`--target openai`	GPT-4o, benutzerdefinierte Assistenten
LangChain Documents	`--target langchain`	QA-Chains, Agenten, Retriever
LlamaIndex TextNodes	`--target llama-index`	Query Engines, Chat Engines
Haystack Documents	`--target haystack`	Enterprise-RAG-Pipelines
Pinecone-ready (Markdown)	`--target markdown`	Vektor-Upsert
ChromaDB / FAISS / Qdrant	`--format chroma/faiss/qdrant`	Lokale Vektordatenbanken
Cursor `.cursorrules`	`--target claude` → kopieren	Cursor IDE KI-Kontext
Windsurf / Cline / Continue	`--target claude` → kopieren	VS Code, IntelliJ, Vim

Warum Skill Seekers

99 % schneller — Tage manueller Datenaufbereitung → 15–45 Minuten
KI-Skill-Qualität — Über 500 Zeilen SKILL.md-Dateien mit Beispielen, Mustern und Anleitungen
RAG-fertige Chunks — Intelligentes Chunking bewahrt Codeblöcke und Kontext
17 Quelltypen — Dokumentation + GitHub + PDF + Videos + Notebooks + Wikis u. v. m. zu einer Wissensressource vereinen
Einmal aufbereiten, überall exportieren — Export auf 16 Plattformen ohne erneutes Scrapen
Videos — Code, Transkripte und strukturiertes Wissen aus YouTube- und lokalen Videos extrahieren
Kampferprobt — Über 2.540 Tests, 24+ Framework-Presets, produktionsreif

Schnellstart

pip install skill-seekers

# KI-Skill aus beliebiger Quelle erstellen
skill-seekers create https://docs.django.com/    # Dokumentationswebsite
skill-seekers create django/django               # GitHub-Repository
skill-seekers create ./my-codebase               # Lokales Projekt
skill-seekers create manual.pdf                  # PDF-Datei
skill-seekers create manual.docx                 # Word-Dokument
skill-seekers create book.epub                   # EPUB-E-Book
skill-seekers create notebook.ipynb              # Jupyter Notebook
skill-seekers create page.html                   # Lokale HTML-Datei
skill-seekers create api-spec.yaml               # OpenAPI/Swagger-Spezifikation
skill-seekers create guide.adoc                  # AsciiDoc-Dokument
skill-seekers create slides.pptx                 # PowerPoint-Präsentation

# Video (YouTube, Vimeo oder lokale Datei — erfordert skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# Erstmalig? Automatische Installation GPU-bewusster visueller Abhängigkeiten:
skill-seekers video --setup

# Je nach Einsatzzweck exportieren
skill-seekers package output/django --target claude     # Claude AI Skill
skill-seekers package output/django --target langchain  # LangChain RAG
skill-seekers package output/django --target cursor     # Cursor IDE Kontext

Vollständige Beispiele:

Claude AI Skill - Skill für Claude Code
LangChain RAG-Pipeline - QA-Chain mit Chroma
Cursor IDE Kontext - Framework-bewusstes KI-Programmieren

Was ist Skill Seekers?

Skill Seekers ist die Datenschicht für KI-Systeme und transformiert 17 Quelltypen — Dokumentationswebsites, GitHub-Repositories, PDFs, Videos, Jupyter-Notebooks, Word-/EPUB-/AsciiDoc-Dokumente, OpenAPI/Swagger-Spezifikationen, PowerPoint-Präsentationen, RSS/Atom-Feeds, Man-Pages, Confluence-Wikis, Notion-Seiten, Slack-/Discord-Chatexporte und mehr — in strukturierte Wissensressourcen für jedes KI-Ziel:

Anwendungsfall	Ergebnis	Beispiele
KI-Skills	Umfassende SKILL.md + Referenzdateien	Claude Code, Gemini, GPT
RAG-Pipelines	Dokumenten-Chunks mit reichhaltigen Metadaten	LangChain, LlamaIndex, Haystack
Vektordatenbanken	Vorformatierte, upload-bereite Daten	Pinecone, Chroma, Weaviate, FAISS
KI-Programmierassistenten	Kontextdateien, die Ihre IDE-KI automatisch liest	Cursor, Windsurf, Cline, Continue.dev

Anstatt tagelange manuelle Vorverarbeitung durchzuführen, erledigt Skill Seekers dies:

Erfassen — Dokumentation, GitHub-Repos, lokale Codebasen, PDFs, Videos, Jupyter-Notebooks, Wikis und über 17 weitere Quelltypen
Analysieren — Tiefgreifendes AST-Parsing, Mustererkennung, API-Extraktion
Strukturieren — Kategorisierte Referenzdateien mit Metadaten
Verbessern — KI-gestützte SKILL.md-Generierung (Claude, Gemini oder lokal)
Exportieren — 16 plattformspezifische Formate aus einer Ressource

Warum Skill Seekers nutzen?

Für KI-Skill-Ersteller (Claude, Gemini, OpenAI)

Produktionsreife Skills — Über 500 Zeilen SKILL.md-Dateien mit Codebeispielen, Mustern und Anleitungen
Verbesserungsworkflows — security-focus, architecture-comprehensive oder eigene YAML-Presets anwenden
Jede Domäne — Game-Engines (Godot, Unity), Frameworks (React, Django), interne Tools
Teamarbeit — Interne Dokumentation + Code zu einer einzigen Wissensquelle vereinen
Hohe Qualität — KI-verbessert mit Beispielen, Kurzreferenz und Navigationshinweisen

Für RAG-Entwickler und KI-Ingenieure

RAG-fertige Daten — Vorgesplittete LangChain Documents, LlamaIndex TextNodes, Haystack Documents
99 % schneller — Tage der Vorverarbeitung → 15–45 Minuten
Intelligente Metadaten — Kategorien, Quellen, Typen → höhere Abrufgenauigkeit
Multi-Source — Dokumentation + GitHub + PDFs in einer Pipeline kombinieren
Plattformunabhängig — Export in jede Vektordatenbank oder jedes Framework ohne erneutes Scrapen

Für KI-Programmierassistenten-Nutzer

Cursor / Windsurf / Cline — .cursorrules / .windsurfrules / .clinerules automatisch generieren
Dauerhafter Kontext — Die KI „kennt" Ihre Frameworks ohne wiederholtes Prompting
Immer aktuell — Kontext in Minuten aktualisieren, wenn sich die Dokumentation ändert

Kernfunktionen

Dokumentations-Scraping

llms.txt-Unterstützung - Erkennt und nutzt automatisch LLM-bereite Dokumentationsdateien (10x schneller)
Universal-Scraper - Funktioniert mit JEDER Dokumentationswebsite
Intelligente Kategorisierung - Organisiert Inhalte automatisch nach Themen
Code-Spracherkennung - Erkennt Python, JavaScript, C++, GDScript usw.
Über 24 fertige Presets - Godot, React, Vue, Django, FastAPI und mehr

PDF-Unterstützung

Grundlegende PDF-Extraktion - Text, Code und Bilder aus PDFs extrahieren
OCR für gescannte PDFs - Text aus gescannten Dokumenten extrahieren
Passwortgeschützte PDFs - Verschlüsselte PDFs verarbeiten
Tabellenextraktion - Komplexe Tabellen aus PDFs extrahieren
Parallelverarbeitung - 3x schneller bei großen PDFs
Intelligentes Caching - 50 % schneller bei Wiederholungen

Videoextraktion

YouTube und lokale Videos - Transkripte, Bildschirmcode und strukturiertes Wissen aus Videos extrahieren
Visuelle Frameanalyse - OCR-Extraktion aus Code-Editoren, Terminals, Folien und Diagrammen
GPU-Autoerkennung - Installiert automatisch den richtigen PyTorch-Build (CUDA/ROCm/MPS/CPU)
KI-Verbesserung - Zwei Durchläufe: OCR-Artefakte bereinigen + ausgefeilte SKILL.md generieren
Zeitausschnitte - Bestimmte Abschnitte mit --start-time und --end-time extrahieren
Playlist-Unterstützung - Alle Videos einer YouTube-Playlist stapelweise verarbeiten

GitHub-Repository-Analyse

Tiefgreifende Codeanalyse - AST-Parsing für Python, JavaScript, TypeScript, Java, C++, Go
API-Extraktion - Funktionen, Klassen, Methoden mit Parametern und Typen
Repository-Metadaten - README, Dateibaum, Sprachverteilung, Stars/Forks
GitHub Issues und PRs - Offene/geschlossene Issues mit Labels und Meilensteinen abrufen
CHANGELOG und Releases - Versionshistorie automatisch extrahieren
Konflikterkennung - Dokumentierte APIs mit tatsächlicher Code-Implementierung vergleichen
MCP-Integration - Natürliche Sprache: „Scrape GitHub Repo facebook/react"

Vereinheitlichtes Multi-Source-Scraping

Mehrere Quellen kombinieren - Dokumentation + GitHub + PDF in einem Skill vereinen
Konflikterkennung - Automatische Erkennung von Abweichungen zwischen Dokumentation und Code
Intelligentes Zusammenführen - Regelbasierte oder KI-gesteuerte Konfliktlösung
Transparente Berichte - Nebeneinander-Vergleich mit Warnhinweisen
Dokumentationslückenanalyse - Erkennt veraltete Dokumentation und undokumentierte Funktionen
Einzelne Wahrheitsquelle - Ein Skill zeigt sowohl Absicht (Dokumentation) als auch Realität (Code)
Abwärtskompatibel - Bestehende Einzelquellen-Konfigurationen funktionieren weiterhin

Multi-LLM-Plattformunterstützung

12 LLM-Plattformen - Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Generisches Markdown, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
Universelles Scraping - Dieselbe Dokumentation funktioniert für alle Plattformen
Plattformspezifische Paketierung - Optimierte Formate für jedes LLM
Ein-Befehl-Export - --target-Flag wählt die Plattform
Optionale Abhängigkeiten - Nur installieren, was Sie benötigen
100 % abwärtskompatibel - Bestehende Claude-Workflows bleiben unverändert

Plattform	Format	Upload	Verbesserung	API Key	Benutzerdefinierter Endpunkt
Claude AI	ZIP + YAML	Auto	Ja	ANTHROPIC_API_KEY	ANTHROPIC_BASE_URL
Google Gemini	tar.gz	Auto	Ja	GOOGLE_API_KEY	-
OpenAI ChatGPT	ZIP + Vector Store	Auto	Ja	OPENAI_API_KEY	-
Generisches Markdown	ZIP	Manuell	Nein	-	-

# Claude (Standard - keine Änderungen nötig!)
skill-seekers package output/react/
skill-seekers upload react.zip

# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini

# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai

# Generisches Markdown (universeller Export)
skill-seekers package output/react/ --target markdown

Umgebungsvariablen für Claude-kompatible APIs (z. B. GLM-4.7)

Skill Seekers unterstützt jeden Claude-kompatiblen API-Endpunkt:

# Option 1: Offizielle Anthropic API (Standard)
export ANTHROPIC_API_KEY=sk-ant-...

# Option 2: GLM-4.7 Claude-kompatible API
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1

# Alle KI-Verbesserungsfunktionen verwenden den konfigurierten Endpunkt
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance

Hinweis: Das Setzen von ANTHROPIC_BASE_URL ermöglicht die Nutzung jedes Claude-kompatiblen API-Endpunkts, wie GLM-4.7 oder anderer kompatibler Dienste.

Installation:

# Mit Gemini-Unterstützung installieren
pip install skill-seekers[gemini]

# Mit OpenAI-Unterstützung installieren
pip install skill-seekers[openai]

# Mit allen LLM-Plattformen installieren
pip install skill-seekers[all-llms]

RAG-Framework-Integrationen

LangChain Documents - Direkter Export ins Document-Format mit page_content + Metadaten
- Geeignet für: QA-Chains, Retriever, Vektorspeicher, Agenten
- Beispiel: LangChain RAG-Pipeline
- Anleitung: LangChain-Integration
LlamaIndex TextNodes - Export ins TextNode-Format mit eindeutigen IDs + Embeddings
- Geeignet für: Query Engines, Chat Engines, Storage Context
- Beispiel: LlamaIndex Query Engine
- Anleitung: LlamaIndex-Integration
Pinecone-fertiges Format - Optimiert für Vektordatenbank-Upsert
- Geeignet für: Produktions-Vektorsuche, semantische Suche, Hybridsuche
- Beispiel: Pinecone Upsert
- Anleitung: Pinecone-Integration

Schnellexport:

# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json

# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json

# Markdown (Universal)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/

Vollständige RAG-Pipeline-Anleitung: RAG-Pipelines-Dokumentation

KI-Programmierassistenten-Integrationen

Verwandeln Sie beliebige Framework-Dokumentation in Experten-Programmierkontext für über 4 KI-Assistenten:

Cursor IDE - .cursorrules für KI-gestützte Codevorschläge generieren
- Geeignet für: Framework-spezifische Codegenerierung, konsistente Muster
- Anleitung: Cursor-Integration
- Beispiel: Cursor React Skill
Windsurf - Windsurf-KI-Assistentenkontext mit .windsurfrules anpassen
- Geeignet für: IDE-native KI-Unterstützung, Flow-basiertes Programmieren
- Anleitung: Windsurf-Integration
- Beispiel: Windsurf FastAPI Kontext
Cline (VS Code) - System-Prompts + MCP für VS Code Agenten
- Geeignet für: Agentische Codegenerierung in VS Code
- Anleitung: Cline-Integration
- Beispiel: Cline Django Assistent
Continue.dev - Kontextserver für IDE-unabhängige KI
- Geeignet für: Multi-IDE-Umgebungen (VS Code, JetBrains, Vim), benutzerdefinierte LLM-Anbieter
- Anleitung: Continue-Integration
- Beispiel: Continue Universal Kontext

Schnellexport (für KI-Programmiertools):

# Für jeden KI-Programmierassistenten (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude

# In Ihr Projekt kopieren (Beispiel für Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules

# Oder für Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md

# Oder für Cline
cp output/django-claude/SKILL.md my-project/.clinerules

Integrations-Hub: Alle KI-System-Integrationen

Drei-Stream-GitHub-Architektur

Triple-Stream-Analyse - GitHub-Repos in Code-, Dokumentations- und Insights-Streams aufteilen
Vereinheitlichter Codebase-Analyzer - Funktioniert mit GitHub-URLs UND lokalen Pfaden
C3.x als Analysetiefe - „basic" (1–2 Min.) oder „c3x" (20–60 Min.) Analyse wählen
Erweiterte Router-Generierung - GitHub-Metadaten, README-Schnellstart, häufige Probleme
Issue-Integration - Häufigste Probleme und Lösungen aus GitHub Issues
Intelligente Routing-Schlüsselwörter - GitHub-Labels 2x gewichtet für bessere Themenerkennung

Drei Streams erklärt:

Stream 1: Code - Tiefgreifende C3.x-Analyse (Muster, Beispiele, Anleitungen, Konfigurationen, Architektur)
Stream 2: Dokumentation - Repository-Dokumentation (README, CONTRIBUTING, docs/*.md)
Stream 3: Insights - Community-Wissen (Issues, Labels, Stars, Forks)

from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer

# GitHub-Repo mit allen drei Streams analysieren
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
    source="https://github.com/facebook/react",
    depth="c3x",  # oder "basic" für schnelle Analyse
    fetch_github_metadata=True
)

print(f"Designmuster: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Stars: {result.github_insights['metadata']['stars']}")

Vollständige Dokumentation: Drei-Stream-Implementierungszusammenfassung

Intelligentes Rate-Limit-Management und Konfiguration

Multi-Token-Konfigurationssystem - Mehrere GitHub-Konten verwalten (Privat, Arbeit, Open Source)
- Sichere Konfigurationsspeicherung unter ~/.config/skill-seekers/config.json (Berechtigung 600)
- Rate-Limit-Strategien pro Profil: prompt, wait, switch, fail
- Intelligente Fallback-Kette: CLI-Argument → Umgebungsvariable → Konfigurationsdatei → Abfrage
Interaktiver Konfigurationsassistent - Ansprechende Terminal-UI für einfache Einrichtung
Intelligenter Rate-Limit-Handler - Kein endloses Warten mehr!
- Echtzeit-Countdown, automatischer Profilwechsel
- Vier Strategien: prompt (fragen), wait (Countdown), switch (wechseln), fail (abbrechen)
Wiederaufnahme-Funktion - Unterbrochene Aufgaben fortsetzen
CI/CD-Unterstützung - --non-interactive-Flag für Automatisierung

Schnelleinrichtung:

# Einmalige Konfiguration (5 Minuten)
skill-seekers config --github

# Spezifisches Profil für private Repositories verwenden
skill-seekers github --repo mycompany/private-repo --profile work

# CI/CD-Modus (schnelles Abbrechen, keine Abfragen)
skill-seekers github --repo owner/repo --non-interactive

Bootstrap-Skill - Selbst-Hosting

Skill Seekers als Claude Code Skill generieren:

./scripts/bootstrap_skill.sh
cp -r output/skill-seekers ~/.claude/skills/

Private Konfigurations-Repositories

Git-basierte Konfigurationsquellen - Konfigurationen aus privaten/Team-Git-Repositories abrufen
Multi-Source-Verwaltung - Unbegrenzte GitHub-, GitLab-, Bitbucket-Repositories registrieren
Team-Zusammenarbeit - Benutzerdefinierte Konfigurationen in 3–5-Personen-Teams teilen
Enterprise-Unterstützung - Skalierung auf 500+ Entwickler
Sichere Authentifizierung - Umgebungsvariablen-Tokens (GITHUB_TOKEN, GITLAB_TOKEN)

Codebase-Analyse (C3.x)

C3.4: Konfigurationsmuster-Extraktion (mit KI-Verbesserung)

9 Konfigurationsformate - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
7 Mustertypen - Datenbank-, API-, Logging-, Cache-, E-Mail-, Auth-, Server-Konfigurationen
KI-Verbesserung - Optionale Dual-Modus-KI-Analyse (API + LOCAL)
Sicherheitsanalyse - Hartcodierte Geheimnisse und offengelegte Anmeldedaten finden

C3.3: KI-verbesserte Anleitungen

Umfassende KI-Verbesserung - Grundanleitungen in professionelle Tutorials verwandeln
5 automatische Verbesserungen - Schrittbeschreibungen, Fehlerbehebung, Voraussetzungen, nächste Schritte, Anwendungsfälle
Dual-Modus-Unterstützung - API-Modus (Claude API) oder LOCAL-Modus (Claude Code CLI)
LOCAL-Modus kostenlos - Kostenlose Verbesserung mit Ihrem Claude Code Max Plan

Verwendung:

# Schnellanalyse (1–2 Minuten, nur Grundfunktionen)
skill-seekers analyze --directory tests/ --quick

# Umfassende Analyse (mit KI, 20–60 Minuten)
skill-seekers analyze --directory tests/ --comprehensive

# Mit KI-Verbesserung
skill-seekers analyze --directory tests/ --enhance

Vollständige Dokumentation: docs/HOW_TO_GUIDES.md

Verbesserungs-Workflow-Presets

Wiederverwendbare YAML-definierte Verbesserungspipelines, die steuern, wie KI Ihre Rohdokumentation in einen ausgefeilten Skill transformiert.

5 mitgelieferte Presets — default, minimal, security-focus, architecture-comprehensive, api-documentation
Benutzerdefinierte Presets — Eigene Workflows unter ~/.config/skill-seekers/workflows/ hinzufügen
Mehrere Workflows — Zwei oder mehr Workflows in einem Befehl verketten
Vollständige CLI-Verwaltung — Workflows auflisten, anzeigen, kopieren, hinzufügen, entfernen und validieren

# Einzelnen Workflow anwenden
skill-seekers create ./my-project --enhance-workflow security-focus

# Mehrere Workflows verketten (werden der Reihe nach angewendet)
skill-seekers create ./my-project \
  --enhance-workflow security-focus \
  --enhance-workflow minimal

# Presets verwalten
skill-seekers workflows list                          # Alle auflisten (mitgeliefert + benutzerdefiniert)
skill-seekers workflows show security-focus           # YAML-Inhalt anzeigen
skill-seekers workflows copy security-focus           # Zum Benutzerverzeichnis kopieren (zum Bearbeiten)
skill-seekers workflows add ./my-workflow.yaml        # Benutzerdefiniertes Preset installieren
skill-seekers workflows remove my-workflow            # Benutzerdefiniertes Preset entfernen
skill-seekers workflows validate security-focus       # Preset-Struktur validieren

# Mehrere gleichzeitig kopieren
skill-seekers workflows copy security-focus minimal api-documentation

# Mehrere Dateien gleichzeitig hinzufügen
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml

# Mehrere gleichzeitig entfernen
skill-seekers workflows remove my-wf-a my-wf-b

YAML-Preset-Format:

name: security-focus
description: "Sicherheitsorientierte Prüfung: Schwachstellen, Authentifizierung, Datenverarbeitung"
version: "1.0"
stages:
  - name: vulnerabilities
    type: custom
    prompt: "Prüfung auf OWASP Top 10 und häufige Sicherheitslücken..."
  - name: auth-review
    type: custom
    prompt: "Authentifizierungs- und Autorisierungsmuster untersuchen..."
    uses_history: true

Leistung und Skalierung

Async-Modus - 2–3x schnelleres Scraping mit async/await (Flag --async verwenden)
Unterstützung großer Dokumentationen - 10K–40K+ Seiten mit intelligentem Aufteilen verarbeiten
Router-/Hub-Skills - Intelligentes Routing zu spezialisierten Sub-Skills
Paralleles Scraping - Mehrere Skills gleichzeitig verarbeiten
Checkpoint/Wiederaufnahme - Bei langen Scraping-Vorgängen nie den Fortschritt verlieren
Caching-System - Einmal scrapen, sofort neu erstellen

Qualitätssicherung

Vollständig getestet - Über 2.540 Tests mit umfassender Abdeckung

Installation

# Basisinstallation (Dokumentations-Scraping, GitHub-Analyse, PDF, Paketierung)
pip install skill-seekers

# Mit Unterstützung aller LLM-Plattformen
pip install skill-seekers[all-llms]

# Mit MCP-Server
pip install skill-seekers[mcp]

# Alles
pip install skill-seekers[all]

Hilfe bei der Auswahl nötig? Starten Sie den Einrichtungsassistenten:

skill-seekers-setup

Installationsoptionen

Installation	Funktionen
`pip install skill-seekers`	Scraping, GitHub-Analyse, PDF, alle Plattformen
`pip install skill-seekers[gemini]`	+ Google Gemini-Unterstützung
`pip install skill-seekers[openai]`	+ OpenAI ChatGPT-Unterstützung
`pip install skill-seekers[all-llms]`	+ Alle LLM-Plattformen
`pip install skill-seekers[mcp]`	+ MCP-Server
`pip install skill-seekers[video]`	+ YouTube-/Vimeo-Transkript- und Metadatenextraktion
`pip install skill-seekers[video-full]`	+ Whisper-Transkription und visuelle Frameextraktion
`pip install skill-seekers[jupyter]`	+ Jupyter-Notebook-Unterstützung
`pip install skill-seekers[pptx]`	+ PowerPoint-Unterstützung
`pip install skill-seekers[confluence]`	+ Confluence-Wiki-Unterstützung
`pip install skill-seekers[notion]`	+ Notion-Seitenunterstützung
`pip install skill-seekers[rss]`	+ RSS-/Atom-Feed-Unterstützung
`pip install skill-seekers[chat]`	+ Slack-/Discord-Chatexport-Unterstützung
`pip install skill-seekers[asciidoc]`	+ AsciiDoc-Dokumentunterstützung
`pip install skill-seekers[all]`	Alles aktiviert

Visuelle Video-Abhängigkeiten (GPU-bewusst): Nach der Installation von skill-seekers[video-full] führen Sie skill-seekers video --setup aus, um Ihre GPU automatisch zu erkennen und die richtige PyTorch- Variante + easyocr zu installieren. Dies ist der empfohlene Weg zur Installation visueller Extraktionsabhängigkeiten.

Ein-Befehl-Installations-Workflow

Der schnellste Weg von der Konfiguration zum hochgeladenen Skill — vollständig automatisiert:

# React-Skill aus offiziellen Konfigurationen installieren (automatischer Upload zu Claude)
skill-seekers install --config react

# Aus lokaler Konfigurationsdatei installieren
skill-seekers install --config configs/custom.json

# Ohne Upload installieren (nur Paketierung)
skill-seekers install --config django --no-upload

# Workflow ohne Ausführung in der Vorschau anzeigen
skill-seekers install --config react --dry-run

Ausgeführte Phasen:

Phase 1: Konfiguration abrufen (falls Konfigurationsname angegeben)
Phase 2: Dokumentation scrapen
Phase 3: KI-Verbesserung
Phase 4: Skill paketieren
Phase 5: Zu Claude hochladen (optional, erfordert API Key)

Funktionsmatrix

Skill Seekers unterstützt 12 LLM-Plattformen, 17 Quelltypen und vollständige Funktionsparität für alle Ziele.

Plattformen: Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Generisches Markdown, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI Quelltypen: Dokumentationswebsites, GitHub-Repos, PDFs, Word (.docx), EPUB, Video, lokale Codebasen, Jupyter-Notebooks, lokales HTML, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), RSS-/Atom-Feeds, Man-Pages, Confluence-Wikis, Notion-Seiten, Slack-/Discord-Chatexporte

Vollständige Informationen finden Sie in der vollständigen Funktionsmatrix.

Schneller Plattformvergleich

Funktion	Claude	Gemini	OpenAI	Markdown
Format	ZIP + YAML	tar.gz	ZIP + Vector	ZIP
Upload	API	API	API	Manuell
Verbesserung	Sonnet 4	2.0 Flash	GPT-4o	Keine
Alle Skill-Modi	Ja	Ja	Ja	Ja

Verwendungsbeispiele

Dokumentations-Scraping

# Dokumentationswebsite scrapen
skill-seekers scrape --config configs/react.json

# Schnelles Scraping (ohne Konfiguration)
skill-seekers scrape --url https://react.dev --name react

# Mit Async-Modus (3x schneller)
skill-seekers scrape --config configs/godot.json --async --workers 8

PDF-Extraktion

# Grundlegende PDF-Extraktion
skill-seekers pdf --pdf docs/manual.pdf --name myskill

# Erweiterte Funktionen
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
    --extract-tables \        # Tabellen extrahieren
    --parallel \              # Schnelle Parallelverarbeitung
    --workers 8               # 8 CPU-Kerne verwenden

# Gescannte PDFs (erfordert: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr

Videoextraktion

# Video-Unterstützung installieren
pip install skill-seekers[video]        # Transkripte + Metadaten
pip install skill-seekers[video-full]   # + Whisper-Transkription + visuelle Frameextraktion

# GPU automatisch erkennen und visuelle Abhängigkeiten installieren (PyTorch + easyocr)
skill-seekers video --setup

# Aus YouTube-Video extrahieren
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial

# Aus einer YouTube-Playlist extrahieren
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist

# Aus einer lokalen Videodatei extrahieren
skill-seekers video --video-file recording.mp4 --name myrecording

# Mit visueller Frameanalyse extrahieren (erfordert video-full-Abhängigkeiten)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual

# Mit KI-Verbesserung (OCR bereinigen + ausgefeilte SKILL.md generieren)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2

# Bestimmten Abschnitt eines Videos ausschneiden (unterstützt Sekunden, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00

# Vision API für OCR-Frames mit niedriger Konfidenz verwenden (erfordert ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr

# Skill aus zuvor extrahierten Daten neu erstellen (Download überspringen)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial

Vollständige Anleitung: Siehe docs/VIDEO_GUIDE.md für die vollständige CLI-Referenz, Details zur visuellen Pipeline, KI-Verbesserungsoptionen und Fehlerbehebung.

GitHub-Repository-Analyse

# Grundlegendes Repository-Scraping
skill-seekers github --repo facebook/react

# Mit Authentifizierung (höhere Rate-Limits)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react

# Inhalte anpassen
skill-seekers github --repo django/django \
    --include-issues \        # GitHub Issues extrahieren
    --max-issues 100 \        # Issue-Anzahl begrenzen
    --include-changelog       # CHANGELOG.md extrahieren

Vereinheitlichtes Multi-Source-Scraping

Dokumentation + GitHub + PDF zu einem vereinheitlichten Skill mit Konflikterkennung kombinieren:

# Vorhandene vereinheitlichte Konfigurationen verwenden
skill-seekers unified --config configs/react_unified.json

# Oder vereinheitlichte Konfiguration erstellen
cat > configs/myframework_unified.json << 'EOF'
{
  "name": "myframework",
  "merge_mode": "rule-based",
  "sources": [
    {
      "type": "documentation",
      "base_url": "https://docs.myframework.com/",
      "max_pages": 200
    },
    {
      "type": "github",
      "repo": "owner/myframework",
      "code_analysis_depth": "surface"
    }
  ]
}
EOF

skill-seekers unified --config configs/myframework_unified.json

Die Konflikterkennung findet automatisch:

Im Code fehlend (hoch): Dokumentiert, aber nicht implementiert
In der Dokumentation fehlend (mittel): Implementiert, aber nicht dokumentiert
Signatur-Abweichung: Unterschiedliche Parameter/Typen
Beschreibungs-Abweichung: Unterschiedliche Erklärungen

Vollständige Anleitung: Siehe docs/UNIFIED_SCRAPING.md.

Private Konfigurations-Repositories

Benutzerdefinierte Konfigurationen über private Git-Repositories im Team teilen:

# MCP-Tools verwenden, um das private Team-Repository zu registrieren
add_config_source(
    name="team",
    git_url="https://github.com/mycompany/skill-configs.git",
    token_env="GITHUB_TOKEN"
)

# Konfiguration aus dem Team-Repository abrufen
fetch_config(source="team", config_name="internal-api")

Unterstützte Plattformen:

GitHub (GITHUB_TOKEN), GitLab (GITLAB_TOKEN), Gitea (GITEA_TOKEN), Bitbucket (BITBUCKET_TOKEN)

Vollständige Anleitung: Siehe docs/GIT_CONFIG_SOURCES.md.

Funktionsweise

graph LR
    A[Dokumentationswebsite] --> B[Skill Seekers]
    B --> C[Scraper]
    B --> D[KI-Verbesserung]
    B --> E[Paketierer]
    C --> F[Geordnete Referenzdateien]
    D --> F
    F --> E
    E --> G[Claude Skill .zip]
    G --> H[Upload zu Claude AI]

llms.txt erkennen - Prüft zuerst auf llms-full.txt, llms.txt, llms-small.txt
Scrapen: Alle Seiten aus der Dokumentation extrahieren
Kategorisieren: Inhalte nach Themen organisieren (API, Anleitungen, Tutorials usw.)
Verbessern: KI analysiert Dokumente und erstellt umfassende SKILL.md mit Beispielen
Paketieren: Alles in eine Claude-fertige .zip-Datei bündeln

Voraussetzungen

Bevor Sie beginnen, stellen Sie sicher, dass Sie Folgendes haben:

Python 3.10 oder höher - Herunterladen | Prüfen: python3 --version
Git - Herunterladen | Prüfen: git --version
15–30 Minuten für die erstmalige Einrichtung

Erstmalig hier? → Starten Sie hier: Narrensichere Schnellstartanleitung

Skills zu Claude hochladen

Sobald Ihr Skill paketiert ist, müssen Sie ihn zu Claude hochladen:

Option 1: Automatischer Upload (API-basiert)

# API Key setzen (einmalig)
export ANTHROPIC_API_KEY=sk-ant-...

# Paketieren und automatisch hochladen
skill-seekers package output/react/ --upload

# ODER vorhandene .zip hochladen
skill-seekers upload output/react.zip

Option 2: Manueller Upload (ohne API Key)

# Skill paketieren
skill-seekers package output/react/
# → Erstellt output/react.zip

# Dann manuell hochladen:
# - Gehen Sie zu https://claude.ai/skills
# - Klicken Sie auf „Skill hochladen"
# - Wählen Sie output/react.zip

Option 3: MCP (Claude Code)

In Claude Code einfach fragen:
"Paketiere und lade den React-Skill hoch"

Installation für KI-Agenten

Skill Seekers kann Skills automatisch für 18 KI-Programmieragenten installieren.

# Für einen bestimmten Agenten installieren
skill-seekers install-agent output/react/ --agent cursor

# Für alle Agenten gleichzeitig installieren
skill-seekers install-agent output/react/ --agent all

# Vorschau ohne Installation
skill-seekers install-agent output/react/ --agent cursor --dry-run

Unterstützte Agenten

Agent	Pfad	Typ
Claude Code	`~/.claude/skills/`	Global
Cursor	`.cursor/skills/`	Projekt
VS Code / Copilot	`.github/skills/`	Projekt
Amp	`~/.amp/skills/`	Global
Goose	`~/.config/goose/skills/`	Global
OpenCode	`~/.opencode/skills/`	Global
Windsurf	`~/.windsurf/skills/`	Global
Roo Code	`.roo/skills/`	Projekt
Cline	`.cline/skills/`	Projekt
Aider	`~/.aider/skills/`	Global
Bolt	`.bolt/skills/`	Projekt
Kilo Code	`.kilo/skills/`	Projekt
Continue	`~/.continue/skills/`	Global
Kimi Code	`~/.kimi/skills/`	Global

MCP-Integration (26 Tools)

Skill Seekers liefert einen MCP-Server für die Verwendung mit Claude Code, Cursor, Windsurf, VS Code + Cline oder IntelliJ IDEA.

# stdio-Modus (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp

# HTTP-Modus (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765

# Alle Agenten automatisch konfigurieren
./setup_mcp.sh

Alle 26 verfügbaren Tools:

Kern (9): list_configs, generate_config, validate_config, estimate_pages, scrape_docs, package_skill, upload_skill, enhance_skill, install_skill
Erweitert (10): scrape_github, scrape_pdf, unified_scrape, merge_sources, detect_conflicts, add_config_source, fetch_config, list_config_sources, remove_config_source, split_config
Vektordatenbank (4): export_to_chroma, export_to_weaviate, export_to_faiss, export_to_qdrant
Cloud (3): cloud_upload, cloud_download, cloud_list

Vollständige Anleitung: docs/MCP_SETUP.md

Konfiguration

Verfügbare Presets (24+)

# Alle Presets auflisten
skill-seekers list-configs

Kategorie	Presets
Web-Frameworks	`react`, `vue`, `angular`, `svelte`, `nextjs`
Python	`django`, `flask`, `fastapi`, `sqlalchemy`, `pytest`
Spieleentwicklung	`godot`, `pygame`, `unity`
Tools und DevOps	`docker`, `kubernetes`, `terraform`, `ansible`
Vereinheitlicht (Doku + GitHub)	`react-unified`, `vue-unified`, `nextjs-unified` u. a.

Eigene Konfiguration erstellen

# Option 1: Interaktiv
skill-seekers scrape --interactive

# Option 2: Preset kopieren und bearbeiten
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json

Konfigurationsdatei-Struktur

{
  "name": "myframework",
  "description": "Wann dieser Skill verwendet werden soll",
  "base_url": "https://docs.myframework.com/",
  "selectors": {
    "main_content": "article",
    "title": "h1",
    "code_blocks": "pre code"
  },
  "url_patterns": {
    "include": ["/docs", "/guide"],
    "exclude": ["/blog", "/about"]
  },
  "categories": {
    "getting_started": ["intro", "quickstart"],
    "api": ["api", "reference"]
  },
  "rate_limit": 0.5,
  "max_pages": 500
}

Speicherorte für Konfigurationen

Das Tool sucht in dieser Reihenfolge:

Exakter Pfad wie angegeben
./configs/ (aktuelles Verzeichnis)
~/.config/skill-seekers/configs/ (Benutzerkonfigurationsverzeichnis)
SkillSeekersWeb.com API (Preset-Konfigurationen)

Was wird erstellt

output/
├── godot_data/              # Gescrapte Rohdaten
│   ├── pages/              # JSON-Dateien (eine pro Seite)
│   └── summary.json        # Übersicht
│
└── godot/                   # Der Skill
    ├── SKILL.md            # Verbessert mit echten Beispielen
    ├── references/         # Kategorisierte Dokumentation
    │   ├── index.md
    │   ├── getting_started.md
    │   ├── scripting.md
    │   └── ...
    ├── scripts/            # Leer (eigene hinzufügen)
    └── assets/             # Leer (eigene hinzufügen)

Fehlerbehebung

Kein Inhalt extrahiert?

Überprüfen Sie Ihren main_content-Selektor
Versuchen Sie: article, main, div[role="main"]

Daten vorhanden, aber werden nicht verwendet?

# Erneutes Scraping erzwingen
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json

Kategorien nicht gut?

Bearbeiten Sie den categories-Abschnitt in der Konfiguration mit besseren Schlüsselwörtern.

Dokumentation aktualisieren?

# Alte Daten löschen und erneut scrapen
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json

Verbesserung funktioniert nicht?

# Prüfen, ob API Key gesetzt ist
echo $ANTHROPIC_API_KEY

# LOCAL-Modus versuchen (nutzt Claude Code Max, kein API Key nötig)
skill-seekers enhance output/react/ --mode LOCAL

# Hintergrund-Verbesserungsstatus überwachen
skill-seekers enhance-status output/react/ --watch

GitHub-Rate-Limit-Probleme?

# GitHub Token setzen (5000 Anfragen/Stunde vs. 60/Stunde anonym)
export GITHUB_TOKEN=ghp_your_token_here

# Oder mehrere Profile konfigurieren
skill-seekers config --github

Leistung

Aufgabe	Dauer	Hinweise
Scraping (synchron)	15–45 Min.	Nur beim ersten Mal, thread-basiert
Scraping (asynchron)	5–15 Min.	2–3x schneller mit `--async`-Flag
Erstellen	1–3 Min.	Schneller Neuaufbau aus Cache
Neuerstellen	<1 Min.	Mit `--skip-scrape`
Verbesserung (LOCAL)	30–60 Sek.	Nutzt Claude Code Max
Verbesserung (API)	20–40 Sek.	Erfordert API Key
Video (Transkript)	1–3 Min.	YouTube/lokal, nur Transkript
Video (visuell)	5–15 Min.	+ OCR-Frameextraktion
Paketierung	5–10 Sek.	Finale .zip-Erstellung

Dokumentation

Erste Schritte

BULLETPROOF_QUICKSTART.md - Neue Nutzer starten hier!
QUICKSTART.md - Schnellstart für erfahrene Nutzer
TROUBLESHOOTING.md - Häufige Probleme und Lösungen
docs/QUICK_REFERENCE.md - Einseiter-Kurzreferenz

Anleitungen

docs/LARGE_DOCUMENTATION.md - 10K–40K+ Seiten verarbeiten
ASYNC_SUPPORT.md - Async-Modus-Anleitung (2–3x schnelleres Scraping)
docs/ENHANCEMENT_MODES.md - KI-Verbesserungsmodi-Anleitung
docs/MCP_SETUP.md - MCP-Integrations-Einrichtung
docs/UNIFIED_SCRAPING.md - Multi-Source-Scraping
docs/VIDEO_GUIDE.md - Vollständige Videoextraktions-Anleitung

Integrationsanleitungen

docs/integrations/LANGCHAIN.md - LangChain RAG
docs/integrations/CURSOR.md - Cursor IDE
docs/integrations/WINDSURF.md - Windsurf IDE
docs/integrations/CLINE.md - Cline (VS Code)
docs/integrations/RAG_PIPELINES.md - Alle RAG-Pipelines

Lizenz

MIT-Lizenz - siehe LICENSE-Datei für Details

Viel Erfolg beim Erstellen von Skills!

45 KiB Raw Blame History Unescape Escape

Skill Seekers

🌐 Ökosystem

Die Datenschicht für KI-Systeme

Was erstellt wird

Warum Skill Seekers

Schnellstart

Was ist Skill Seekers?

Warum Skill Seekers nutzen?

Für KI-Skill-Ersteller (Claude, Gemini, OpenAI)

Für RAG-Entwickler und KI-Ingenieure

Für KI-Programmierassistenten-Nutzer

Kernfunktionen

Dokumentations-Scraping

PDF-Unterstützung

Videoextraktion

GitHub-Repository-Analyse

Vereinheitlichtes Multi-Source-Scraping

Multi-LLM-Plattformunterstützung

RAG-Framework-Integrationen

KI-Programmierassistenten-Integrationen

Drei-Stream-GitHub-Architektur

Intelligentes Rate-Limit-Management und Konfiguration

Bootstrap-Skill - Selbst-Hosting

Private Konfigurations-Repositories

Codebase-Analyse (C3.x)

Verbesserungs-Workflow-Presets

Leistung und Skalierung

Qualitätssicherung

Installation

Installationsoptionen

Ein-Befehl-Installations-Workflow

Funktionsmatrix

Schneller Plattformvergleich

Verwendungsbeispiele

Dokumentations-Scraping

PDF-Extraktion

Videoextraktion

GitHub-Repository-Analyse

Vereinheitlichtes Multi-Source-Scraping

Private Konfigurations-Repositories

Funktionsweise

Voraussetzungen

Skills zu Claude hochladen

Option 1: Automatischer Upload (API-basiert)

Option 2: Manueller Upload (ohne API Key)

Option 3: MCP (Claude Code)

Installation für KI-Agenten

Unterstützte Agenten

MCP-Integration (26 Tools)

Konfiguration

Verfügbare Presets (24+)

Eigene Konfiguration erstellen

Konfigurationsdatei-Struktur

Speicherorte für Konfigurationen

Was wird erstellt

Fehlerbehebung

Kein Inhalt extrahiert?

Daten vorhanden, aber werden nicht verwendet?

Kategorien nicht gut?

Dokumentation aktualisieren?

Verbesserung funktioniert nicht?

GitHub-Rate-Limit-Probleme?

Leistung

Dokumentation

Erste Schritte

Anleitungen

Integrationsanleitungen

Lizenz

Sicherheit

45 KiB

Raw Blame History