Files
skill-seekers-reference/README.de.md
yusyus a1eab63daf docs: add ecosystem section linking all Skill Seekers repos
Add cross-repo discoverability for the 6 related repositories
(website, configs, GitHub Action, plugin, Homebrew tap, MCP servers).

- README.md: ecosystem table, Trendshift badge, pepy.tech downloads badge
- All 11 translated READMEs: translated ecosystem sections
- CONTRIBUTING.md: related repositories table for contributors
- pyproject.toml: ecosystem URLs in [project.urls] for PyPI sidebar

Addresses contributor feedback about difficulty finding the website repo.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-22 19:22:16 +03:00

45 KiB
Raw Blame History

Skill Seekers

Skill Seekers

English | 简体中文 | 日本語 | 한국어 | Español | Français | Deutsch | Português | Türkçe | العربية | हिन्दी | Русский

⚠️ Hinweis zur maschinellen Übersetzung

Dieses Dokument wurde automatisch durch KI übersetzt. Trotz Bemühungen um Qualität können ungenaue Ausdrücke vorkommen.

Gerne können Sie über GitHub Issue #260 zur Verbesserung der Übersetzung beitragen! Ihr Feedback ist uns sehr wertvoll.

Version Lizenz: MIT Python 3.10+ MCP-Integration Getestet Projektboard PyPI-Version PyPI - Downloads PyPI - Python-Version Website Twitter Follow GitHub Repo Stars

Die Datenschicht für KI-Systeme. Skill Seekers verwandelt Dokumentationswebsites, GitHub-Repositories, PDFs, Videos, Jupyter-Notebooks, Wikis und über 10 weitere Quelltypen in strukturierte Wissensressourcen — bereit für KI-Skills (Claude, Gemini, OpenAI), RAG-Pipelines (LangChain, LlamaIndex, Pinecone) und KI-Programmierassistenten (Cursor, Windsurf, Cline) in Minuten statt Stunden.

Besuchen Sie SkillSeekersWeb.com - Durchsuchen Sie über 24 vorgefertigte Konfigurationen, teilen Sie Ihre Konfigurationen und greifen Sie auf die vollständige Dokumentation zu!

Entwicklungsroadmap und Aufgaben ansehen - 134 Aufgaben in 10 Kategorien — wählen Sie eine beliebige zum Mitwirken!

🌐 Ökosystem

Skill Seekers ist ein Multi-Repository-Projekt. Hier finden Sie alles:

Repository Beschreibung Links
Skill_Seekers Kern-CLI & MCP-Server (dieses Repo) PyPI
skillseekersweb Website & Dokumentation Web
skill-seekers-configs Community-Konfigurationsrepository
skill-seekers-action GitHub Action für CI/CD
skill-seekers-plugin Claude Code Plugin
homebrew-skill-seekers Homebrew Tap für macOS
awesome-mcp-servers Kuratierte MCP-Server-Liste

Möchten Sie beitragen? Die Website- und Konfigurations-Repos sind ideale Einstiegspunkte für neue Mitwirkende!

Die Datenschicht für KI-Systeme

Skill Seekers ist die universelle Vorverarbeitungsschicht, die zwischen Rohdokumentation und jedem KI-System steht, das diese konsumiert. Ob Sie Claude-Skills, eine LangChain-RAG-Pipeline oder eine Cursor-.cursorrules-Datei erstellen — die Datenaufbereitung ist identisch. Sie führen sie einmal durch und exportieren für alle Zielplattformen.

# Ein Befehl → strukturierte Wissensressource
skill-seekers create https://docs.react.dev/
# oder: skill-seekers create facebook/react
# oder: skill-seekers create ./my-project

# Export in jedes KI-System
skill-seekers package output/react --target claude      # → Claude AI Skill (ZIP)
skill-seekers package output/react --target langchain   # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor      # → .cursorrules

Was erstellt wird

Ausgabe Ziel Einsatzbereich
Claude Skill (ZIP + YAML) --target claude Claude Code, Claude API
Gemini Skill (tar.gz) --target gemini Google Gemini
OpenAI / Custom GPT (ZIP) --target openai GPT-4o, benutzerdefinierte Assistenten
LangChain Documents --target langchain QA-Chains, Agenten, Retriever
LlamaIndex TextNodes --target llama-index Query Engines, Chat Engines
Haystack Documents --target haystack Enterprise-RAG-Pipelines
Pinecone-ready (Markdown) --target markdown Vektor-Upsert
ChromaDB / FAISS / Qdrant --format chroma/faiss/qdrant Lokale Vektordatenbanken
Cursor .cursorrules --target claude → kopieren Cursor IDE KI-Kontext
Windsurf / Cline / Continue --target claude → kopieren VS Code, IntelliJ, Vim

Warum Skill Seekers

  • 99 % schneller — Tage manueller Datenaufbereitung → 1545 Minuten
  • KI-Skill-Qualität — Über 500 Zeilen SKILL.md-Dateien mit Beispielen, Mustern und Anleitungen
  • RAG-fertige Chunks — Intelligentes Chunking bewahrt Codeblöcke und Kontext
  • 17 Quelltypen — Dokumentation + GitHub + PDF + Videos + Notebooks + Wikis u. v. m. zu einer Wissensressource vereinen
  • Einmal aufbereiten, überall exportieren — Export auf 16 Plattformen ohne erneutes Scrapen
  • Videos — Code, Transkripte und strukturiertes Wissen aus YouTube- und lokalen Videos extrahieren
  • Kampferprobt — Über 2.540 Tests, 24+ Framework-Presets, produktionsreif

Schnellstart

pip install skill-seekers

# KI-Skill aus beliebiger Quelle erstellen
skill-seekers create https://docs.django.com/    # Dokumentationswebsite
skill-seekers create django/django               # GitHub-Repository
skill-seekers create ./my-codebase               # Lokales Projekt
skill-seekers create manual.pdf                  # PDF-Datei
skill-seekers create manual.docx                 # Word-Dokument
skill-seekers create book.epub                   # EPUB-E-Book
skill-seekers create notebook.ipynb              # Jupyter Notebook
skill-seekers create page.html                   # Lokale HTML-Datei
skill-seekers create api-spec.yaml               # OpenAPI/Swagger-Spezifikation
skill-seekers create guide.adoc                  # AsciiDoc-Dokument
skill-seekers create slides.pptx                 # PowerPoint-Präsentation

# Video (YouTube, Vimeo oder lokale Datei — erfordert skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# Erstmalig? Automatische Installation GPU-bewusster visueller Abhängigkeiten:
skill-seekers video --setup

# Je nach Einsatzzweck exportieren
skill-seekers package output/django --target claude     # Claude AI Skill
skill-seekers package output/django --target langchain  # LangChain RAG
skill-seekers package output/django --target cursor     # Cursor IDE Kontext

Vollständige Beispiele:

Was ist Skill Seekers?

Skill Seekers ist die Datenschicht für KI-Systeme und transformiert 17 Quelltypen — Dokumentationswebsites, GitHub-Repositories, PDFs, Videos, Jupyter-Notebooks, Word-/EPUB-/AsciiDoc-Dokumente, OpenAPI/Swagger-Spezifikationen, PowerPoint-Präsentationen, RSS/Atom-Feeds, Man-Pages, Confluence-Wikis, Notion-Seiten, Slack-/Discord-Chatexporte und mehr — in strukturierte Wissensressourcen für jedes KI-Ziel:

Anwendungsfall Ergebnis Beispiele
KI-Skills Umfassende SKILL.md + Referenzdateien Claude Code, Gemini, GPT
RAG-Pipelines Dokumenten-Chunks mit reichhaltigen Metadaten LangChain, LlamaIndex, Haystack
Vektordatenbanken Vorformatierte, upload-bereite Daten Pinecone, Chroma, Weaviate, FAISS
KI-Programmierassistenten Kontextdateien, die Ihre IDE-KI automatisch liest Cursor, Windsurf, Cline, Continue.dev

Anstatt tagelange manuelle Vorverarbeitung durchzuführen, erledigt Skill Seekers dies:

  1. Erfassen — Dokumentation, GitHub-Repos, lokale Codebasen, PDFs, Videos, Jupyter-Notebooks, Wikis und über 17 weitere Quelltypen
  2. Analysieren — Tiefgreifendes AST-Parsing, Mustererkennung, API-Extraktion
  3. Strukturieren — Kategorisierte Referenzdateien mit Metadaten
  4. Verbessern — KI-gestützte SKILL.md-Generierung (Claude, Gemini oder lokal)
  5. Exportieren — 16 plattformspezifische Formate aus einer Ressource

Warum Skill Seekers nutzen?

Für KI-Skill-Ersteller (Claude, Gemini, OpenAI)

  • Produktionsreife Skills — Über 500 Zeilen SKILL.md-Dateien mit Codebeispielen, Mustern und Anleitungen
  • Verbesserungsworkflowssecurity-focus, architecture-comprehensive oder eigene YAML-Presets anwenden
  • Jede Domäne — Game-Engines (Godot, Unity), Frameworks (React, Django), interne Tools
  • Teamarbeit — Interne Dokumentation + Code zu einer einzigen Wissensquelle vereinen
  • Hohe Qualität — KI-verbessert mit Beispielen, Kurzreferenz und Navigationshinweisen

Für RAG-Entwickler und KI-Ingenieure

  • RAG-fertige Daten — Vorgesplittete LangChain Documents, LlamaIndex TextNodes, Haystack Documents
  • 99 % schneller — Tage der Vorverarbeitung → 1545 Minuten
  • Intelligente Metadaten — Kategorien, Quellen, Typen → höhere Abrufgenauigkeit
  • Multi-Source — Dokumentation + GitHub + PDFs in einer Pipeline kombinieren
  • Plattformunabhängig — Export in jede Vektordatenbank oder jedes Framework ohne erneutes Scrapen

Für KI-Programmierassistenten-Nutzer

  • Cursor / Windsurf / Cline.cursorrules / .windsurfrules / .clinerules automatisch generieren
  • Dauerhafter Kontext — Die KI „kennt" Ihre Frameworks ohne wiederholtes Prompting
  • Immer aktuell — Kontext in Minuten aktualisieren, wenn sich die Dokumentation ändert

Kernfunktionen

Dokumentations-Scraping

  • llms.txt-Unterstützung - Erkennt und nutzt automatisch LLM-bereite Dokumentationsdateien (10x schneller)
  • Universal-Scraper - Funktioniert mit JEDER Dokumentationswebsite
  • Intelligente Kategorisierung - Organisiert Inhalte automatisch nach Themen
  • Code-Spracherkennung - Erkennt Python, JavaScript, C++, GDScript usw.
  • Über 24 fertige Presets - Godot, React, Vue, Django, FastAPI und mehr

PDF-Unterstützung

  • Grundlegende PDF-Extraktion - Text, Code und Bilder aus PDFs extrahieren
  • OCR für gescannte PDFs - Text aus gescannten Dokumenten extrahieren
  • Passwortgeschützte PDFs - Verschlüsselte PDFs verarbeiten
  • Tabellenextraktion - Komplexe Tabellen aus PDFs extrahieren
  • Parallelverarbeitung - 3x schneller bei großen PDFs
  • Intelligentes Caching - 50 % schneller bei Wiederholungen

Videoextraktion

  • YouTube und lokale Videos - Transkripte, Bildschirmcode und strukturiertes Wissen aus Videos extrahieren
  • Visuelle Frameanalyse - OCR-Extraktion aus Code-Editoren, Terminals, Folien und Diagrammen
  • GPU-Autoerkennung - Installiert automatisch den richtigen PyTorch-Build (CUDA/ROCm/MPS/CPU)
  • KI-Verbesserung - Zwei Durchläufe: OCR-Artefakte bereinigen + ausgefeilte SKILL.md generieren
  • Zeitausschnitte - Bestimmte Abschnitte mit --start-time und --end-time extrahieren
  • Playlist-Unterstützung - Alle Videos einer YouTube-Playlist stapelweise verarbeiten

GitHub-Repository-Analyse

  • Tiefgreifende Codeanalyse - AST-Parsing für Python, JavaScript, TypeScript, Java, C++, Go
  • API-Extraktion - Funktionen, Klassen, Methoden mit Parametern und Typen
  • Repository-Metadaten - README, Dateibaum, Sprachverteilung, Stars/Forks
  • GitHub Issues und PRs - Offene/geschlossene Issues mit Labels und Meilensteinen abrufen
  • CHANGELOG und Releases - Versionshistorie automatisch extrahieren
  • Konflikterkennung - Dokumentierte APIs mit tatsächlicher Code-Implementierung vergleichen
  • MCP-Integration - Natürliche Sprache: „Scrape GitHub Repo facebook/react"

Vereinheitlichtes Multi-Source-Scraping

  • Mehrere Quellen kombinieren - Dokumentation + GitHub + PDF in einem Skill vereinen
  • Konflikterkennung - Automatische Erkennung von Abweichungen zwischen Dokumentation und Code
  • Intelligentes Zusammenführen - Regelbasierte oder KI-gesteuerte Konfliktlösung
  • Transparente Berichte - Nebeneinander-Vergleich mit Warnhinweisen
  • Dokumentationslückenanalyse - Erkennt veraltete Dokumentation und undokumentierte Funktionen
  • Einzelne Wahrheitsquelle - Ein Skill zeigt sowohl Absicht (Dokumentation) als auch Realität (Code)
  • Abwärtskompatibel - Bestehende Einzelquellen-Konfigurationen funktionieren weiterhin

Multi-LLM-Plattformunterstützung

  • 12 LLM-Plattformen - Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Generisches Markdown, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
  • Universelles Scraping - Dieselbe Dokumentation funktioniert für alle Plattformen
  • Plattformspezifische Paketierung - Optimierte Formate für jedes LLM
  • Ein-Befehl-Export - --target-Flag wählt die Plattform
  • Optionale Abhängigkeiten - Nur installieren, was Sie benötigen
  • 100 % abwärtskompatibel - Bestehende Claude-Workflows bleiben unverändert
Plattform Format Upload Verbesserung API Key Benutzerdefinierter Endpunkt
Claude AI ZIP + YAML Auto Ja ANTHROPIC_API_KEY ANTHROPIC_BASE_URL
Google Gemini tar.gz Auto Ja GOOGLE_API_KEY -
OpenAI ChatGPT ZIP + Vector Store Auto Ja OPENAI_API_KEY -
Generisches Markdown ZIP Manuell Nein - -
# Claude (Standard - keine Änderungen nötig!)
skill-seekers package output/react/
skill-seekers upload react.zip

# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini

# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai

# Generisches Markdown (universeller Export)
skill-seekers package output/react/ --target markdown
Umgebungsvariablen für Claude-kompatible APIs (z. B. GLM-4.7)

Skill Seekers unterstützt jeden Claude-kompatiblen API-Endpunkt:

# Option 1: Offizielle Anthropic API (Standard)
export ANTHROPIC_API_KEY=sk-ant-...

# Option 2: GLM-4.7 Claude-kompatible API
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1

# Alle KI-Verbesserungsfunktionen verwenden den konfigurierten Endpunkt
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance

Hinweis: Das Setzen von ANTHROPIC_BASE_URL ermöglicht die Nutzung jedes Claude-kompatiblen API-Endpunkts, wie GLM-4.7 oder anderer kompatibler Dienste.

Installation:

# Mit Gemini-Unterstützung installieren
pip install skill-seekers[gemini]

# Mit OpenAI-Unterstützung installieren
pip install skill-seekers[openai]

# Mit allen LLM-Plattformen installieren
pip install skill-seekers[all-llms]

RAG-Framework-Integrationen

  • LangChain Documents - Direkter Export ins Document-Format mit page_content + Metadaten

  • LlamaIndex TextNodes - Export ins TextNode-Format mit eindeutigen IDs + Embeddings

  • Pinecone-fertiges Format - Optimiert für Vektordatenbank-Upsert

Schnellexport:

# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json

# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json

# Markdown (Universal)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/

Vollständige RAG-Pipeline-Anleitung: RAG-Pipelines-Dokumentation


KI-Programmierassistenten-Integrationen

Verwandeln Sie beliebige Framework-Dokumentation in Experten-Programmierkontext für über 4 KI-Assistenten:

Schnellexport (für KI-Programmiertools):

# Für jeden KI-Programmierassistenten (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude

# In Ihr Projekt kopieren (Beispiel für Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules

# Oder für Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md

# Oder für Cline
cp output/django-claude/SKILL.md my-project/.clinerules

Integrations-Hub: Alle KI-System-Integrationen


Drei-Stream-GitHub-Architektur

  • Triple-Stream-Analyse - GitHub-Repos in Code-, Dokumentations- und Insights-Streams aufteilen
  • Vereinheitlichter Codebase-Analyzer - Funktioniert mit GitHub-URLs UND lokalen Pfaden
  • C3.x als Analysetiefe - „basic" (12 Min.) oder „c3x" (2060 Min.) Analyse wählen
  • Erweiterte Router-Generierung - GitHub-Metadaten, README-Schnellstart, häufige Probleme
  • Issue-Integration - Häufigste Probleme und Lösungen aus GitHub Issues
  • Intelligente Routing-Schlüsselwörter - GitHub-Labels 2x gewichtet für bessere Themenerkennung

Drei Streams erklärt:

  • Stream 1: Code - Tiefgreifende C3.x-Analyse (Muster, Beispiele, Anleitungen, Konfigurationen, Architektur)
  • Stream 2: Dokumentation - Repository-Dokumentation (README, CONTRIBUTING, docs/*.md)
  • Stream 3: Insights - Community-Wissen (Issues, Labels, Stars, Forks)
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer

# GitHub-Repo mit allen drei Streams analysieren
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
    source="https://github.com/facebook/react",
    depth="c3x",  # oder "basic" für schnelle Analyse
    fetch_github_metadata=True
)

print(f"Designmuster: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Stars: {result.github_insights['metadata']['stars']}")

Vollständige Dokumentation: Drei-Stream-Implementierungszusammenfassung

Intelligentes Rate-Limit-Management und Konfiguration

  • Multi-Token-Konfigurationssystem - Mehrere GitHub-Konten verwalten (Privat, Arbeit, Open Source)
    • Sichere Konfigurationsspeicherung unter ~/.config/skill-seekers/config.json (Berechtigung 600)
    • Rate-Limit-Strategien pro Profil: prompt, wait, switch, fail
    • Intelligente Fallback-Kette: CLI-Argument → Umgebungsvariable → Konfigurationsdatei → Abfrage
  • Interaktiver Konfigurationsassistent - Ansprechende Terminal-UI für einfache Einrichtung
  • Intelligenter Rate-Limit-Handler - Kein endloses Warten mehr!
    • Echtzeit-Countdown, automatischer Profilwechsel
    • Vier Strategien: prompt (fragen), wait (Countdown), switch (wechseln), fail (abbrechen)
  • Wiederaufnahme-Funktion - Unterbrochene Aufgaben fortsetzen
  • CI/CD-Unterstützung - --non-interactive-Flag für Automatisierung

Schnelleinrichtung:

# Einmalige Konfiguration (5 Minuten)
skill-seekers config --github

# Spezifisches Profil für private Repositories verwenden
skill-seekers github --repo mycompany/private-repo --profile work

# CI/CD-Modus (schnelles Abbrechen, keine Abfragen)
skill-seekers github --repo owner/repo --non-interactive

Bootstrap-Skill - Selbst-Hosting

Skill Seekers als Claude Code Skill generieren:

./scripts/bootstrap_skill.sh
cp -r output/skill-seekers ~/.claude/skills/

Private Konfigurations-Repositories

  • Git-basierte Konfigurationsquellen - Konfigurationen aus privaten/Team-Git-Repositories abrufen
  • Multi-Source-Verwaltung - Unbegrenzte GitHub-, GitLab-, Bitbucket-Repositories registrieren
  • Team-Zusammenarbeit - Benutzerdefinierte Konfigurationen in 35-Personen-Teams teilen
  • Enterprise-Unterstützung - Skalierung auf 500+ Entwickler
  • Sichere Authentifizierung - Umgebungsvariablen-Tokens (GITHUB_TOKEN, GITLAB_TOKEN)

Codebase-Analyse (C3.x)

C3.4: Konfigurationsmuster-Extraktion (mit KI-Verbesserung)

  • 9 Konfigurationsformate - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
  • 7 Mustertypen - Datenbank-, API-, Logging-, Cache-, E-Mail-, Auth-, Server-Konfigurationen
  • KI-Verbesserung - Optionale Dual-Modus-KI-Analyse (API + LOCAL)
  • Sicherheitsanalyse - Hartcodierte Geheimnisse und offengelegte Anmeldedaten finden

C3.3: KI-verbesserte Anleitungen

  • Umfassende KI-Verbesserung - Grundanleitungen in professionelle Tutorials verwandeln
  • 5 automatische Verbesserungen - Schrittbeschreibungen, Fehlerbehebung, Voraussetzungen, nächste Schritte, Anwendungsfälle
  • Dual-Modus-Unterstützung - API-Modus (Claude API) oder LOCAL-Modus (Claude Code CLI)
  • LOCAL-Modus kostenlos - Kostenlose Verbesserung mit Ihrem Claude Code Max Plan

Verwendung:

# Schnellanalyse (12 Minuten, nur Grundfunktionen)
skill-seekers analyze --directory tests/ --quick

# Umfassende Analyse (mit KI, 2060 Minuten)
skill-seekers analyze --directory tests/ --comprehensive

# Mit KI-Verbesserung
skill-seekers analyze --directory tests/ --enhance

Vollständige Dokumentation: docs/HOW_TO_GUIDES.md

Verbesserungs-Workflow-Presets

Wiederverwendbare YAML-definierte Verbesserungspipelines, die steuern, wie KI Ihre Rohdokumentation in einen ausgefeilten Skill transformiert.

  • 5 mitgelieferte Presetsdefault, minimal, security-focus, architecture-comprehensive, api-documentation
  • Benutzerdefinierte Presets — Eigene Workflows unter ~/.config/skill-seekers/workflows/ hinzufügen
  • Mehrere Workflows — Zwei oder mehr Workflows in einem Befehl verketten
  • Vollständige CLI-Verwaltung — Workflows auflisten, anzeigen, kopieren, hinzufügen, entfernen und validieren
# Einzelnen Workflow anwenden
skill-seekers create ./my-project --enhance-workflow security-focus

# Mehrere Workflows verketten (werden der Reihe nach angewendet)
skill-seekers create ./my-project \
  --enhance-workflow security-focus \
  --enhance-workflow minimal

# Presets verwalten
skill-seekers workflows list                          # Alle auflisten (mitgeliefert + benutzerdefiniert)
skill-seekers workflows show security-focus           # YAML-Inhalt anzeigen
skill-seekers workflows copy security-focus           # Zum Benutzerverzeichnis kopieren (zum Bearbeiten)
skill-seekers workflows add ./my-workflow.yaml        # Benutzerdefiniertes Preset installieren
skill-seekers workflows remove my-workflow            # Benutzerdefiniertes Preset entfernen
skill-seekers workflows validate security-focus       # Preset-Struktur validieren

# Mehrere gleichzeitig kopieren
skill-seekers workflows copy security-focus minimal api-documentation

# Mehrere Dateien gleichzeitig hinzufügen
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml

# Mehrere gleichzeitig entfernen
skill-seekers workflows remove my-wf-a my-wf-b

YAML-Preset-Format:

name: security-focus
description: "Sicherheitsorientierte Prüfung: Schwachstellen, Authentifizierung, Datenverarbeitung"
version: "1.0"
stages:
  - name: vulnerabilities
    type: custom
    prompt: "Prüfung auf OWASP Top 10 und häufige Sicherheitslücken..."
  - name: auth-review
    type: custom
    prompt: "Authentifizierungs- und Autorisierungsmuster untersuchen..."
    uses_history: true

Leistung und Skalierung

  • Async-Modus - 23x schnelleres Scraping mit async/await (Flag --async verwenden)
  • Unterstützung großer Dokumentationen - 10K40K+ Seiten mit intelligentem Aufteilen verarbeiten
  • Router-/Hub-Skills - Intelligentes Routing zu spezialisierten Sub-Skills
  • Paralleles Scraping - Mehrere Skills gleichzeitig verarbeiten
  • Checkpoint/Wiederaufnahme - Bei langen Scraping-Vorgängen nie den Fortschritt verlieren
  • Caching-System - Einmal scrapen, sofort neu erstellen

Qualitätssicherung

  • Vollständig getestet - Über 2.540 Tests mit umfassender Abdeckung

Installation

# Basisinstallation (Dokumentations-Scraping, GitHub-Analyse, PDF, Paketierung)
pip install skill-seekers

# Mit Unterstützung aller LLM-Plattformen
pip install skill-seekers[all-llms]

# Mit MCP-Server
pip install skill-seekers[mcp]

# Alles
pip install skill-seekers[all]

Hilfe bei der Auswahl nötig? Starten Sie den Einrichtungsassistenten:

skill-seekers-setup

Installationsoptionen

Installation Funktionen
pip install skill-seekers Scraping, GitHub-Analyse, PDF, alle Plattformen
pip install skill-seekers[gemini] + Google Gemini-Unterstützung
pip install skill-seekers[openai] + OpenAI ChatGPT-Unterstützung
pip install skill-seekers[all-llms] + Alle LLM-Plattformen
pip install skill-seekers[mcp] + MCP-Server
pip install skill-seekers[video] + YouTube-/Vimeo-Transkript- und Metadatenextraktion
pip install skill-seekers[video-full] + Whisper-Transkription und visuelle Frameextraktion
pip install skill-seekers[jupyter] + Jupyter-Notebook-Unterstützung
pip install skill-seekers[pptx] + PowerPoint-Unterstützung
pip install skill-seekers[confluence] + Confluence-Wiki-Unterstützung
pip install skill-seekers[notion] + Notion-Seitenunterstützung
pip install skill-seekers[rss] + RSS-/Atom-Feed-Unterstützung
pip install skill-seekers[chat] + Slack-/Discord-Chatexport-Unterstützung
pip install skill-seekers[asciidoc] + AsciiDoc-Dokumentunterstützung
pip install skill-seekers[all] Alles aktiviert

Visuelle Video-Abhängigkeiten (GPU-bewusst): Nach der Installation von skill-seekers[video-full] führen Sie skill-seekers video --setup aus, um Ihre GPU automatisch zu erkennen und die richtige PyTorch- Variante + easyocr zu installieren. Dies ist der empfohlene Weg zur Installation visueller Extraktionsabhängigkeiten.


Ein-Befehl-Installations-Workflow

Der schnellste Weg von der Konfiguration zum hochgeladenen Skill — vollständig automatisiert:

# React-Skill aus offiziellen Konfigurationen installieren (automatischer Upload zu Claude)
skill-seekers install --config react

# Aus lokaler Konfigurationsdatei installieren
skill-seekers install --config configs/custom.json

# Ohne Upload installieren (nur Paketierung)
skill-seekers install --config django --no-upload

# Workflow ohne Ausführung in der Vorschau anzeigen
skill-seekers install --config react --dry-run

Ausgeführte Phasen:

Phase 1: Konfiguration abrufen (falls Konfigurationsname angegeben)
Phase 2: Dokumentation scrapen
Phase 3: KI-Verbesserung
Phase 4: Skill paketieren
Phase 5: Zu Claude hochladen (optional, erfordert API Key)

Funktionsmatrix

Skill Seekers unterstützt 12 LLM-Plattformen, 17 Quelltypen und vollständige Funktionsparität für alle Ziele.

Plattformen: Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Generisches Markdown, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI Quelltypen: Dokumentationswebsites, GitHub-Repos, PDFs, Word (.docx), EPUB, Video, lokale Codebasen, Jupyter-Notebooks, lokales HTML, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), RSS-/Atom-Feeds, Man-Pages, Confluence-Wikis, Notion-Seiten, Slack-/Discord-Chatexporte

Vollständige Informationen finden Sie in der vollständigen Funktionsmatrix.

Schneller Plattformvergleich

Funktion Claude Gemini OpenAI Markdown
Format ZIP + YAML tar.gz ZIP + Vector ZIP
Upload API API API Manuell
Verbesserung Sonnet 4 2.0 Flash GPT-4o Keine
Alle Skill-Modi Ja Ja Ja Ja

Verwendungsbeispiele

Dokumentations-Scraping

# Dokumentationswebsite scrapen
skill-seekers scrape --config configs/react.json

# Schnelles Scraping (ohne Konfiguration)
skill-seekers scrape --url https://react.dev --name react

# Mit Async-Modus (3x schneller)
skill-seekers scrape --config configs/godot.json --async --workers 8

PDF-Extraktion

# Grundlegende PDF-Extraktion
skill-seekers pdf --pdf docs/manual.pdf --name myskill

# Erweiterte Funktionen
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
    --extract-tables \        # Tabellen extrahieren
    --parallel \              # Schnelle Parallelverarbeitung
    --workers 8               # 8 CPU-Kerne verwenden

# Gescannte PDFs (erfordert: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr

Videoextraktion

# Video-Unterstützung installieren
pip install skill-seekers[video]        # Transkripte + Metadaten
pip install skill-seekers[video-full]   # + Whisper-Transkription + visuelle Frameextraktion

# GPU automatisch erkennen und visuelle Abhängigkeiten installieren (PyTorch + easyocr)
skill-seekers video --setup

# Aus YouTube-Video extrahieren
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial

# Aus einer YouTube-Playlist extrahieren
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist

# Aus einer lokalen Videodatei extrahieren
skill-seekers video --video-file recording.mp4 --name myrecording

# Mit visueller Frameanalyse extrahieren (erfordert video-full-Abhängigkeiten)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual

# Mit KI-Verbesserung (OCR bereinigen + ausgefeilte SKILL.md generieren)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2

# Bestimmten Abschnitt eines Videos ausschneiden (unterstützt Sekunden, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00

# Vision API für OCR-Frames mit niedriger Konfidenz verwenden (erfordert ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr

# Skill aus zuvor extrahierten Daten neu erstellen (Download überspringen)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial

Vollständige Anleitung: Siehe docs/VIDEO_GUIDE.md für die vollständige CLI-Referenz, Details zur visuellen Pipeline, KI-Verbesserungsoptionen und Fehlerbehebung.

GitHub-Repository-Analyse

# Grundlegendes Repository-Scraping
skill-seekers github --repo facebook/react

# Mit Authentifizierung (höhere Rate-Limits)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react

# Inhalte anpassen
skill-seekers github --repo django/django \
    --include-issues \        # GitHub Issues extrahieren
    --max-issues 100 \        # Issue-Anzahl begrenzen
    --include-changelog       # CHANGELOG.md extrahieren

Vereinheitlichtes Multi-Source-Scraping

Dokumentation + GitHub + PDF zu einem vereinheitlichten Skill mit Konflikterkennung kombinieren:

# Vorhandene vereinheitlichte Konfigurationen verwenden
skill-seekers unified --config configs/react_unified.json

# Oder vereinheitlichte Konfiguration erstellen
cat > configs/myframework_unified.json << 'EOF'
{
  "name": "myframework",
  "merge_mode": "rule-based",
  "sources": [
    {
      "type": "documentation",
      "base_url": "https://docs.myframework.com/",
      "max_pages": 200
    },
    {
      "type": "github",
      "repo": "owner/myframework",
      "code_analysis_depth": "surface"
    }
  ]
}
EOF

skill-seekers unified --config configs/myframework_unified.json

Die Konflikterkennung findet automatisch:

  • Im Code fehlend (hoch): Dokumentiert, aber nicht implementiert
  • In der Dokumentation fehlend (mittel): Implementiert, aber nicht dokumentiert
  • Signatur-Abweichung: Unterschiedliche Parameter/Typen
  • Beschreibungs-Abweichung: Unterschiedliche Erklärungen

Vollständige Anleitung: Siehe docs/UNIFIED_SCRAPING.md.

Private Konfigurations-Repositories

Benutzerdefinierte Konfigurationen über private Git-Repositories im Team teilen:

# MCP-Tools verwenden, um das private Team-Repository zu registrieren
add_config_source(
    name="team",
    git_url="https://github.com/mycompany/skill-configs.git",
    token_env="GITHUB_TOKEN"
)

# Konfiguration aus dem Team-Repository abrufen
fetch_config(source="team", config_name="internal-api")

Unterstützte Plattformen:

  • GitHub (GITHUB_TOKEN), GitLab (GITLAB_TOKEN), Gitea (GITEA_TOKEN), Bitbucket (BITBUCKET_TOKEN)

Vollständige Anleitung: Siehe docs/GIT_CONFIG_SOURCES.md.

Funktionsweise

graph LR
    A[Dokumentationswebsite] --> B[Skill Seekers]
    B --> C[Scraper]
    B --> D[KI-Verbesserung]
    B --> E[Paketierer]
    C --> F[Geordnete Referenzdateien]
    D --> F
    F --> E
    E --> G[Claude Skill .zip]
    G --> H[Upload zu Claude AI]
  1. llms.txt erkennen - Prüft zuerst auf llms-full.txt, llms.txt, llms-small.txt
  2. Scrapen: Alle Seiten aus der Dokumentation extrahieren
  3. Kategorisieren: Inhalte nach Themen organisieren (API, Anleitungen, Tutorials usw.)
  4. Verbessern: KI analysiert Dokumente und erstellt umfassende SKILL.md mit Beispielen
  5. Paketieren: Alles in eine Claude-fertige .zip-Datei bündeln

Voraussetzungen

Bevor Sie beginnen, stellen Sie sicher, dass Sie Folgendes haben:

  1. Python 3.10 oder höher - Herunterladen | Prüfen: python3 --version
  2. Git - Herunterladen | Prüfen: git --version
  3. 1530 Minuten für die erstmalige Einrichtung

Erstmalig hier?Starten Sie hier: Narrensichere Schnellstartanleitung


Skills zu Claude hochladen

Sobald Ihr Skill paketiert ist, müssen Sie ihn zu Claude hochladen:

Option 1: Automatischer Upload (API-basiert)

# API Key setzen (einmalig)
export ANTHROPIC_API_KEY=sk-ant-...

# Paketieren und automatisch hochladen
skill-seekers package output/react/ --upload

# ODER vorhandene .zip hochladen
skill-seekers upload output/react.zip

Option 2: Manueller Upload (ohne API Key)

# Skill paketieren
skill-seekers package output/react/
# → Erstellt output/react.zip

# Dann manuell hochladen:
# - Gehen Sie zu https://claude.ai/skills
# - Klicken Sie auf „Skill hochladen"
# - Wählen Sie output/react.zip

Option 3: MCP (Claude Code)

In Claude Code einfach fragen:
"Paketiere und lade den React-Skill hoch"

Installation für KI-Agenten

Skill Seekers kann Skills automatisch für 18 KI-Programmieragenten installieren.

# Für einen bestimmten Agenten installieren
skill-seekers install-agent output/react/ --agent cursor

# Für alle Agenten gleichzeitig installieren
skill-seekers install-agent output/react/ --agent all

# Vorschau ohne Installation
skill-seekers install-agent output/react/ --agent cursor --dry-run

Unterstützte Agenten

Agent Pfad Typ
Claude Code ~/.claude/skills/ Global
Cursor .cursor/skills/ Projekt
VS Code / Copilot .github/skills/ Projekt
Amp ~/.amp/skills/ Global
Goose ~/.config/goose/skills/ Global
OpenCode ~/.opencode/skills/ Global
Windsurf ~/.windsurf/skills/ Global
Roo Code .roo/skills/ Projekt
Cline .cline/skills/ Projekt
Aider ~/.aider/skills/ Global
Bolt .bolt/skills/ Projekt
Kilo Code .kilo/skills/ Projekt
Continue ~/.continue/skills/ Global
Kimi Code ~/.kimi/skills/ Global

MCP-Integration (26 Tools)

Skill Seekers liefert einen MCP-Server für die Verwendung mit Claude Code, Cursor, Windsurf, VS Code + Cline oder IntelliJ IDEA.

# stdio-Modus (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp

# HTTP-Modus (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765

# Alle Agenten automatisch konfigurieren
./setup_mcp.sh

Alle 26 verfügbaren Tools:

  • Kern (9): list_configs, generate_config, validate_config, estimate_pages, scrape_docs, package_skill, upload_skill, enhance_skill, install_skill
  • Erweitert (10): scrape_github, scrape_pdf, unified_scrape, merge_sources, detect_conflicts, add_config_source, fetch_config, list_config_sources, remove_config_source, split_config
  • Vektordatenbank (4): export_to_chroma, export_to_weaviate, export_to_faiss, export_to_qdrant
  • Cloud (3): cloud_upload, cloud_download, cloud_list

Vollständige Anleitung: docs/MCP_SETUP.md


Konfiguration

Verfügbare Presets (24+)

# Alle Presets auflisten
skill-seekers list-configs
Kategorie Presets
Web-Frameworks react, vue, angular, svelte, nextjs
Python django, flask, fastapi, sqlalchemy, pytest
Spieleentwicklung godot, pygame, unity
Tools und DevOps docker, kubernetes, terraform, ansible
Vereinheitlicht (Doku + GitHub) react-unified, vue-unified, nextjs-unified u. a.

Eigene Konfiguration erstellen

# Option 1: Interaktiv
skill-seekers scrape --interactive

# Option 2: Preset kopieren und bearbeiten
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json

Konfigurationsdatei-Struktur

{
  "name": "myframework",
  "description": "Wann dieser Skill verwendet werden soll",
  "base_url": "https://docs.myframework.com/",
  "selectors": {
    "main_content": "article",
    "title": "h1",
    "code_blocks": "pre code"
  },
  "url_patterns": {
    "include": ["/docs", "/guide"],
    "exclude": ["/blog", "/about"]
  },
  "categories": {
    "getting_started": ["intro", "quickstart"],
    "api": ["api", "reference"]
  },
  "rate_limit": 0.5,
  "max_pages": 500
}

Speicherorte für Konfigurationen

Das Tool sucht in dieser Reihenfolge:

  1. Exakter Pfad wie angegeben
  2. ./configs/ (aktuelles Verzeichnis)
  3. ~/.config/skill-seekers/configs/ (Benutzerkonfigurationsverzeichnis)
  4. SkillSeekersWeb.com API (Preset-Konfigurationen)

Was wird erstellt

output/
├── godot_data/              # Gescrapte Rohdaten
│   ├── pages/              # JSON-Dateien (eine pro Seite)
│   └── summary.json        # Übersicht
│
└── godot/                   # Der Skill
    ├── SKILL.md            # Verbessert mit echten Beispielen
    ├── references/         # Kategorisierte Dokumentation
    │   ├── index.md
    │   ├── getting_started.md
    │   ├── scripting.md
    │   └── ...
    ├── scripts/            # Leer (eigene hinzufügen)
    └── assets/             # Leer (eigene hinzufügen)

Fehlerbehebung

Kein Inhalt extrahiert?

  • Überprüfen Sie Ihren main_content-Selektor
  • Versuchen Sie: article, main, div[role="main"]

Daten vorhanden, aber werden nicht verwendet?

# Erneutes Scraping erzwingen
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json

Kategorien nicht gut?

Bearbeiten Sie den categories-Abschnitt in der Konfiguration mit besseren Schlüsselwörtern.

Dokumentation aktualisieren?

# Alte Daten löschen und erneut scrapen
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json

Verbesserung funktioniert nicht?

# Prüfen, ob API Key gesetzt ist
echo $ANTHROPIC_API_KEY

# LOCAL-Modus versuchen (nutzt Claude Code Max, kein API Key nötig)
skill-seekers enhance output/react/ --mode LOCAL

# Hintergrund-Verbesserungsstatus überwachen
skill-seekers enhance-status output/react/ --watch

GitHub-Rate-Limit-Probleme?

# GitHub Token setzen (5000 Anfragen/Stunde vs. 60/Stunde anonym)
export GITHUB_TOKEN=ghp_your_token_here

# Oder mehrere Profile konfigurieren
skill-seekers config --github

Leistung

Aufgabe Dauer Hinweise
Scraping (synchron) 1545 Min. Nur beim ersten Mal, thread-basiert
Scraping (asynchron) 515 Min. 23x schneller mit --async-Flag
Erstellen 13 Min. Schneller Neuaufbau aus Cache
Neuerstellen <1 Min. Mit --skip-scrape
Verbesserung (LOCAL) 3060 Sek. Nutzt Claude Code Max
Verbesserung (API) 2040 Sek. Erfordert API Key
Video (Transkript) 13 Min. YouTube/lokal, nur Transkript
Video (visuell) 515 Min. + OCR-Frameextraktion
Paketierung 510 Sek. Finale .zip-Erstellung

Dokumentation

Erste Schritte

Anleitungen

Integrationsanleitungen


Lizenz

MIT-Lizenz - siehe LICENSE-Datei für Details


Viel Erfolg beim Erstellen von Skills!


Sicherheit

MseeP.ai Security Assessment Badge