<p align="center">
  <img src="docs/assets/logo.png" alt="Skill Seekers" width="200"/>
</p>

# Skill Seekers

[English](README.md) | [简体中文](README.zh-CN.md) | [日本語](README.ja.md) | [한국어](README.ko.md) | [Español](README.es.md) | Français | [Deutsch](README.de.md) | [Português](README.pt-BR.md) | [Türkçe](README.tr.md) | [العربية](README.ar.md) | [हिन्दी](README.hi.md) | [Русский](README.ru.md)

> ⚠️ **Avis de traduction automatique**
>
> Ce document a été traduit automatiquement par IA. Bien que nous nous efforcions de garantir la qualité, des expressions inexactes peuvent subsister.
>
> N'hésitez pas à contribuer à l'amélioration de la traduction via [GitHub Issue #260](https://github.com/yusufkaraaslan/Skill_Seekers/issues/260) ! Vos retours nous sont précieux.

[![Version](https://img.shields.io/badge/version-3.2.0-blue.svg)](https://github.com/yusufkaraaslan/Skill_Seekers/releases)
[![Licence : MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT)
[![Python 3.10+](https://img.shields.io/badge/python-3.10+-blue.svg)](https://www.python.org/downloads/)
[![Intégration MCP](https://img.shields.io/badge/MCP-Integrated-blue.svg)](https://modelcontextprotocol.io)
[![Tests réussis](https://img.shields.io/badge/Tests-2540%2B%20Passing-brightgreen.svg)](tests/)
[![Tableau de projet](https://img.shields.io/badge/Project-Board-purple.svg)](https://github.com/users/yusufkaraaslan/projects/2)
[![Version PyPI](https://badge.fury.io/py/skill-seekers.svg)](https://pypi.org/project/skill-seekers/)
[![PyPI - Téléchargements](https://img.shields.io/pypi/dm/skill-seekers.svg)](https://pypi.org/project/skill-seekers/)
[![PyPI - Version Python](https://img.shields.io/pypi/pyversions/skill-seekers.svg)](https://pypi.org/project/skill-seekers/)
[![Site web](https://img.shields.io/badge/Website-skillseekersweb.com-blue.svg)](https://skillseekersweb.com/)
[![Suivre sur Twitter](https://img.shields.io/twitter/follow/_yUSyUS_?style=social)](https://x.com/_yUSyUS_)
[![Étoiles GitHub](https://img.shields.io/github/stars/yusufkaraaslan/Skill_Seekers?style=social)](https://github.com/yusufkaraaslan/Skill_Seekers)

**🧠 La couche de données pour les systèmes d'IA.** Skill Seekers transforme les sites de documentation, dépôts GitHub, PDF, vidéos, notebooks Jupyter, wikis et plus de 10 autres types de sources en ressources de connaissances structurées — prêtes à alimenter les compétences IA (Claude, Gemini, OpenAI), les pipelines RAG (LangChain, LlamaIndex, Pinecone) et les assistants de codage IA (Cursor, Windsurf, Cline) en quelques minutes, pas en heures.

> 🌐 **[Visitez SkillSeekersWeb.com](https://skillseekersweb.com/)** - Parcourez plus de 24 configurations prédéfinies, partagez vos configurations et accédez à la documentation complète !

> 📋 **[Consultez la feuille de route et les tâches](https://github.com/users/yusufkaraaslan/projects/2)** - 134 tâches réparties en 10 catégories, choisissez-en une pour contribuer !

## 🧠 La couche de données pour les systèmes d'IA

**Skill Seekers est la couche de prétraitement universelle** qui se situe entre la documentation brute et tous les systèmes d'IA qui la consomment. Que vous construisiez des compétences Claude, un pipeline RAG LangChain ou un fichier `.cursorrules` pour Cursor — la préparation des données est identique. Vous le faites une seule fois, et exportez vers toutes les cibles.

```bash
# Une commande → ressource de connaissances structurée
skill-seekers create https://docs.react.dev/
# ou : skill-seekers create facebook/react
# ou : skill-seekers create ./my-project

# Exporter vers n'importe quel système d'IA
skill-seekers package output/react --target claude      # → Compétence Claude AI (ZIP)
skill-seekers package output/react --target langchain   # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor      # → .cursorrules
```

### Ce qui est généré

| Sortie | Cible | Utilisation |
|--------|-------|-------------|
| **Compétence Claude** (ZIP + YAML) | `--target claude` | Claude Code, Claude API |
| **Compétence Gemini** (tar.gz) | `--target gemini` | Google Gemini |
| **OpenAI / Custom GPT** (ZIP) | `--target openai` | GPT-4o, assistants personnalisés |
| **LangChain Documents** | `--target langchain` | Chaînes QA, agents, récupérateurs |
| **LlamaIndex TextNodes** | `--target llama-index` | Moteurs de requêtes, moteurs de chat |
| **Haystack Documents** | `--target haystack` | Pipelines RAG d'entreprise |
| **Prêt pour Pinecone** (Markdown) | `--target markdown` | Insertion vectorielle |
| **ChromaDB / FAISS / Qdrant** | `--format chroma/faiss/qdrant` | Bases vectorielles locales |
| **Cursor** `.cursorrules` | `--target claude` → copier | Contexte IA de l'IDE Cursor |
| **Windsurf / Cline / Continue** | `--target claude` → copier | VS Code, IntelliJ, Vim |

### Pourquoi c'est important

- ⚡ **99 % plus rapide** — Des jours de préparation manuelle → 15–45 minutes
- 🎯 **Qualité des compétences IA** — Fichiers SKILL.md de 500+ lignes avec exemples, patterns et guides
- 📊 **Fragments prêts pour le RAG** — Découpage intelligent préservant les blocs de code et le contexte
- 🎬 **Vidéos** — Extraction de code, transcriptions et connaissances structurées depuis YouTube et vidéos locales
- 🔄 **Multi-sources** — Combinez 17 types de sources (docs, GitHub, PDF, vidéos, notebooks, wikis, etc.) en une seule ressource
- 🌐 **Une préparation, toutes les cibles** — Exportez la même ressource vers 16 plateformes sans re-scraping
- ✅ **Éprouvé en production** — 2 540+ tests, 24+ préréglages de frameworks, prêt pour la production

## 🚀 Démarrage rapide (3 commandes)

```bash
# 1. Installer
pip install skill-seekers

# 2. Créer une compétence depuis n'importe quelle source
skill-seekers create https://docs.django.com/

# 3. Empaqueter pour votre plateforme IA
skill-seekers package output/django --target claude
```

**C'est tout !** Vous avez maintenant `output/django-claude.zip` prêt à l'emploi.

### Autres sources (17 prises en charge)

```bash
# Dépôt GitHub
skill-seekers create facebook/react

# Projet local
skill-seekers create ./my-project

# Document PDF
skill-seekers create manual.pdf

# Document Word
skill-seekers create report.docx

# Livre numérique EPUB
skill-seekers create book.epub

# Notebook Jupyter
skill-seekers create notebook.ipynb

# Spécification OpenAPI
skill-seekers create openapi.yaml

# Présentation PowerPoint
skill-seekers create presentation.pptx

# Document AsciiDoc
skill-seekers create guide.adoc

# Fichier HTML local
skill-seekers create page.html

# Flux RSS/Atom
skill-seekers create feed.rss

# Page de manuel
skill-seekers create curl.1

# Vidéo (YouTube, Vimeo ou fichier local — nécessite skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# Première utilisation ? Installation automatique des dépendances visuelles GPU :
skill-seekers video --setup

# Wiki Confluence
skill-seekers confluence --space TEAM --name wiki

# Pages Notion
skill-seekers notion --database-id ... --name docs

# Export chat Slack/Discord
skill-seekers chat --export-dir ./slack-export --name team-chat
```

### Exporter partout

```bash
# Empaqueter pour plusieurs plateformes
for platform in claude gemini openai langchain; do
  skill-seekers package output/django --target $platform
done
```

## Qu'est-ce que Skill Seekers ?

Skill Seekers est la **couche de données pour les systèmes d'IA**. Il transforme 17 types de sources — sites de documentation, dépôts GitHub, PDF, vidéos, notebooks Jupyter, documents Word/EPUB/AsciiDoc, spécifications OpenAPI, présentations PowerPoint, flux RSS, pages de manuel, wikis Confluence, pages Notion, exports Slack/Discord, et plus encore — en ressources de connaissances structurées pour toutes les cibles IA :

| Cas d'usage | Ce que vous obtenez | Exemples |
|-------------|---------------------|----------|
| **Compétences IA** | SKILL.md complet + références | Claude Code, Gemini, GPT |
| **Pipelines RAG** | Documents découpés avec métadonnées riches | LangChain, LlamaIndex, Haystack |
| **Bases vectorielles** | Données pré-formatées prêtes à l'insertion | Pinecone, Chroma, Weaviate, FAISS |
| **Assistants de codage IA** | Fichiers de contexte lus automatiquement par l'IA de votre IDE | Cursor, Windsurf, Cline, Continue.dev |

## 📚 Documentation

| Je veux... | Lire ceci |
|------------|-----------|
| **Démarrer rapidement** | [Démarrage rapide](docs/getting-started/02-quick-start.md) - 3 commandes pour une première compétence |
| **Comprendre les concepts** | [Concepts fondamentaux](docs/user-guide/01-core-concepts.md) - Comment ça marche |
| **Scraper des sources** | [Guide de scraping](docs/user-guide/02-scraping.md) - Tous les types de sources |
| **Améliorer les compétences** | [Guide d'amélioration](docs/user-guide/03-enhancement.md) - Amélioration par IA |
| **Exporter les compétences** | [Guide d'empaquetage](docs/user-guide/04-packaging.md) - Export vers les plateformes |
| **Consulter les commandes** | [Référence CLI](docs/reference/CLI_REFERENCE.md) - Les 20 commandes |
| **Configurer** | [Format de configuration](docs/reference/CONFIG_FORMAT.md) - Spécification JSON |
| **Résoudre des problèmes** | [Dépannage](docs/user-guide/06-troubleshooting.md) - Problèmes courants |

**Documentation complète :** [docs/README.md](docs/README.md)

Au lieu de passer des jours en prétraitement manuel, Skill Seekers :

1. **Ingère** — docs, dépôts GitHub, bases de code locales, PDF, vidéos, notebooks, wikis et plus de 10 autres types de sources
2. **Analyse** — analyse AST approfondie, détection de patterns, extraction d'API
3. **Structure** — fichiers de référence catégorisés avec métadonnées
4. **Améliore** — génération de SKILL.md par IA (Claude, Gemini ou local)
5. **Exporte** — 16 formats spécifiques à chaque plateforme depuis une seule ressource

## Pourquoi l'utiliser ?

### Pour les créateurs de compétences IA (Claude, Gemini, OpenAI)

- 🎯 **Compétences de qualité production** — Fichiers SKILL.md de 500+ lignes avec exemples de code, patterns et guides
- 🔄 **Workflows d'amélioration** — Appliquez `security-focus`, `architecture-comprehensive` ou des préréglages YAML personnalisés
- 🎮 **N'importe quel domaine** — Moteurs de jeux (Godot, Unity), frameworks (React, Django), outils internes
- 🔧 **Équipes** — Combinez documentation interne + code en une source de vérité unique
- 📚 **Qualité** — Amélioré par IA avec exemples, référence rapide et guide de navigation

### Pour les développeurs RAG et ingénieurs IA

- 🤖 **Données prêtes pour le RAG** — `Documents` LangChain, `TextNodes` LlamaIndex, `Documents` Haystack pré-découpés
- 🚀 **99 % plus rapide** — Des jours de prétraitement → 15–45 minutes
- 📊 **Métadonnées intelligentes** — Catégories, sources, types → meilleure précision de récupération
- 🔄 **Multi-sources** — Combinez docs + GitHub + PDF + vidéos dans un seul pipeline
- 🌐 **Indépendant de la plateforme** — Exportez vers n'importe quelle base vectorielle ou framework sans re-scraping

### Pour les utilisateurs d'assistants de codage IA

- 💻 **Cursor / Windsurf / Cline** — Générez automatiquement `.cursorrules` / `.windsurfrules` / `.clinerules`
- 🎯 **Contexte persistant** — L'IA « connaît » vos frameworks sans prompts répétitifs
- 📚 **Toujours à jour** — Mettez à jour le contexte en quelques minutes quand la documentation change

## Fonctionnalités clés

### 🌐 Scraping de documentation
- ✅ **Support llms.txt** - Détecte et utilise automatiquement les fichiers de documentation prêts pour les LLM (10x plus rapide)
- ✅ **Scraper universel** - Fonctionne avec N'IMPORTE QUEL site de documentation
- ✅ **Catégorisation intelligente** - Organise automatiquement le contenu par sujet
- ✅ **Détection du langage de code** - Reconnaît Python, JavaScript, C++, GDScript, etc.
- ✅ **24+ préréglages prêts à l'emploi** - Godot, React, Vue, Django, FastAPI, et plus

### 📄 Support PDF
- ✅ **Extraction PDF basique** - Extraction de texte, code et images depuis les fichiers PDF
- ✅ **OCR pour PDF scannés** - Extraction de texte depuis les documents numérisés
- ✅ **PDF protégés par mot de passe** - Gestion des PDF chiffrés
- ✅ **Extraction de tableaux** - Extraction de tableaux complexes depuis les PDF
- ✅ **Traitement parallèle** - 3x plus rapide pour les gros PDF
- ✅ **Cache intelligent** - 50 % plus rapide lors des ré-exécutions

### 🎬 Extraction vidéo
- ✅ **YouTube et vidéos locales** - Extraction de transcriptions, code à l'écran et connaissances structurées depuis les vidéos
- ✅ **Analyse visuelle des images** - Extraction OCR depuis éditeurs de code, terminaux, diapositives et diagrammes
- ✅ **Détection automatique du GPU** - Installation automatique de la bonne version de PyTorch (CUDA/ROCm/MPS/CPU)
- ✅ **Amélioration par IA** - Deux passes : nettoyage OCR + génération d'un SKILL.md soigné
- ✅ **Découpage temporel** - Extraction de sections spécifiques avec `--start-time` et `--end-time`
- ✅ **Support des playlists** - Traitement par lots de toutes les vidéos d'une playlist YouTube
- ✅ **Fallback Vision API** - Utilisation de Claude Vision pour les images OCR à faible confiance

### 🐙 Analyse de dépôts GitHub
- ✅ **Analyse approfondie du code** - Analyse AST pour Python, JavaScript, TypeScript, Java, C++, Go
- ✅ **Extraction d'API** - Fonctions, classes, méthodes avec paramètres et types
- ✅ **Métadonnées du dépôt** - README, arborescence, répartition des langages, étoiles/forks
- ✅ **Issues et PR GitHub** - Récupération des issues ouvertes/fermées avec labels et jalons
- ✅ **CHANGELOG et versions** - Extraction automatique de l'historique des versions
- ✅ **Détection de conflits** - Comparaison entre les API documentées et l'implémentation réelle
- ✅ **Intégration MCP** - En langage naturel : « Scraper le dépôt GitHub facebook/react »

### 🔄 Scraping multi-sources unifié
- ✅ **Combinaison de sources multiples** - Mélangez documentation + GitHub + PDF dans une seule compétence
- ✅ **Détection de conflits** - Détection automatique des divergences entre docs et code
- ✅ **Fusion intelligente** - Résolution de conflits par règles ou par IA
- ✅ **Rapports transparents** - Comparaison côte à côte avec avertissements ⚠️
- ✅ **Analyse des lacunes documentaires** - Identification des docs obsolètes et fonctionnalités non documentées
- ✅ **Source de vérité unique** - Une seule compétence montrant à la fois l'intention (docs) et la réalité (code)
- ✅ **Rétrocompatibilité** - Les configurations à source unique héritées fonctionnent toujours

### 🤖 Support multi-plateformes LLM
- ✅ **12 plateformes LLM** - Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown générique, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
- ✅ **Scraping universel** - La même documentation fonctionne pour toutes les plateformes
- ✅ **Empaquetage spécifique** - Formats optimisés pour chaque LLM
- ✅ **Export en une commande** - Le flag `--target` sélectionne la plateforme
- ✅ **Dépendances optionnelles** - Installez seulement ce dont vous avez besoin
- ✅ **100 % rétrocompatible** - Les workflows Claude existants restent inchangés

| Plateforme | Format | Upload | Amélioration | API Key | Endpoint personnalisé |
|------------|--------|--------|--------------|---------|----------------------|
| **Claude AI** | ZIP + YAML | ✅ Auto | ✅ Oui | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
| **Google Gemini** | tar.gz | ✅ Auto | ✅ Oui | GOOGLE_API_KEY | - |
| **OpenAI ChatGPT** | ZIP + Vector Store | ✅ Auto | ✅ Oui | OPENAI_API_KEY | - |
| **Markdown générique** | ZIP | ❌ Manuel | ❌ Non | - | - |

```bash
# Claude (par défaut - aucune modification nécessaire !)
skill-seekers package output/react/
skill-seekers upload react.zip

# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini

# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai

# Markdown générique (export universel)
skill-seekers package output/react/ --target markdown
# Utilisez les fichiers markdown directement dans n'importe quel LLM
```

<details>
<summary>🔧 <strong>Variables d'environnement pour les API compatibles Claude (ex. GLM-4.7)</strong></summary>

Skill Seekers prend en charge n'importe quel endpoint d'API compatible Claude :

```bash
# Option 1 : API Anthropic officielle (par défaut)
export ANTHROPIC_API_KEY=sk-ant-...

# Option 2 : API compatible Claude GLM-4.7
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1

# Toutes les fonctionnalités d'amélioration IA utiliseront l'endpoint configuré
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance
```

**Note** : Définir `ANTHROPIC_BASE_URL` vous permet d'utiliser n'importe quel endpoint d'API compatible Claude, comme GLM-4.7 (智谱 AI) ou d'autres services compatibles.

</details>

**Installation :**
```bash
# Installer le support Gemini
pip install skill-seekers[gemini]

# Installer le support OpenAI
pip install skill-seekers[openai]

# Installer toutes les plateformes LLM
pip install skill-seekers[all-llms]
```

### 🔗 Intégrations de frameworks RAG

- ✅ **LangChain Documents** - Export direct au format `Document` avec `page_content` + métadonnées
  - Idéal pour : chaînes QA, récupérateurs, stores vectoriels, agents
  - Exemple : [Pipeline RAG LangChain](examples/langchain-rag-pipeline/)
  - Guide : [Intégration LangChain](docs/integrations/LANGCHAIN.md)

- ✅ **LlamaIndex TextNodes** - Export au format `TextNode` avec IDs uniques + embeddings
  - Idéal pour : moteurs de requêtes, moteurs de chat, contexte de stockage
  - Exemple : [Moteur de requêtes LlamaIndex](examples/llama-index-query-engine/)
  - Guide : [Intégration LlamaIndex](docs/integrations/LLAMA_INDEX.md)

- ✅ **Format prêt pour Pinecone** - Optimisé pour l'insertion dans les bases vectorielles
  - Idéal pour : recherche vectorielle en production, recherche sémantique, recherche hybride
  - Exemple : [Insertion Pinecone](examples/pinecone-upsert/)
  - Guide : [Intégration Pinecone](docs/integrations/PINECONE.md)

**Export rapide :**
```bash
# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json

# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json

# Markdown (universel)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/
```

**Guide complet des pipelines RAG :** [Documentation des pipelines RAG](docs/integrations/RAG_PIPELINES.md)

---

### 🧠 Intégrations d'assistants de codage IA

Transformez n'importe quelle documentation de framework en contexte de codage expert pour plus de 4 assistants IA :

- ✅ **Cursor IDE** - Génération de `.cursorrules` pour des suggestions de code alimentées par l'IA
  - Idéal pour : génération de code spécifique au framework, patterns cohérents
  - Fonctionne avec : Cursor IDE (fork de VS Code)
  - Guide : [Intégration Cursor](docs/integrations/CURSOR.md)
  - Exemple : [Compétence Cursor React](examples/cursor-react-skill/)

- ✅ **Windsurf** - Personnalisation du contexte de l'assistant IA Windsurf avec `.windsurfrules`
  - Idéal pour : assistance IA native dans l'IDE, codage en flux
  - Fonctionne avec : Windsurf IDE par Codeium
  - Guide : [Intégration Windsurf](docs/integrations/WINDSURF.md)
  - Exemple : [Contexte FastAPI Windsurf](examples/windsurf-fastapi-context/)

- ✅ **Cline (VS Code)** - Prompts système + MCP pour l'agent VS Code
  - Idéal pour : génération de code agentique dans VS Code
  - Fonctionne avec : extension Cline pour VS Code
  - Guide : [Intégration Cline](docs/integrations/CLINE.md)
  - Exemple : [Assistant Django Cline](examples/cline-django-assistant/)

- ✅ **Continue.dev** - Serveurs de contexte pour une IA indépendante de l'IDE
  - Idéal pour : environnements multi-IDE (VS Code, JetBrains, Vim), fournisseurs LLM personnalisés
  - Fonctionne avec : tout IDE disposant du plugin Continue.dev
  - Guide : [Intégration Continue](docs/integrations/CONTINUE_DEV.md)
  - Exemple : [Contexte universel Continue](examples/continue-dev-universal/)

**Export rapide pour les outils de codage IA :**
```bash
# Pour n'importe quel assistant de codage IA (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude  # ou --target markdown

# Copier dans votre projet (exemple pour Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules

# Ou pour Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md

# Ou pour Cline
cp output/django-claude/SKILL.md my-project/.clinerules

# Ou pour Continue.dev (serveur HTTP)
python examples/continue-dev-universal/context_server.py
# Configurer dans ~/.continue/config.json
```

**Hub d'intégrations :** [Toutes les intégrations de systèmes IA](docs/integrations/INTEGRATIONS.md)

---

### 🌊 Architecture GitHub à trois flux
- ✅ **Analyse à triple flux** - Division des dépôts GitHub en flux Code, Docs et Insights
- ✅ **Analyseur de base de code unifié** - Fonctionne avec les URL GitHub ET les chemins locaux
- ✅ **C3.x comme profondeur d'analyse** - Choisissez 'basic' (1–2 min) ou 'c3x' (20–60 min)
- ✅ **Génération de routeur améliorée** - Métadonnées GitHub, démarrage rapide README, problèmes courants
- ✅ **Intégration des Issues** - Principaux problèmes et solutions depuis les issues GitHub
- ✅ **Mots-clés de routage intelligents** - Labels GitHub pondérés 2x pour une meilleure détection des sujets

**Les trois flux expliqués :**
- **Flux 1 : Code** - Analyse approfondie C3.x (patterns, exemples, guides, configurations, architecture)
- **Flux 2 : Docs** - Documentation du dépôt (README, CONTRIBUTING, docs/*.md)
- **Flux 3 : Insights** - Connaissances communautaires (issues, labels, étoiles, forks)

```python
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer

# Analyser un dépôt GitHub avec les trois flux
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
    source="https://github.com/facebook/react",
    depth="c3x",  # ou "basic" pour une analyse rapide
    fetch_github_metadata=True
)

# Accéder au flux code (analyse C3.x)
print(f"Design patterns : {len(result.code_analysis['c3_1_patterns'])}")
print(f"Exemples de tests : {result.code_analysis['c3_2_examples_count']}")

# Accéder au flux docs (documentation du dépôt)
print(f"README : {result.github_docs['readme'][:100]}")

# Accéder au flux insights (métadonnées GitHub)
print(f"Étoiles : {result.github_insights['metadata']['stars']}")
print(f"Problèmes courants : {len(result.github_insights['common_problems'])}")
```

**Documentation complète** : [Résumé de l'implémentation à trois flux](docs/IMPLEMENTATION_SUMMARY_THREE_STREAM.md)

### 🔐 Gestion intelligente des limites de débit et configuration
- ✅ **Système de configuration multi-tokens** - Gérez plusieurs comptes GitHub (personnel, professionnel, OSS)
  - Stockage sécurisé de la configuration dans `~/.config/skill-seekers/config.json` (permissions 600)
  - Stratégies de limite de débit par profil : `prompt`, `wait`, `switch`, `fail`
  - Délai d'expiration configurable par profil (défaut : 30 min, évite les attentes indéfinies)
  - Chaîne de repli intelligente : argument CLI → variable d'env → fichier de config → prompt
  - Gestion des clés API pour Claude, Gemini, OpenAI
- ✅ **Assistant de configuration interactif** - Interface terminal élégante pour une configuration facile
  - Intégration navigateur pour la création de tokens (ouverture automatique de GitHub, etc.)
  - Validation des tokens et test de connexion
  - Affichage visuel du statut avec code couleur
- ✅ **Gestionnaire intelligent de limites de débit** - Plus d'attentes indéfinies !
  - Avertissement préalable sur les limites de débit (60/heure vs 5000/heure)
  - Détection en temps réel depuis les réponses de l'API GitHub
  - Compteurs à rebours en direct avec progression
  - Basculement automatique de profil en cas de limite atteinte
  - Quatre stratégies : prompt (demander), wait (compte à rebours), switch (essayer un autre), fail (abandonner)
- ✅ **Capacité de reprise** - Continuez les tâches interrompues
  - Sauvegarde automatique à intervalles configurables (défaut : 60 sec)
  - Liste de toutes les tâches reprises avec détails de progression
  - Nettoyage automatique des anciennes tâches (défaut : 7 jours)
- ✅ **Support CI/CD** - Mode non-interactif pour l'automatisation
  - Flag `--non-interactive` pour un échec rapide sans prompts
  - Flag `--profile` pour sélectionner un compte GitHub spécifique
  - Messages d'erreur clairs pour les logs de pipeline

**Configuration rapide :**
```bash
# Configuration unique (5 minutes)
skill-seekers config --github

# Utiliser un profil spécifique pour les dépôts privés
skill-seekers github --repo mycompany/private-repo --profile work

# Mode CI/CD (échec rapide, sans prompts)
skill-seekers github --repo owner/repo --non-interactive

# Reprendre une tâche interrompue
skill-seekers resume --list
skill-seekers resume github_react_20260117_143022
```

**Stratégies de limite de débit :**
- **prompt** (par défaut) - Demande quoi faire en cas de limite (attendre, basculer, configurer un token, annuler)
- **wait** - Attend automatiquement avec un compte à rebours (respecte le délai d'expiration)
- **switch** - Essaie automatiquement le profil disponible suivant (pour les configurations multi-comptes)
- **fail** - Échoue immédiatement avec un message d'erreur clair (parfait pour le CI/CD)

### 🎯 Compétence Bootstrap - Auto-hébergement

Générez skill-seekers lui-même en tant que compétence Claude Code pour l'utiliser dans Claude :

```bash
# Générer la compétence
./scripts/bootstrap_skill.sh

# Installer dans Claude Code
cp -r output/skill-seekers ~/.claude/skills/
```

**Ce que vous obtenez :**
- ✅ **Documentation complète de la compétence** - Toutes les commandes CLI et patterns d'utilisation
- ✅ **Référence des commandes CLI** - Chaque outil et ses options documentés
- ✅ **Exemples de démarrage rapide** - Workflows courants et bonnes pratiques
- ✅ **Documentation API auto-générée** - Analyse de code, patterns et exemples

### 🔐 Dépôts de configuration privés
- ✅ **Sources de configuration basées sur Git** - Récupérez les configurations depuis des dépôts Git privés/d'équipe
- ✅ **Gestion multi-sources** - Enregistrez un nombre illimité de dépôts GitHub, GitLab, Bitbucket
- ✅ **Collaboration d'équipe** - Partagez des configurations personnalisées au sein d'équipes de 3 à 5 personnes
- ✅ **Support entreprise** - Montée en charge jusqu'à 500+ développeurs avec résolution par priorité
- ✅ **Authentification sécurisée** - Tokens via variables d'environnement (GITHUB_TOKEN, GITLAB_TOKEN)
- ✅ **Cache intelligent** - Clonage unique, mises à jour automatiques par pull
- ✅ **Mode hors ligne** - Travaillez avec les configurations en cache en l'absence de connexion

### 🤖 Analyse de base de code (C3.x)

**C3.4 : Extraction de patterns de configuration avec amélioration IA**
- ✅ **9 formats de configuration** - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
- ✅ **7 types de patterns** - Configurations de base de données, API, journalisation, cache, e-mail, authentification, serveur
- ✅ **Amélioration par IA** - Analyse IA optionnelle en mode double (API + LOCAL)
  - Explique ce que fait chaque configuration
  - Suggère des bonnes pratiques et améliorations
  - **Analyse de sécurité** - Détecte les secrets codés en dur, les identifiants exposés
- ✅ **Documentation automatique** - Génère une documentation JSON + Markdown de toutes les configurations
- ✅ **Intégration MCP** - Outil `extract_config_patterns` avec support d'amélioration

**C3.3 : Guides pratiques améliorés par IA**
- ✅ **Amélioration IA complète** - Transforme les guides basiques en tutoriels professionnels
- ✅ **5 améliorations automatiques** - Descriptions d'étapes, dépannage, prérequis, étapes suivantes, cas d'usage
- ✅ **Support en mode double** - Mode API (Claude API) ou mode LOCAL (CLI Claude Code)
- ✅ **Aucun coût en mode LOCAL** - Amélioration GRATUITE avec votre abonnement Claude Code Max
- ✅ **Transformation qualitative** - Templates de 75 lignes → guides complets de 500+ lignes

**Utilisation :**
```bash
# Analyse rapide (1–2 min, fonctionnalités basiques uniquement)
skill-seekers analyze --directory tests/ --quick

# Analyse complète avec IA (20–60 min, toutes les fonctionnalités)
skill-seekers analyze --directory tests/ --comprehensive

# Avec amélioration par IA
skill-seekers analyze --directory tests/ --enhance
```

**Documentation complète :** [docs/HOW_TO_GUIDES.md](docs/HOW_TO_GUIDES.md#ai-enhancement-new)

### 🔄 Préréglages de workflow d'amélioration

Pipelines d'amélioration réutilisables définis en YAML qui contrôlent comment l'IA transforme votre documentation brute en une compétence soignée.

- ✅ **5 préréglages intégrés** — `default`, `minimal`, `security-focus`, `architecture-comprehensive`, `api-documentation`
- ✅ **Préréglages définis par l'utilisateur** — Ajoutez des workflows personnalisés dans `~/.config/skill-seekers/workflows/`
- ✅ **Chaînage de workflows** — Chaînez deux workflows ou plus dans une seule commande
- ✅ **CLI complet** — Lister, inspecter, copier, ajouter, supprimer et valider les workflows

```bash
# Appliquer un workflow unique
skill-seekers create ./my-project --enhance-workflow security-focus

# Chaîner plusieurs workflows (appliqués dans l'ordre)
skill-seekers create ./my-project \
  --enhance-workflow security-focus \
  --enhance-workflow minimal

# Gérer les préréglages
skill-seekers workflows list                          # Lister tous (intégrés + utilisateur)
skill-seekers workflows show security-focus           # Afficher le contenu YAML
skill-seekers workflows copy security-focus           # Copier dans le répertoire utilisateur pour édition
skill-seekers workflows add ./my-workflow.yaml        # Installer un préréglage personnalisé
skill-seekers workflows remove my-workflow            # Supprimer un préréglage utilisateur
skill-seekers workflows validate security-focus       # Valider la structure du préréglage

# Copier plusieurs à la fois
skill-seekers workflows copy security-focus minimal api-documentation

# Ajouter plusieurs fichiers à la fois
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml

# Supprimer plusieurs à la fois
skill-seekers workflows remove my-wf-a my-wf-b
```

**Format YAML des préréglages :**
```yaml
name: security-focus
description: "Revue axée sécurité : vulnérabilités, authentification, gestion des données"
version: "1.0"
stages:
  - name: vulnerabilities
    type: custom
    prompt: "Analyser les OWASP Top 10 et les vulnérabilités de sécurité courantes..."
  - name: auth-review
    type: custom
    prompt: "Examiner les patterns d'authentification et d'autorisation..."
    uses_history: true
```

### ⚡ Performance et montée en charge
- ✅ **Mode asynchrone** - Scraping 2–3x plus rapide avec async/await (flag `--async`)
- ✅ **Support des grandes documentations** - Gestion de documents de 10K–40K+ pages avec découpage intelligent
- ✅ **Compétences Router/Hub** - Routage intelligent vers des sous-compétences spécialisées
- ✅ **Scraping parallèle** - Traitement simultané de plusieurs compétences
- ✅ **Points de contrôle/Reprise** - Ne perdez jamais la progression lors de longs scrapings
- ✅ **Système de cache** - Scrapez une fois, reconstruisez instantanément

### ✅ Assurance qualité
- ✅ **Entièrement testé** - 2 540+ tests avec couverture complète

---

## 📦 Installation

```bash
# Installation basique (scraping de documentation, analyse GitHub, PDF, empaquetage)
pip install skill-seekers

# Avec support de toutes les plateformes LLM
pip install skill-seekers[all-llms]

# Avec serveur MCP
pip install skill-seekers[mcp]

# Tout inclus
pip install skill-seekers[all]
```

**Besoin d'aide pour choisir ?** Lancez l'assistant de configuration :
```bash
skill-seekers-setup
```

### Options d'installation

| Installation | Fonctionnalités |
|-------------|-----------------|
| `pip install skill-seekers` | Scraping, analyse GitHub, PDF, toutes les plateformes |
| `pip install skill-seekers[gemini]` | + Support Google Gemini |
| `pip install skill-seekers[openai]` | + Support OpenAI ChatGPT |
| `pip install skill-seekers[all-llms]` | + Toutes les plateformes LLM |
| `pip install skill-seekers[mcp]` | + Serveur MCP pour Claude Code, Cursor, etc. |
| `pip install skill-seekers[video]` | + Extraction de transcriptions et métadonnées YouTube/Vimeo |
| `pip install skill-seekers[video-full]` | + Transcription Whisper et extraction visuelle d'images |
| `pip install skill-seekers[jupyter]` | + Support des notebooks Jupyter |
| `pip install skill-seekers[pptx]` | + Support PowerPoint |
| `pip install skill-seekers[confluence]` | + Support wiki Confluence |
| `pip install skill-seekers[notion]` | + Support des pages Notion |
| `pip install skill-seekers[rss]` | + Support des flux RSS/Atom |
| `pip install skill-seekers[chat]` | + Support des exports chat Slack/Discord |
| `pip install skill-seekers[asciidoc]` | + Support des documents AsciiDoc |
| `pip install skill-seekers[all]` | Tout activé |

> **Dépendances visuelles vidéo (compatibles GPU) :** Après avoir installé `skill-seekers[video-full]`, exécutez
> `skill-seekers video --setup` pour détecter automatiquement votre GPU et installer la bonne variante
> de PyTorch + easyocr. C'est la méthode recommandée pour installer les dépendances d'extraction visuelle.

---

## 🚀 Workflow d'installation en une commande

**Le moyen le plus rapide d'aller de la configuration à la compétence uploadée — automatisation complète :**

```bash
# Installer la compétence React depuis les configurations officielles (upload automatique vers Claude)
skill-seekers install --config react

# Installer depuis un fichier de configuration local
skill-seekers install --config configs/custom.json

# Installer sans uploader (empaquetage uniquement)
skill-seekers install --config django --no-upload

# Prévisualiser le workflow sans l'exécuter
skill-seekers install --config react --dry-run
```

**Durée :** 20–45 minutes au total | **Qualité :** Prêt pour la production (9/10) | **Coût :** Gratuit

**Phases exécutées :**
```
📥 PHASE 1 : Récupération de la configuration (si un nom de config est fourni)
📖 PHASE 2 : Scraping de la documentation
✨ PHASE 3 : Amélioration par IA (OBLIGATOIRE — pas d'option pour passer)
📦 PHASE 4 : Empaquetage de la compétence
☁️  PHASE 5 : Upload vers Claude (optionnel, nécessite une clé API)
```

**Prérequis :**
- Variable d'environnement ANTHROPIC_API_KEY (pour l'upload automatique)
- Abonnement Claude Code Max (pour l'amélioration IA locale)

---

## 📊 Matrice de fonctionnalités

Skill Seekers prend en charge **12 plateformes LLM**, **17 types de sources** et une parité fonctionnelle complète sur toutes les cibles.

**Plateformes :** Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown générique, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
**Types de sources :** Sites de documentation, dépôts GitHub, PDF, Word (.docx), EPUB, Vidéo, Bases de code locales, Notebooks Jupyter, HTML local, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), Flux RSS/Atom, Pages de manuel, Wikis Confluence, Pages Notion, Exports chat Slack/Discord

Consultez la [matrice complète des fonctionnalités](docs/FEATURE_MATRIX.md) pour le support détaillé par plateforme et fonctionnalité.

### Comparaison rapide des plateformes

| Fonctionnalité | Claude | Gemini | OpenAI | Markdown |
|----------------|--------|--------|--------|----------|
| Format | ZIP + YAML | tar.gz | ZIP + Vector | ZIP |
| Upload | ✅ API | ✅ API | ✅ API | ❌ Manuel |
| Amélioration | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ❌ Aucune |
| Tous les modes de compétence | ✅ | ✅ | ✅ | ✅ |

---

## Exemples d'utilisation

### Scraping de documentation

```bash
# Scraper un site de documentation
skill-seekers scrape --config configs/react.json

# Scraping rapide sans configuration
skill-seekers scrape --url https://react.dev --name react

# En mode asynchrone (3x plus rapide)
skill-seekers scrape --config configs/godot.json --async --workers 8
```

### Extraction PDF

```bash
# Extraction PDF basique
skill-seekers pdf --pdf docs/manual.pdf --name myskill

# Fonctionnalités avancées
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
    --extract-tables \        # Extraire les tableaux
    --parallel \              # Traitement parallèle rapide
    --workers 8               # Utiliser 8 cœurs CPU

# PDF scannés (nécessite : pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr
```

### Extraction vidéo

```bash
# Installer le support vidéo
pip install skill-seekers[video]        # Transcriptions + métadonnées
pip install skill-seekers[video-full]   # + Transcription Whisper + extraction visuelle

# Détecter automatiquement le GPU et installer les dépendances visuelles (PyTorch + easyocr)
skill-seekers video --setup

# Extraire depuis une vidéo YouTube
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial

# Extraire depuis une playlist YouTube
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist

# Extraire depuis un fichier vidéo local
skill-seekers video --video-file recording.mp4 --name myrecording

# Extraire avec analyse visuelle des images (nécessite les dépendances video-full)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual

# Avec amélioration IA (nettoyage OCR + génération d'un SKILL.md soigné)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2

# Découper une section spécifique d'une vidéo (supporte les secondes, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00

# Utiliser Vision API pour les images OCR à faible confiance (nécessite ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr

# Reconstruire la compétence depuis des données extraites précédemment (sans téléchargement)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial
```

> **Guide complet :** Consultez [docs/VIDEO_GUIDE.md](docs/VIDEO_GUIDE.md) pour la référence CLI complète,
> les détails du pipeline visuel, les options d'amélioration IA et le dépannage.

### Analyse de dépôts GitHub

```bash
# Scraping basique de dépôt
skill-seekers github --repo facebook/react

# Avec authentification (limites de débit plus élevées)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react

# Personnaliser le contenu inclus
skill-seekers github --repo django/django \
    --include-issues \        # Extraire les issues GitHub
    --max-issues 100 \        # Limiter le nombre d'issues
    --include-changelog       # Extraire CHANGELOG.md
```

### Scraping multi-sources unifié

**Combinez documentation + GitHub + PDF en une compétence unifiée avec détection de conflits :**

```bash
# Utiliser les configurations unifiées existantes
skill-seekers unified --config configs/react_unified.json
skill-seekers unified --config configs/django_unified.json

# Ou créer une configuration unifiée
cat > configs/myframework_unified.json << 'EOF'
{
  "name": "myframework",
  "merge_mode": "rule-based",
  "sources": [
    {
      "type": "documentation",
      "base_url": "https://docs.myframework.com/",
      "max_pages": 200
    },
    {
      "type": "github",
      "repo": "owner/myframework",
      "code_analysis_depth": "surface"
    }
  ]
}
EOF

skill-seekers unified --config configs/myframework_unified.json
```

**La détection de conflits trouve automatiquement :**
- 🔴 **Absent du code** (élevé) : Documenté mais non implémenté
- 🟡 **Absent de la documentation** (moyen) : Implémenté mais non documenté
- ⚠️ **Incompatibilité de signature** : Paramètres/types différents
- ℹ️ **Incompatibilité de description** : Explications différentes

**Guide complet :** Consultez [docs/UNIFIED_SCRAPING.md](docs/UNIFIED_SCRAPING.md) pour la documentation complète.

### Dépôts de configuration privés

**Partagez des configurations personnalisées entre équipes via des dépôts Git privés :**

```bash
# Option 1 : Utilisation des outils MCP (recommandé)
# Enregistrer le dépôt privé de votre équipe
add_config_source(
    name="team",
    git_url="https://github.com/mycompany/skill-configs.git",
    token_env="GITHUB_TOKEN"
)

# Récupérer la configuration depuis le dépôt d'équipe
fetch_config(source="team", config_name="internal-api")
```

**Plateformes supportées :**
- GitHub (`GITHUB_TOKEN`), GitLab (`GITLAB_TOKEN`), Gitea (`GITEA_TOKEN`), Bitbucket (`BITBUCKET_TOKEN`)

**Guide complet :** Consultez [docs/GIT_CONFIG_SOURCES.md](docs/GIT_CONFIG_SOURCES.md) pour la documentation complète.

## Comment ça marche

```mermaid
graph LR
    A[Site de documentation] --> B[Skill Seekers]
    B --> C[Scraper]
    B --> D[Amélioration IA]
    B --> E[Empaqueteur]
    C --> F[Références organisées]
    D --> F
    F --> E
    E --> G[Compétence Claude .zip]
    G --> H[Upload vers Claude AI]
```

0. **Détection de llms.txt** - Vérifie d'abord llms-full.txt, llms.txt, llms-small.txt
1. **Scraping** : Extraction de toutes les pages de la documentation
2. **Catégorisation** : Organisation du contenu par thèmes (API, guides, tutoriels, etc.)
3. **Amélioration** : L'IA analyse la documentation et crée un SKILL.md complet avec des exemples
4. **Empaquetage** : Regroupement de tout dans un fichier `.zip` prêt pour Claude

## 📋 Prérequis

**Avant de commencer, assurez-vous d'avoir :**

1. **Python 3.10 ou supérieur** - [Télécharger](https://www.python.org/downloads/) | Vérifier : `python3 --version`
2. **Git** - [Télécharger](https://git-scm.com/) | Vérifier : `git --version`
3. **15 à 30 minutes** pour la première installation

**Première utilisation ?** → **[Commencez ici : Guide de démarrage rapide infaillible](BULLETPROOF_QUICKSTART.md)** 🎯

---

## 📤 Uploader des compétences vers Claude

Une fois votre compétence empaquetée, vous devez l'uploader vers Claude :

### Option 1 : Upload automatique (via API)

```bash
# Définir votre clé API (une seule fois)
export ANTHROPIC_API_KEY=sk-ant-...

# Empaqueter et uploader automatiquement
skill-seekers package output/react/ --upload

# OU uploader un .zip existant
skill-seekers upload output/react.zip
```

### Option 2 : Upload manuel (sans clé API)

```bash
# Empaqueter la compétence
skill-seekers package output/react/
# → Crée output/react.zip

# Puis uploader manuellement :
# - Rendez-vous sur https://claude.ai/skills
# - Cliquez sur « Upload Skill »
# - Sélectionnez output/react.zip
```

### Option 3 : MCP (Claude Code)

```
Dans Claude Code, demandez simplement :
« Empaqueter et uploader la compétence React »
```

---

## 🤖 Installation dans les agents IA

Skill Seekers peut installer automatiquement des compétences dans 18 agents de codage IA.

```bash
# Installer dans un agent spécifique
skill-seekers install-agent output/react/ --agent cursor

# Installer dans tous les agents à la fois
skill-seekers install-agent output/react/ --agent all

# Prévisualiser sans installer
skill-seekers install-agent output/react/ --agent cursor --dry-run
```

### Agents supportés

| Agent | Chemin | Type |
|-------|--------|------|
| **Claude Code** | `~/.claude/skills/` | Global |
| **Cursor** | `.cursor/skills/` | Projet |
| **VS Code / Copilot** | `.github/skills/` | Projet |
| **Amp** | `~/.amp/skills/` | Global |
| **Goose** | `~/.config/goose/skills/` | Global |
| **OpenCode** | `~/.opencode/skills/` | Global |
| **Windsurf** | `~/.windsurf/skills/` | Global |
| **Roo Code** | `.roo/skills/` | Projet |
| **Cline** | `.cline/skills/` | Projet |
| **Aider** | `~/.aider/skills/` | Global |
| **Bolt** | `.bolt/skills/` | Projet |
| **Kilo Code** | `.kilo/skills/` | Projet |
| **Continue** | `~/.continue/skills/` | Global |
| **Kimi Code** | `~/.kimi/skills/` | Global |

---

## 🔌 Intégration MCP (26 outils)

Skill Seekers inclut un serveur MCP utilisable depuis Claude Code, Cursor, Windsurf, VS Code + Cline ou IntelliJ IDEA.

```bash
# Mode stdio (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp

# Mode HTTP (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765

# Configuration automatique de tous les agents en une fois
./setup_mcp.sh
```

**Les 26 outils disponibles :**
- **Noyau (9) :** `list_configs`, `generate_config`, `validate_config`, `estimate_pages`, `scrape_docs`, `package_skill`, `upload_skill`, `enhance_skill`, `install_skill`
- **Étendu (10) :** `scrape_github`, `scrape_pdf`, `unified_scrape`, `merge_sources`, `detect_conflicts`, `add_config_source`, `fetch_config`, `list_config_sources`, `remove_config_source`, `split_config`
- **Bases vectorielles (4) :** `export_to_chroma`, `export_to_weaviate`, `export_to_faiss`, `export_to_qdrant`
- **Cloud (3) :** `cloud_upload`, `cloud_download`, `cloud_list`

**Guide complet :** [docs/MCP_SETUP.md](docs/MCP_SETUP.md)

---

## ⚙️ Configuration

### Préréglages disponibles (24+)

```bash
# Lister tous les préréglages
skill-seekers list-configs
```

| Catégorie | Préréglages |
|-----------|-------------|
| **Frameworks Web** | `react`, `vue`, `angular`, `svelte`, `nextjs` |
| **Python** | `django`, `flask`, `fastapi`, `sqlalchemy`, `pytest` |
| **Développement de jeux** | `godot`, `pygame`, `unity` |
| **Outils et DevOps** | `docker`, `kubernetes`, `terraform`, `ansible` |
| **Unifié (Docs + GitHub)** | `react-unified`, `vue-unified`, `nextjs-unified`, et plus |

### Créer votre propre configuration

```bash
# Option 1 : Interactif
skill-seekers scrape --interactive

# Option 2 : Copier et modifier un préréglage
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json
```

### Structure du fichier de configuration

```json
{
  "name": "myframework",
  "description": "Quand utiliser cette compétence",
  "base_url": "https://docs.myframework.com/",
  "selectors": {
    "main_content": "article",
    "title": "h1",
    "code_blocks": "pre code"
  },
  "url_patterns": {
    "include": ["/docs", "/guide"],
    "exclude": ["/blog", "/about"]
  },
  "categories": {
    "getting_started": ["intro", "quickstart"],
    "api": ["api", "reference"]
  },
  "rate_limit": 0.5,
  "max_pages": 500
}
```

### Où stocker les configurations

L'outil cherche dans cet ordre :
1. Chemin exact tel que fourni
2. `./configs/` (répertoire courant)
3. `~/.config/skill-seekers/configs/` (répertoire de configuration utilisateur)
4. API SkillSeekersWeb.com (configurations prédéfinies)

---

## 📊 Ce qui est généré

```
output/
├── godot_data/              # Données brutes scrapées
│   ├── pages/              # Fichiers JSON (un par page)
│   └── summary.json        # Vue d'ensemble
│
└── godot/                   # La compétence
    ├── SKILL.md            # Amélioré avec de vrais exemples
    ├── references/         # Documentation catégorisée
    │   ├── index.md
    │   ├── getting_started.md
    │   ├── scripting.md
    │   └── ...
    ├── scripts/            # Vide (ajoutez les vôtres)
    └── assets/             # Vide (ajoutez les vôtres)
```

---

## 🐛 Dépannage

### Aucun contenu extrait ?
- Vérifiez votre sélecteur `main_content`
- Essayez : `article`, `main`, `div[role="main"]`

### Les données existent mais ne sont pas utilisées ?
```bash
# Forcer un nouveau scraping
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json
```

### Catégorisation insatisfaisante ?
Modifiez la section `categories` de la configuration avec de meilleurs mots-clés.

### Vous voulez mettre à jour la documentation ?
```bash
# Supprimer les anciennes données et re-scraper
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json
```

### L'amélioration ne fonctionne pas ?
```bash
# Vérifier si la clé API est définie
echo $ANTHROPIC_API_KEY

# Essayer le mode LOCAL à la place (utilise Claude Code Max, pas besoin de clé API)
skill-seekers enhance output/react/ --mode LOCAL

# Surveiller l'état de l'amélioration en arrière-plan
skill-seekers enhance-status output/react/ --watch
```

### Problèmes de limite de débit GitHub ?
```bash
# Définir un token GitHub (5000 req/heure vs 60/heure en anonyme)
export GITHUB_TOKEN=ghp_your_token_here

# Ou configurer plusieurs profils
skill-seekers config --github
```

---

## 📈 Performance

| Tâche | Durée | Notes |
|-------|-------|-------|
| Scraping (synchrone) | 15–45 min | Première fois uniquement, basé sur les threads |
| Scraping (asynchrone) | 5–15 min | 2–3x plus rapide avec le flag `--async` |
| Construction | 1–3 min | Reconstruction rapide depuis le cache |
| Reconstruction | <1 min | Avec `--skip-scrape` |
| Amélioration (LOCAL) | 30–60 sec | Utilise Claude Code Max |
| Amélioration (API) | 20–40 sec | Nécessite une clé API |
| Vidéo (transcription) | 1–3 min | YouTube/local, transcription uniquement |
| Vidéo (visuel) | 5–15 min | + Extraction OCR d'images |
| Empaquetage | 5–10 sec | Création finale du .zip |

---

## 📚 Documentation

### Premiers pas
- **[BULLETPROOF_QUICKSTART.md](BULLETPROOF_QUICKSTART.md)** - 🎯 **COMMENCEZ ICI** si vous êtes nouveau !
- **[QUICKSTART.md](QUICKSTART.md)** - Démarrage rapide pour utilisateurs expérimentés
- **[TROUBLESHOOTING.md](TROUBLESHOOTING.md)** - Problèmes courants et solutions
- **[docs/QUICK_REFERENCE.md](docs/QUICK_REFERENCE.md)** - Aide-mémoire sur une page

### Guides
- **[docs/LARGE_DOCUMENTATION.md](docs/LARGE_DOCUMENTATION.md)** - Gérer les documentations de 10K–40K+ pages
- **[ASYNC_SUPPORT.md](ASYNC_SUPPORT.md)** - Guide du mode asynchrone (scraping 2–3x plus rapide)
- **[docs/ENHANCEMENT_MODES.md](docs/ENHANCEMENT_MODES.md)** - Guide des modes d'amélioration IA
- **[docs/MCP_SETUP.md](docs/MCP_SETUP.md)** - Configuration de l'intégration MCP
- **[docs/UNIFIED_SCRAPING.md](docs/UNIFIED_SCRAPING.md)** - Scraping multi-sources
- **[docs/VIDEO_GUIDE.md](docs/VIDEO_GUIDE.md)** - Guide d'extraction vidéo

### Guides d'intégration
- **[docs/integrations/LANGCHAIN.md](docs/integrations/LANGCHAIN.md)** - RAG LangChain
- **[docs/integrations/CURSOR.md](docs/integrations/CURSOR.md)** - IDE Cursor
- **[docs/integrations/WINDSURF.md](docs/integrations/WINDSURF.md)** - IDE Windsurf
- **[docs/integrations/CLINE.md](docs/integrations/CLINE.md)** - Cline (VS Code)
- **[docs/integrations/RAG_PIPELINES.md](docs/integrations/RAG_PIPELINES.md)** - Tous les pipelines RAG

---

## 📝 Licence

Licence MIT - voir le fichier [LICENSE](LICENSE) pour plus de détails

---

Bonne création de compétences ! 🚀

---

## 🔒 Sécurité

[![Badge d'évaluation de sécurité MseeP.ai](https://mseep.net/pr/yusufkaraaslan-skill-seekers-badge.png)](https://mseep.ai/app/yusufkaraaslan-skill-seekers)