# Skill Seekers
[English](README.md) | [简体中文](README.zh-CN.md) | [日本語](README.ja.md) | [한국어](README.ko.md) | Español | [Français](README.fr.md) | [Deutsch](README.de.md) | [Português](README.pt-BR.md) | [Türkçe](README.tr.md) | [العربية](README.ar.md) | [हिन्दी](README.hi.md) | [Русский](README.ru.md)
> ⚠️ **Aviso de traducción automática**
>
> Este documento ha sido traducido automáticamente por IA. Aunque nos esforzamos por garantizar la calidad, pueden existir expresiones inexactas.
>
> ¡Ayúdanos a mejorar la traducción a través de [GitHub Issue #260](https://github.com/yusufkaraaslan/Skill_Seekers/issues/260)! Tu retroalimentación es muy valiosa para nosotros.
[](https://github.com/yusufkaraaslan/Skill_Seekers/releases)
[](https://opensource.org/licenses/MIT)
[](https://www.python.org/downloads/)
[](https://modelcontextprotocol.io)
[](tests/)
[](https://github.com/users/yusufkaraaslan/projects/2)
[](https://pypi.org/project/skill-seekers/)
[](https://pypi.org/project/skill-seekers/)
[](https://pypi.org/project/skill-seekers/)
[](https://skillseekersweb.com/)
[](https://x.com/_yUSyUS_)
[](https://github.com/yusufkaraaslan/Skill_Seekers)
**🧠 La capa de datos para sistemas de IA.** Skill Seekers convierte sitios de documentación, repositorios de GitHub, PDFs, videos, notebooks, wikis y más de 10 tipos de fuentes adicionales en activos de conocimiento estructurado, listos para potenciar AI Skills (Claude, Gemini, OpenAI), pipelines RAG (LangChain, LlamaIndex, Pinecone) y asistentes de programación con IA (Cursor, Windsurf, Cline) en minutos, no en horas.
> 🌐 **[Visita SkillSeekersWeb.com](https://skillseekersweb.com/)** - ¡Explora más de 24 configuraciones predefinidas, comparte tus configuraciones y accede a la documentación completa!
> 📋 **[Ver hoja de ruta y tareas de desarrollo](https://github.com/users/yusufkaraaslan/projects/2)** - ¡134 tareas en 10 categorías, elige cualquiera para contribuir!
## 🌐 Ecosistema
Skill Seekers es un proyecto multi-repositorio. Aquí es donde vive todo:
| Repositorio | Descripción | Enlaces |
|------------|-------------|---------|
| **[Skill_Seekers](https://github.com/yusufkaraaslan/Skill_Seekers)** | CLI principal y servidor MCP (este repo) | [PyPI](https://pypi.org/project/skill-seekers/) |
| **[skillseekersweb](https://github.com/yusufkaraaslan/skillseekersweb)** | Sitio web y documentación | [Web](https://skillseekersweb.com/) |
| **[skill-seekers-configs](https://github.com/yusufkaraaslan/skill-seekers-configs)** | Repositorio de configuraciones comunitarias | |
| **[skill-seekers-action](https://github.com/yusufkaraaslan/skill-seekers-action)** | GitHub Action para CI/CD | |
| **[skill-seekers-plugin](https://github.com/yusufkaraaslan/skill-seekers-plugin)** | Plugin para Claude Code | |
| **[homebrew-skill-seekers](https://github.com/yusufkaraaslan/homebrew-skill-seekers)** | Homebrew tap para macOS | |
> **¿Quieres contribuir?** ¡Los repos del sitio web y configuraciones son excelentes puntos de partida para nuevos colaboradores!
## 🧠 La capa de datos para sistemas de IA
**Skill Seekers es la capa universal de preprocesamiento** que se ubica entre la documentación sin procesar y cada sistema de IA que la consume. Ya sea que estés construyendo Claude Skills, un pipeline RAG con LangChain o un archivo `.cursorrules` para Cursor, la preparación de datos es idéntica. Lo haces una vez y exportas a todos los destinos.
```bash
# Un comando → activo de conocimiento estructurado
skill-seekers create https://docs.react.dev/
# o: skill-seekers create facebook/react
# o: skill-seekers create ./my-project
# Exportar a cualquier sistema de IA
skill-seekers package output/react --target claude # → Claude AI Skill (ZIP)
skill-seekers package output/react --target langchain # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor # → .cursorrules
```
### Lo que se genera
| Salida | Destino | Para qué sirve |
|--------|---------|-----------------|
| **Claude Skill** (ZIP + YAML) | `--target claude` | Claude Code, Claude API |
| **Gemini Skill** (tar.gz) | `--target gemini` | Google Gemini |
| **OpenAI / Custom GPT** (ZIP) | `--target openai` | GPT-4o, asistentes personalizados |
| **LangChain Documents** | `--target langchain` | Cadenas QA, agentes, recuperadores |
| **LlamaIndex TextNodes** | `--target llama-index` | Motores de consulta, motores de chat |
| **Haystack Documents** | `--target haystack` | Pipelines RAG empresariales |
| **Pinecone-ready** (Markdown) | `--target markdown` | Carga de vectores |
| **ChromaDB / FAISS / Qdrant** | `--format chroma/faiss/qdrant` | Bases de datos vectoriales locales |
| **Cursor** `.cursorrules` | `--target claude` → copiar | Contexto IA del IDE Cursor |
| **Windsurf / Cline / Continue** | `--target claude` → copiar | VS Code, IntelliJ, Vim |
### Por qué es importante
- ⚡ **99% más rápido** — Días de preparación manual → 15–45 minutos
- 🎯 **Calidad de AI Skill** — Archivos SKILL.md de más de 500 líneas con ejemplos, patrones y guías
- 📊 **Fragmentos listos para RAG** — Fragmentación inteligente que preserva bloques de código y mantiene el contexto
- 🎬 **Videos** — Extrae código, transcripciones y conocimiento estructurado de YouTube y videos locales
- 🔄 **Multi-fuente** — Combina 17 tipos de fuentes (docs, GitHub, PDFs, videos, notebooks, wikis y más) en un solo activo de conocimiento
- 🌐 **Una preparación, todos los destinos** — Exporta el mismo activo a 16 plataformas sin volver a extraer
- ✅ **Probado en producción** — Más de 2.540 tests, más de 24 presets de frameworks, listo para producción
## 🚀 Inicio rápido (3 comandos)
```bash
# 1. Instalar
pip install skill-seekers
# 2. Crear skill desde cualquier fuente
skill-seekers create https://docs.django.com/
# 3. Empaquetar para tu plataforma de IA
skill-seekers package output/django --target claude
```
**¡Eso es todo!** Ahora tienes `output/django-claude.zip` listo para usar.
### Otras fuentes (17 soportadas)
```bash
# Repositorio de GitHub
skill-seekers create facebook/react
# Proyecto local
skill-seekers create ./my-project
# Documento PDF
skill-seekers create manual.pdf
# Documento Word
skill-seekers create report.docx
# Libro electrónico EPUB
skill-seekers create book.epub
# Jupyter Notebook
skill-seekers create notebook.ipynb
# Especificación OpenAPI
skill-seekers create openapi.yaml
# Presentación PowerPoint
skill-seekers create presentation.pptx
# Documento AsciiDoc
skill-seekers create guide.adoc
# Archivo HTML local
skill-seekers create page.html
# Feed RSS/Atom
skill-seekers create feed.rss
# Página de manual
skill-seekers create curl.1
# Video (YouTube, Vimeo o archivo local — requiere skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# ¿Primera vez? Instala automáticamente las dependencias visuales con detección de GPU:
skill-seekers video --setup
# Wiki de Confluence
skill-seekers confluence --space TEAM --name wiki
# Páginas de Notion
skill-seekers notion --database-id ... --name docs
# Exportación de chat de Slack/Discord
skill-seekers chat --export-dir ./slack-export --name team-chat
```
### Exportar a todas partes
```bash
# Empaquetar para múltiples plataformas
for platform in claude gemini openai langchain; do
skill-seekers package output/django --target $platform
done
```
## ¿Qué es Skill Seekers?
Skill Seekers es la **capa de datos para sistemas de IA**. Transforma 17 tipos de fuentes —sitios web de documentación, repositorios de GitHub, PDFs, videos, Jupyter Notebooks, documentos Word/EPUB/AsciiDoc, especificaciones OpenAPI, presentaciones PowerPoint, feeds RSS, páginas de manual, wikis de Confluence, páginas de Notion, exportaciones de Slack/Discord y más— en activos de conocimiento estructurado para cualquier destino de IA:
| Caso de uso | Lo que obtienes | Ejemplos |
|-------------|-----------------|----------|
| **AI Skills** | SKILL.md completo + referencias | Claude Code, Gemini, GPT |
| **Pipelines RAG** | Documentos fragmentados con metadatos enriquecidos | LangChain, LlamaIndex, Haystack |
| **Bases de datos vectoriales** | Datos pre-formateados listos para carga | Pinecone, Chroma, Weaviate, FAISS |
| **Asistentes de programación con IA** | Archivos de contexto que tu IDE IA lee automáticamente | Cursor, Windsurf, Cline, Continue.dev |
En lugar de pasar días en preprocesamiento manual, Skill Seekers:
1. **Ingesta** — documentación, repositorios de GitHub, bases de código locales, PDFs, videos, notebooks, wikis y más de 10 tipos de fuentes adicionales
2. **Analiza** — análisis profundo AST, detección de patrones, extracción de APIs
3. **Estructura** — archivos de referencia categorizados con metadatos
4. **Mejora** — generación de SKILL.md potenciada por IA (Claude, Gemini o local)
5. **Exporta** — 16 formatos específicos por plataforma desde un solo activo
## ¿Por qué usar Skill Seekers?
### Para constructores de AI Skills (Claude, Gemini, OpenAI)
- 🎯 **Skills de nivel producción** — Archivos SKILL.md de más de 500 líneas con ejemplos de código, patrones y guías
- 🔄 **Flujos de mejora** — Aplica presets como `security-focus`, `architecture-comprehensive` o YAML personalizados
- 🎮 **Cualquier dominio** — Motores de juegos (Godot, Unity), frameworks (React, Django), herramientas internas
- 🔧 **Equipos** — Combina documentación interna + código en una única fuente de verdad
- 📚 **Calidad** — Mejorado con IA, incluye ejemplos, referencia rápida y guía de navegación
### Para constructores de RAG e ingenieros de IA
- 🤖 **Datos listos para RAG** — `Documents` de LangChain, `TextNodes` de LlamaIndex y `Documents` de Haystack pre-fragmentados
- 🚀 **99% más rápido** — Días de preprocesamiento → 15–45 minutos
- 📊 **Metadatos inteligentes** — Categorías, fuentes, tipos → mayor precisión en la recuperación
- 🔄 **Multi-fuente** — Combina docs + GitHub + PDFs + videos en un solo pipeline
- 🌐 **Agnóstico de plataforma** — Exporta a cualquier base de datos vectorial o framework sin volver a extraer
### Para usuarios de asistentes de programación con IA
- 💻 **Cursor / Windsurf / Cline** — Genera `.cursorrules` / `.windsurfrules` / `.clinerules` automáticamente
- 🎯 **Contexto persistente** — La IA "conoce" tus frameworks sin necesidad de repetir prompts
- 📚 **Siempre actualizado** — Actualiza el contexto en minutos cuando cambia la documentación
## Funcionalidades clave
### 🌐 Extracción de documentación
- ✅ **Soporte para llms.txt** - Detecta y usa automáticamente archivos de documentación optimizados para LLM (10 veces más rápido)
- ✅ **Scraper universal** - Funciona con CUALQUIER sitio web de documentación
- ✅ **Categorización inteligente** - Organiza automáticamente el contenido por tema
- ✅ **Detección de lenguajes de código** - Reconoce Python, JavaScript, C++, GDScript, etc.
- ✅ **Más de 24 presets listos para usar** - Godot, React, Vue, Django, FastAPI y más
### 📄 Soporte para PDF
- ✅ **Extracción básica de PDF** - Extrae texto, código e imágenes de archivos PDF
- ✅ **OCR para PDFs escaneados** - Extrae texto de documentos escaneados
- ✅ **PDFs protegidos con contraseña** - Maneja PDFs cifrados
- ✅ **Extracción de tablas** - Extrae tablas complejas de PDFs
- ✅ **Procesamiento en paralelo** - 3 veces más rápido para PDFs grandes
- ✅ **Caché inteligente** - 50% más rápido en ejecuciones posteriores
### 🎬 Extracción de video
- ✅ **YouTube y videos locales** - Extrae transcripciones, código en pantalla y conocimiento estructurado de videos
- ✅ **Análisis visual de fotogramas** - Extracción OCR de editores de código, terminales, diapositivas y diagramas
- ✅ **Detección automática de GPU** - Instala automáticamente la compilación correcta de PyTorch (CUDA/ROCm/MPS/CPU)
- ✅ **Mejora con IA** - Dos pasadas: limpieza de artefactos OCR + generación de SKILL.md pulido
- ✅ **Recorte temporal** - Extrae secciones específicas con `--start-time` y `--end-time`
- ✅ **Soporte para listas de reproducción** - Procesa por lotes todos los videos de una lista de reproducción de YouTube
- ✅ **Respaldo con Vision API** - Usa Claude Vision para fotogramas OCR de baja confianza
### 🐙 Análisis de repositorios de GitHub
- ✅ **Análisis profundo de código** - Análisis AST para Python, JavaScript, TypeScript, Java, C++, Go
- ✅ **Extracción de APIs** - Funciones, clases, métodos con parámetros y tipos
- ✅ **Metadatos del repositorio** - README, árbol de archivos, desglose de lenguajes, estrellas/forks
- ✅ **GitHub Issues y PRs** - Obtiene issues abiertos/cerrados con etiquetas e hitos
- ✅ **CHANGELOG y releases** - Extrae automáticamente el historial de versiones
- ✅ **Detección de conflictos** - Compara APIs documentadas vs. implementación real del código
- ✅ **Integración MCP** - Lenguaje natural: "Extrae el repositorio de GitHub facebook/react"
### 🔄 Extracción unificada multi-fuente
- ✅ **Combina múltiples fuentes** - Mezcla documentación + GitHub + PDF en un solo skill
- ✅ **Detección de conflictos** - Encuentra automáticamente discrepancias entre docs y código
- ✅ **Fusión inteligente** - Resolución de conflictos basada en reglas o potenciada por IA
- ✅ **Informes transparentes** - Comparación lado a lado con advertencias ⚠️
- ✅ **Análisis de brechas en documentación** - Identifica docs obsoletos y funcionalidades no documentadas
- ✅ **Fuente única de verdad** - Un solo skill que muestra tanto la intención (docs) como la realidad (código)
- ✅ **Compatible con versiones anteriores** - Las configuraciones de fuente única legacy siguen funcionando
### 🤖 Soporte para múltiples plataformas LLM
- ✅ **12 plataformas LLM** - Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown genérico, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
- ✅ **Extracción universal** - La misma documentación funciona para todas las plataformas
- ✅ **Empaquetado específico por plataforma** - Formatos optimizados para cada LLM
- ✅ **Exportación con un solo comando** - El flag `--target` selecciona la plataforma
- ✅ **Dependencias opcionales** - Instala solo lo que necesitas
- ✅ **100% compatible con versiones anteriores** - Los flujos de trabajo existentes de Claude no cambian
| Plataforma | Formato | Carga | Mejora | API Key | Endpoint personalizado |
|------------|---------|-------|--------|---------|------------------------|
| **Claude AI** | ZIP + YAML | ✅ Automática | ✅ Sí | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
| **Google Gemini** | tar.gz | ✅ Automática | ✅ Sí | GOOGLE_API_KEY | - |
| **OpenAI ChatGPT** | ZIP + Vector Store | ✅ Automática | ✅ Sí | OPENAI_API_KEY | - |
| **Markdown genérico** | ZIP | ❌ Manual | ❌ No | - | - |
```bash
# Claude (predeterminado - ¡sin cambios necesarios!)
skill-seekers package output/react/
skill-seekers upload react.zip
# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini
# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai
# Markdown genérico (exportación universal)
skill-seekers package output/react/ --target markdown
# Usa los archivos markdown directamente en cualquier LLM
```
🔧 Variables de entorno para APIs compatibles con Claude (ej. GLM-4.7)
Skill Seekers soporta cualquier endpoint de API compatible con Claude:
```bash
# Opción 1: API oficial de Anthropic (predeterminado)
export ANTHROPIC_API_KEY=sk-ant-...
# Opción 2: API compatible con Claude de GLM-4.7
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1
# Todas las funciones de mejora con IA usarán el endpoint configurado
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance
```
**Nota**: Configurar `ANTHROPIC_BASE_URL` permite usar cualquier endpoint de API compatible con Claude, como GLM-4.7 (智谱 AI) u otros servicios compatibles.
**Instalación:**
```bash
# Instalar con soporte para Gemini
pip install skill-seekers[gemini]
# Instalar con soporte para OpenAI
pip install skill-seekers[openai]
# Instalar con todas las plataformas LLM
pip install skill-seekers[all-llms]
```
### 🔗 Integraciones con frameworks RAG
- ✅ **LangChain Documents** - Exportación directa al formato `Document` con `page_content` + metadatos
- Ideal para: cadenas QA, recuperadores, almacenes de vectores, agentes
- Ejemplo: [Pipeline RAG con LangChain](examples/langchain-rag-pipeline/)
- Guía: [Integración con LangChain](docs/integrations/LANGCHAIN.md)
- ✅ **LlamaIndex TextNodes** - Exportación al formato `TextNode` con IDs únicos + embeddings
- Ideal para: motores de consulta, motores de chat, contexto de almacenamiento
- Ejemplo: [Motor de consulta LlamaIndex](examples/llama-index-query-engine/)
- Guía: [Integración con LlamaIndex](docs/integrations/LLAMA_INDEX.md)
- ✅ **Formato listo para Pinecone** - Optimizado para carga en bases de datos vectoriales
- Ideal para: búsqueda vectorial en producción, búsqueda semántica, búsqueda híbrida
- Ejemplo: [Carga en Pinecone](examples/pinecone-upsert/)
- Guía: [Integración con Pinecone](docs/integrations/PINECONE.md)
**Exportación rápida:**
```bash
# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json
# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json
# Markdown (universal)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/
```
**Guía completa de pipelines RAG:** [Documentación de pipelines RAG](docs/integrations/RAG_PIPELINES.md)
---
### 🧠 Integraciones con asistentes de programación con IA
Transforma cualquier documentación de framework en contexto experto de programación para más de 4 asistentes de IA:
- ✅ **Cursor IDE** - Genera `.cursorrules` para sugerencias de código potenciadas por IA
- Ideal para: generación de código específica por framework, patrones consistentes
- Funciona con: Cursor IDE (fork de VS Code)
- Guía: [Integración con Cursor](docs/integrations/CURSOR.md)
- Ejemplo: [Skill de React para Cursor](examples/cursor-react-skill/)
- ✅ **Windsurf** - Personaliza el contexto del asistente IA de Windsurf con `.windsurfrules`
- Ideal para: asistencia IA nativa del IDE, programación basada en flujos
- Funciona con: Windsurf IDE de Codeium
- Guía: [Integración con Windsurf](docs/integrations/WINDSURF.md)
- Ejemplo: [Contexto FastAPI para Windsurf](examples/windsurf-fastapi-context/)
- ✅ **Cline (VS Code)** - Prompts de sistema + MCP para el agente de VS Code
- Ideal para: generación de código agéntica en VS Code
- Funciona con: extensión Cline para VS Code
- Guía: [Integración con Cline](docs/integrations/CLINE.md)
- Ejemplo: [Asistente Django para Cline](examples/cline-django-assistant/)
- ✅ **Continue.dev** - Servidores de contexto para IA independiente del IDE
- Ideal para: entornos multi-IDE (VS Code, JetBrains, Vim), proveedores LLM personalizados
- Funciona con: cualquier IDE con el plugin Continue.dev
- Guía: [Integración con Continue](docs/integrations/CONTINUE_DEV.md)
- Ejemplo: [Contexto universal de Continue](examples/continue-dev-universal/)
**Exportación rápida para herramientas de programación con IA:**
```bash
# Para cualquier asistente de programación con IA (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude # o --target markdown
# Copiar a tu proyecto (ejemplo para Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules
# O para Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md
# O para Cline
cp output/django-claude/SKILL.md my-project/.clinerules
# O para Continue.dev (servidor HTTP)
python examples/continue-dev-universal/context_server.py
# Configurar en ~/.continue/config.json
```
**Centro de integraciones:** [Todas las integraciones con sistemas de IA](docs/integrations/INTEGRATIONS.md)
---
### 🌊 Arquitectura de tres flujos para GitHub
- ✅ **Análisis de triple flujo** - Divide los repos de GitHub en flujos de Código, Documentación e Insights
- ✅ **Analizador de código unificado** - Funciona con URLs de GitHub Y rutas locales
- ✅ **C3.x como profundidad de análisis** - Elige entre 'basic' (1–2 min) o 'c3x' (20–60 min)
- ✅ **Generación mejorada del router** - Metadatos de GitHub, inicio rápido del README, problemas comunes
- ✅ **Integración de issues** - Problemas principales y soluciones desde GitHub Issues
- ✅ **Palabras clave de enrutamiento inteligente** - Etiquetas de GitHub con peso 2x para mejor detección de temas
**Los tres flujos explicados:**
- **Flujo 1: Código** - Análisis profundo C3.x (patrones, ejemplos, guías, configuraciones, arquitectura)
- **Flujo 2: Documentación** - Documentación del repositorio (README, CONTRIBUTING, docs/*.md)
- **Flujo 3: Insights** - Conocimiento de la comunidad (issues, etiquetas, estrellas, forks)
```python
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer
# Analizar repositorio de GitHub con los tres flujos
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
source="https://github.com/facebook/react",
depth="c3x", # o "basic" para análisis rápido
fetch_github_metadata=True
)
# Acceder al flujo de código (análisis C3.x)
print(f"Patrones de diseño: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Ejemplos de tests: {result.code_analysis['c3_2_examples_count']}")
# Acceder al flujo de documentación (docs del repositorio)
print(f"README: {result.github_docs['readme'][:100]}")
# Acceder al flujo de insights (metadatos de GitHub)
print(f"Estrellas: {result.github_insights['metadata']['stars']}")
print(f"Problemas comunes: {len(result.github_insights['common_problems'])}")
```
**Documentación completa**: [Resumen de implementación de tres flujos](docs/IMPLEMENTATION_SUMMARY_THREE_STREAM.md)
### 🔐 Gestión inteligente de límites de tasa y configuración
- ✅ **Sistema de configuración multi-token** - Gestiona múltiples cuentas de GitHub (personal, trabajo, OSS)
- Almacenamiento seguro de configuración en `~/.config/skill-seekers/config.json` (permisos 600)
- Estrategias de límite de tasa por perfil: `prompt`, `wait`, `switch`, `fail`
- Timeout configurable por perfil (predeterminado: 30 min, evita esperas indefinidas)
- Cadena inteligente de respaldo: argumento CLI → variable de entorno → archivo de configuración → prompt
- Gestión de API keys para Claude, Gemini, OpenAI
- ✅ **Asistente de configuración interactivo** - Interfaz de terminal atractiva para fácil configuración
- Integración con navegador para creación de tokens (abre automáticamente GitHub, etc.)
- Validación de tokens y pruebas de conexión
- Visualización de estado con códigos de color
- ✅ **Manejador inteligente de límites de tasa** - ¡No más esperas indefinidas!
- Advertencia anticipada sobre límites de tasa (60/hora vs 5000/hora)
- Detección en tiempo real desde las respuestas de la API de GitHub
- Temporizadores de cuenta regresiva en vivo con progreso
- Cambio automático de perfil cuando se alcanza el límite
- Cuatro estrategias: prompt (preguntar), wait (cuenta regresiva), switch (cambiar a otro), fail (abortar)
- ✅ **Capacidad de reanudación** - Continúa trabajos interrumpidos
- Auto-guardado de progreso en intervalos configurables (predeterminado: 60 seg)
- Lista todos los trabajos reanudables con detalles de progreso
- Limpieza automática de trabajos antiguos (predeterminado: 7 días)
- ✅ **Soporte CI/CD** - Modo no interactivo para automatización
- Flag `--non-interactive` que falla rápidamente sin prompts
- Flag `--profile` para seleccionar una cuenta de GitHub específica
- Mensajes de error claros para logs de pipelines
**Configuración rápida:**
```bash
# Configuración única (5 minutos)
skill-seekers config --github
# Usar perfil específico para repos privados
skill-seekers github --repo mycompany/private-repo --profile work
# Modo CI/CD (fallo rápido, sin prompts)
skill-seekers github --repo owner/repo --non-interactive
# Reanudar trabajo interrumpido
skill-seekers resume --list
skill-seekers resume github_react_20260117_143022
```
**Estrategias de límite de tasa explicadas:**
- **prompt** (predeterminado) - Pregunta qué hacer cuando se alcanza el límite (esperar, cambiar, configurar token, cancelar)
- **wait** - Espera automáticamente con temporizador de cuenta regresiva (respeta el timeout)
- **switch** - Intenta automáticamente el siguiente perfil disponible (para configuraciones multi-cuenta)
- **fail** - Falla inmediatamente con error claro (perfecto para CI/CD)
### 🎯 Skill Bootstrap - Auto-alojamiento
Genera skill-seekers como un Claude Code Skill para usarlo dentro de Claude:
```bash
# Generar el skill
./scripts/bootstrap_skill.sh
# Instalar en Claude Code
cp -r output/skill-seekers ~/.claude/skills/
```
**Lo que obtienes:**
- ✅ **Documentación completa del skill** - Todos los comandos CLI y patrones de uso
- ✅ **Referencia de comandos CLI** - Cada herramienta y sus opciones documentadas
- ✅ **Ejemplos de inicio rápido** - Flujos de trabajo comunes y mejores prácticas
- ✅ **Documentación de API auto-generada** - Análisis de código, patrones y ejemplos
### 🔐 Repositorios de configuración privados
- ✅ **Fuentes de configuración basadas en Git** - Obtén configuraciones desde repositorios git privados/de equipo
- ✅ **Gestión multi-fuente** - Registra repositorios ilimitados de GitHub, GitLab, Bitbucket
- ✅ **Colaboración en equipo** - Comparte configuraciones personalizadas entre equipos de 3–5 personas
- ✅ **Soporte empresarial** - Escala a más de 500 desarrolladores con resolución basada en prioridad
- ✅ **Autenticación segura** - Tokens como variables de entorno (GITHUB_TOKEN, GITLAB_TOKEN)
- ✅ **Caché inteligente** - Clona una vez, obtiene actualizaciones automáticamente
- ✅ **Modo offline** - Trabaja con configuraciones en caché cuando no hay conexión
### 🤖 Análisis de código (C3.x)
**C3.4: Extracción de patrones de configuración con mejora por IA**
- ✅ **9 formatos de configuración** - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
- ✅ **7 tipos de patrones** - Configuraciones de base de datos, API, logging, caché, correo, autenticación, servidor
- ✅ **Mejora con IA** - Análisis IA opcional en modo dual (API + LOCAL)
- Explica qué hace cada configuración
- Sugiere mejores prácticas y mejoras
- **Análisis de seguridad** - Encuentra secretos codificados y credenciales expuestas
- ✅ **Auto-documentación** - Genera documentación JSON + Markdown de todas las configuraciones
- ✅ **Integración MCP** - Herramienta `extract_config_patterns` con soporte de mejora
**C3.3: Guías prácticas mejoradas con IA**
- ✅ **Mejora integral con IA** - Transforma guías básicas en tutoriales profesionales
- ✅ **5 mejoras automáticas** - Descripciones de pasos, solución de problemas, prerrequisitos, siguientes pasos, casos de uso
- ✅ **Soporte de modo dual** - Modo API (Claude API) o modo LOCAL (Claude Code CLI)
- ✅ **Sin costos con modo LOCAL** - Mejora GRATUITA usando tu plan Claude Code Max
- ✅ **Transformación de calidad** - Plantillas de 75 líneas → guías completas de más de 500 líneas
**Uso:**
```bash
# Análisis rápido (1–2 min, solo funciones básicas)
skill-seekers analyze --directory tests/ --quick
# Análisis completo con IA (20–60 min, todas las funciones)
skill-seekers analyze --directory tests/ --comprehensive
# Con mejora por IA
skill-seekers analyze --directory tests/ --enhance
```
**Documentación completa:** [docs/HOW_TO_GUIDES.md](docs/HOW_TO_GUIDES.md#ai-enhancement-new)
### 🔄 Presets de flujo de trabajo de mejora
Pipelines de mejora reutilizables definidos en YAML que controlan cómo la IA transforma tu documentación sin procesar en un skill pulido.
- ✅ **5 presets incluidos** — `default`, `minimal`, `security-focus`, `architecture-comprehensive`, `api-documentation`
- ✅ **Presets definidos por el usuario** — añade flujos personalizados a `~/.config/skill-seekers/workflows/`
- ✅ **Múltiples flujos de trabajo** — encadena dos o más flujos en un solo comando
- ✅ **CLI completamente gestionado** — lista, inspecciona, copia, añade, elimina y valida flujos de trabajo
```bash
# Aplicar un solo flujo de trabajo
skill-seekers create ./my-project --enhance-workflow security-focus
# Encadenar múltiples flujos de trabajo (se aplican en orden)
skill-seekers create ./my-project \
--enhance-workflow security-focus \
--enhance-workflow minimal
# Gestionar presets
skill-seekers workflows list # Listar todos (incluidos + usuario)
skill-seekers workflows show security-focus # Mostrar contenido YAML
skill-seekers workflows copy security-focus # Copiar al directorio de usuario para editar
skill-seekers workflows add ./my-workflow.yaml # Instalar un preset personalizado
skill-seekers workflows remove my-workflow # Eliminar un preset de usuario
skill-seekers workflows validate security-focus # Validar estructura del preset
# Copiar varios a la vez
skill-seekers workflows copy security-focus minimal api-documentation
# Añadir varios archivos a la vez
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml
# Eliminar varios a la vez
skill-seekers workflows remove my-wf-a my-wf-b
```
**Formato de preset YAML:**
```yaml
name: security-focus
description: "Revisión enfocada en seguridad: vulnerabilidades, autenticación, manejo de datos"
version: "1.0"
stages:
- name: vulnerabilities
type: custom
prompt: "Revisar el OWASP top 10 y vulnerabilidades de seguridad comunes..."
- name: auth-review
type: custom
prompt: "Examinar patrones de autenticación y autorización..."
uses_history: true
```
### ⚡ Rendimiento y escalabilidad
- ✅ **Modo asíncrono** - Extracción 2–3x más rápida con async/await (usa el flag `--async`)
- ✅ **Soporte para documentación grande** - Maneja documentos de 10K–40K+ páginas con división inteligente
- ✅ **Skills Router/Hub** - Enrutamiento inteligente hacia sub-skills especializados
- ✅ **Extracción en paralelo** - Procesa múltiples skills simultáneamente
- ✅ **Checkpoint/Reanudación** - Nunca pierdas progreso en extracciones largas
- ✅ **Sistema de caché** - Extrae una vez, reconstruye instantáneamente
### ✅ Garantía de calidad
- ✅ **Completamente probado** - Más de 2.540 tests con cobertura completa
---
## 📦 Instalación
```bash
# Instalación básica (extracción de documentación, análisis de GitHub, PDF, empaquetado)
pip install skill-seekers
# Con soporte para todas las plataformas LLM
pip install skill-seekers[all-llms]
# Con servidor MCP
pip install skill-seekers[mcp]
# Todo incluido
pip install skill-seekers[all]
```
**¿Necesitas ayuda para elegir?** Ejecuta el asistente de configuración:
```bash
skill-seekers-setup
```
### Opciones de instalación
| Instalación | Funcionalidades |
|-------------|-----------------|
| `pip install skill-seekers` | Extracción, análisis de GitHub, PDF, todas las plataformas |
| `pip install skill-seekers[gemini]` | + Soporte para Google Gemini |
| `pip install skill-seekers[openai]` | + Soporte para OpenAI ChatGPT |
| `pip install skill-seekers[all-llms]` | + Todas las plataformas LLM |
| `pip install skill-seekers[mcp]` | + Servidor MCP para Claude Code, Cursor, etc. |
| `pip install skill-seekers[video]` | + Extracción de transcripciones y metadatos de YouTube/Vimeo |
| `pip install skill-seekers[video-full]` | + Transcripción Whisper y extracción visual de fotogramas |
| `pip install skill-seekers[jupyter]` | + Soporte para Jupyter Notebook |
| `pip install skill-seekers[pptx]` | + Soporte para PowerPoint |
| `pip install skill-seekers[confluence]` | + Soporte para wiki de Confluence |
| `pip install skill-seekers[notion]` | + Soporte para páginas de Notion |
| `pip install skill-seekers[rss]` | + Soporte para feeds RSS/Atom |
| `pip install skill-seekers[chat]` | + Soporte para exportación de chat de Slack/Discord |
| `pip install skill-seekers[asciidoc]` | + Soporte para documentos AsciiDoc |
| `pip install skill-seekers[all]` | Todo habilitado |
> **Dependencias visuales para video (detección de GPU):** Después de instalar `skill-seekers[video-full]`, ejecuta
> `skill-seekers video --setup` para detectar automáticamente tu GPU e instalar la variante correcta de PyTorch
> + easyocr. Esta es la forma recomendada de instalar las dependencias de extracción visual.
---
## 🚀 Flujo de trabajo de instalación con un solo comando
**La forma más rápida de ir desde la configuración hasta el skill subido - automatización completa:**
```bash
# Instalar skill de React desde las configuraciones oficiales (se sube automáticamente a Claude)
skill-seekers install --config react
# Instalar desde archivo de configuración local
skill-seekers install --config configs/custom.json
# Instalar sin subir (solo empaquetar)
skill-seekers install --config django --no-upload
# Previsualizar flujo de trabajo sin ejecutar
skill-seekers install --config react --dry-run
```
**Tiempo:** 20–45 minutos en total | **Calidad:** Listo para producción (9/10) | **Costo:** Gratis
**Fases ejecutadas:**
```
📥 FASE 1: Obtener configuración (si se proporciona nombre de configuración)
📖 FASE 2: Extraer documentación
✨ FASE 3: Mejora con IA (OBLIGATORIA - sin opción de omitir)
📦 FASE 4: Empaquetar skill
☁️ FASE 5: Subir a Claude (opcional, requiere API key)
```
**Requisitos:**
- Variable de entorno ANTHROPIC_API_KEY (para subida automática)
- Plan Claude Code Max (para mejora local con IA)
---
## 📊 Matriz de funcionalidades
Skill Seekers soporta **12 plataformas LLM**, **17 tipos de fuentes** y paridad total de funcionalidades en todos los destinos.
**Plataformas:** Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown genérico, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
**Tipos de fuentes:** Sitios web de documentación, repos de GitHub, PDFs, Word (.docx), EPUB, Video, Bases de código locales, Jupyter Notebooks, HTML local, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), feeds RSS/Atom, páginas de manual, wikis de Confluence, páginas de Notion, exportaciones de chat de Slack/Discord
Consulta la [Matriz completa de funcionalidades](docs/FEATURE_MATRIX.md) para información detallada de soporte por plataforma y funcionalidad.
### Comparación rápida de plataformas
| Funcionalidad | Claude | Gemini | OpenAI | Markdown |
|---------------|--------|--------|--------|----------|
| Formato | ZIP + YAML | tar.gz | ZIP + Vector | ZIP |
| Carga | ✅ API | ✅ API | ✅ API | ❌ Manual |
| Mejora | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ❌ Ninguna |
| Todos los modos de skill | ✅ | ✅ | ✅ | ✅ |
---
## Ejemplos de uso
### Extracción de documentación
```bash
# Extraer sitio web de documentación
skill-seekers scrape --config configs/react.json
# Extracción rápida sin configuración
skill-seekers scrape --url https://react.dev --name react
# Con modo asíncrono (3x más rápido)
skill-seekers scrape --config configs/godot.json --async --workers 8
```
### Extracción de PDF
```bash
# Extracción básica de PDF
skill-seekers pdf --pdf docs/manual.pdf --name myskill
# Funciones avanzadas
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
--extract-tables \ # Extraer tablas
--parallel \ # Procesamiento paralelo rápido
--workers 8 # Usar 8 núcleos de CPU
# PDFs escaneados (requiere: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr
```
### Extracción de video
```bash
# Instalar soporte para video
pip install skill-seekers[video] # Transcripciones + metadatos
pip install skill-seekers[video-full] # + Whisper + extracción visual de fotogramas
# Detectar GPU automáticamente e instalar dependencias visuales (PyTorch + easyocr)
skill-seekers video --setup
# Extraer de video de YouTube
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial
# Extraer de una lista de reproducción de YouTube
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist
# Extraer de un archivo de video local
skill-seekers video --video-file recording.mp4 --name myrecording
# Extraer con análisis visual de fotogramas (requiere dependencias video-full)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual
# Con mejora por IA (limpia OCR + genera SKILL.md pulido)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2
# Recortar una sección específica de un video (soporta segundos, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00
# Usar Vision API para fotogramas OCR de baja confianza (requiere ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr
# Reconstruir skill desde datos previamente extraídos (saltar descarga)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial
```
> **Guía completa:** Consulta [docs/VIDEO_GUIDE.md](docs/VIDEO_GUIDE.md) para la referencia CLI completa,
> detalles del pipeline visual, opciones de mejora con IA y solución de problemas.
### Análisis de repositorios de GitHub
```bash
# Extracción básica de repositorio
skill-seekers github --repo facebook/react
# Con autenticación (límites de tasa más altos)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react
# Personalizar qué incluir
skill-seekers github --repo django/django \
--include-issues \ # Extraer GitHub Issues
--max-issues 100 \ # Limitar cantidad de issues
--include-changelog # Extraer CHANGELOG.md
```
### Extracción unificada multi-fuente
**Combina documentación + GitHub + PDF en un solo skill unificado con detección de conflictos:**
```bash
# Usar configuraciones unificadas existentes
skill-seekers unified --config configs/react_unified.json
skill-seekers unified --config configs/django_unified.json
# O crear configuración unificada
cat > configs/myframework_unified.json << 'EOF'
{
"name": "myframework",
"merge_mode": "rule-based",
"sources": [
{
"type": "documentation",
"base_url": "https://docs.myframework.com/",
"max_pages": 200
},
{
"type": "github",
"repo": "owner/myframework",
"code_analysis_depth": "surface"
}
]
}
EOF
skill-seekers unified --config configs/myframework_unified.json
```
**La detección de conflictos encuentra automáticamente:**
- 🔴 **Falta en el código** (alto): Documentado pero no implementado
- 🟡 **Falta en la documentación** (medio): Implementado pero no documentado
- ⚠️ **Discrepancia de firma**: Parámetros/tipos diferentes
- ℹ️ **Discrepancia de descripción**: Explicaciones diferentes
**Guía completa:** Consulta [docs/UNIFIED_SCRAPING.md](docs/UNIFIED_SCRAPING.md) para documentación completa.
### Repositorios de configuración privados
**Comparte configuraciones personalizadas entre equipos usando repositorios git privados:**
```bash
# Opción 1: Usando herramientas MCP (recomendado)
# Registrar el repo privado de tu equipo
add_config_source(
name="team",
git_url="https://github.com/mycompany/skill-configs.git",
token_env="GITHUB_TOKEN"
)
# Obtener configuración del repo del equipo
fetch_config(source="team", config_name="internal-api")
```
**Plataformas soportadas:**
- GitHub (`GITHUB_TOKEN`), GitLab (`GITLAB_TOKEN`), Gitea (`GITEA_TOKEN`), Bitbucket (`BITBUCKET_TOKEN`)
**Guía completa:** Consulta [docs/GIT_CONFIG_SOURCES.md](docs/GIT_CONFIG_SOURCES.md) para documentación completa.
## Cómo funciona
```mermaid
graph LR
A[Sitio web de documentación] --> B[Skill Seekers]
B --> C[Scraper]
B --> D[Mejora con IA]
B --> E[Empaquetador]
C --> F[Referencias organizadas]
D --> F
F --> E
E --> G[Claude Skill .zip]
G --> H[Subir a Claude AI]
```
0. **Detectar llms.txt** - Primero verifica llms-full.txt, llms.txt, llms-small.txt
1. **Extraer**: Extrae todas las páginas de la documentación
2. **Categorizar**: Organiza el contenido en temas (API, guías, tutoriales, etc.)
3. **Mejorar**: La IA analiza los docs y crea un SKILL.md completo con ejemplos
4. **Empaquetar**: Agrupa todo en un archivo `.zip` listo para Claude
## 📋 Prerrequisitos
**Antes de empezar, asegúrate de tener:**
1. **Python 3.10 o superior** - [Descargar](https://www.python.org/downloads/) | Verificar: `python3 --version`
2. **Git** - [Descargar](https://git-scm.com/) | Verificar: `git --version`
3. **15–30 minutos** para la configuración inicial
**¿Primera vez?** → **[Empieza aquí: Guía de inicio rápido a prueba de fallos](BULLETPROOF_QUICKSTART.md)** 🎯
---
## 📤 Subir skills a Claude
Una vez empaquetado tu skill, necesitas subirlo a Claude:
### Opción 1: Subida automática (basada en API)
```bash
# Configurar tu API key (una sola vez)
export ANTHROPIC_API_KEY=sk-ant-...
# Empaquetar y subir automáticamente
skill-seekers package output/react/ --upload
# O subir un .zip existente
skill-seekers upload output/react.zip
```
### Opción 2: Subida manual (sin API Key)
```bash
# Empaquetar skill
skill-seekers package output/react/
# → Crea output/react.zip
# Luego subir manualmente:
# - Ve a https://claude.ai/skills
# - Haz clic en "Upload Skill"
# - Selecciona output/react.zip
```
### Opción 3: MCP (Claude Code)
```
En Claude Code, simplemente pide:
"Empaqueta y sube el skill de React"
```
---
## 🤖 Instalación en agentes de IA
Skill Seekers puede instalar automáticamente skills en 18 agentes de programación con IA.
```bash
# Instalar en un agente específico
skill-seekers install-agent output/react/ --agent cursor
# Instalar en todos los agentes a la vez
skill-seekers install-agent output/react/ --agent all
# Previsualizar sin instalar
skill-seekers install-agent output/react/ --agent cursor --dry-run
```
### Agentes soportados
| Agente | Ruta | Tipo |
|--------|------|------|
| **Claude Code** | `~/.claude/skills/` | Global |
| **Cursor** | `.cursor/skills/` | Proyecto |
| **VS Code / Copilot** | `.github/skills/` | Proyecto |
| **Amp** | `~/.amp/skills/` | Global |
| **Goose** | `~/.config/goose/skills/` | Global |
| **OpenCode** | `~/.opencode/skills/` | Global |
| **Windsurf** | `~/.windsurf/skills/` | Global |
| **Roo Code** | `.roo/skills/` | Proyecto |
| **Cline** | `.cline/skills/` | Proyecto |
| **Aider** | `~/.aider/skills/` | Global |
| **Bolt** | `.bolt/skills/` | Proyecto |
| **Kilo Code** | `.kilo/skills/` | Proyecto |
| **Continue** | `~/.continue/skills/` | Global |
| **Kimi Code** | `~/.kimi/skills/` | Global |
---
## 🔌 Integración MCP (26 herramientas)
Skill Seekers incluye un servidor MCP para usar desde Claude Code, Cursor, Windsurf, VS Code + Cline o IntelliJ IDEA.
```bash
# Modo stdio (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp
# Modo HTTP (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
# Auto-configurar todos los agentes a la vez
./setup_mcp.sh
```
**Las 26 herramientas disponibles:**
- **Core (9):** `list_configs`, `generate_config`, `validate_config`, `estimate_pages`, `scrape_docs`, `package_skill`, `upload_skill`, `enhance_skill`, `install_skill`
- **Extendidas (10):** `scrape_github`, `scrape_pdf`, `unified_scrape`, `merge_sources`, `detect_conflicts`, `add_config_source`, `fetch_config`, `list_config_sources`, `remove_config_source`, `split_config`
- **Bases de datos vectoriales (4):** `export_to_chroma`, `export_to_weaviate`, `export_to_faiss`, `export_to_qdrant`
- **Nube (3):** `cloud_upload`, `cloud_download`, `cloud_list`
**Guía completa:** [docs/MCP_SETUP.md](docs/MCP_SETUP.md)
---
## ⚙️ Configuración
### Presets disponibles (más de 24)
```bash
# Listar todos los presets
skill-seekers list-configs
```
| Categoría | Presets |
|-----------|---------|
| **Frameworks Web** | `react`, `vue`, `angular`, `svelte`, `nextjs` |
| **Python** | `django`, `flask`, `fastapi`, `sqlalchemy`, `pytest` |
| **Desarrollo de juegos** | `godot`, `pygame`, `unity` |
| **Herramientas y DevOps** | `docker`, `kubernetes`, `terraform`, `ansible` |
| **Unificados (Docs + GitHub)** | `react-unified`, `vue-unified`, `nextjs-unified` y más |
### Crear tu propia configuración
```bash
# Opción 1: Interactivo
skill-seekers scrape --interactive
# Opción 2: Copiar y editar un preset
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json
```
### Estructura del archivo de configuración
```json
{
"name": "myframework",
"description": "Cuándo usar este skill",
"base_url": "https://docs.myframework.com/",
"selectors": {
"main_content": "article",
"title": "h1",
"code_blocks": "pre code"
},
"url_patterns": {
"include": ["/docs", "/guide"],
"exclude": ["/blog", "/about"]
},
"categories": {
"getting_started": ["intro", "quickstart"],
"api": ["api", "reference"]
},
"rate_limit": 0.5,
"max_pages": 500
}
```
### Dónde almacenar las configuraciones
La herramienta busca en este orden:
1. Ruta exacta proporcionada
2. `./configs/` (directorio actual)
3. `~/.config/skill-seekers/configs/` (directorio de configuración del usuario)
4. API de SkillSeekersWeb.com (configuraciones predefinidas)
---
## 📊 Lo que se crea
```
output/
├── godot_data/ # Datos sin procesar extraídos
│ ├── pages/ # Archivos JSON (uno por página)
│ └── summary.json # Resumen general
│
└── godot/ # El skill
├── SKILL.md # Mejorado con ejemplos reales
├── references/ # Docs categorizados
│ ├── index.md
│ ├── getting_started.md
│ ├── scripting.md
│ └── ...
├── scripts/ # Vacío (añade los tuyos)
└── assets/ # Vacío (añade los tuyos)
```
---
## 🐛 Solución de problemas
### ¿No se extrajo contenido?
- Verifica tu selector `main_content`
- Prueba con: `article`, `main`, `div[role="main"]`
### ¿Los datos existen pero no se usan?
```bash
# Forzar re-extracción
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json
```
### ¿Categorías incorrectas?
Edita la sección `categories` de la configuración con mejores palabras clave.
### ¿Quieres actualizar la documentación?
```bash
# Eliminar datos antiguos y volver a extraer
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json
```
### ¿La mejora no funciona?
```bash
# Verificar si la API key está configurada
echo $ANTHROPIC_API_KEY
# Probar modo LOCAL (usa Claude Code Max, no requiere API key)
skill-seekers enhance output/react/ --mode LOCAL
# Monitorear el estado de mejora en segundo plano
skill-seekers enhance-status output/react/ --watch
```
### ¿Problemas con límite de tasa de GitHub?
```bash
# Configurar un token de GitHub (5000 req/hora vs 60/hora anónimo)
export GITHUB_TOKEN=ghp_your_token_here
# O configurar múltiples perfiles
skill-seekers config --github
```
---
## 📈 Rendimiento
| Tarea | Tiempo | Notas |
|-------|--------|-------|
| Extracción (síncrona) | 15–45 min | Solo la primera vez, basado en hilos |
| Extracción (asíncrona) | 5–15 min | 2–3x más rápido con el flag `--async` |
| Construcción | 1–3 min | Reconstrucción rápida desde caché |
| Reconstrucción | <1 min | Con `--skip-scrape` |
| Mejora (LOCAL) | 30–60 seg | Usa Claude Code Max |
| Mejora (API) | 20–40 seg | Requiere API key |
| Video (transcripción) | 1–3 min | YouTube/local, solo transcripción |
| Video (visual) | 5–15 min | + Extracción de fotogramas OCR |
| Empaquetado | 5–10 seg | Creación del .zip final |
---
## 📚 Documentación
### Primeros pasos
- **[BULLETPROOF_QUICKSTART.md](BULLETPROOF_QUICKSTART.md)** - 🎯 **¡EMPIEZA AQUÍ si eres nuevo!**
- **[QUICKSTART.md](QUICKSTART.md)** - Inicio rápido para usuarios experimentados
- **[TROUBLESHOOTING.md](TROUBLESHOOTING.md)** - Problemas comunes y soluciones
- **[docs/QUICK_REFERENCE.md](docs/QUICK_REFERENCE.md)** - Hoja de referencia rápida
### Guías
- **[docs/LARGE_DOCUMENTATION.md](docs/LARGE_DOCUMENTATION.md)** - Manejar documentos de 10K–40K+ páginas
- **[ASYNC_SUPPORT.md](ASYNC_SUPPORT.md)** - Guía de modo asíncrono (2–3x más rápido)
- **[docs/ENHANCEMENT_MODES.md](docs/ENHANCEMENT_MODES.md)** - Guía de modos de mejora con IA
- **[docs/MCP_SETUP.md](docs/MCP_SETUP.md)** - Configuración de integración MCP
- **[docs/UNIFIED_SCRAPING.md](docs/UNIFIED_SCRAPING.md)** - Extracción multi-fuente
- **[docs/VIDEO_GUIDE.md](docs/VIDEO_GUIDE.md)** - Guía de extracción de video
### Guías de integración
- **[docs/integrations/LANGCHAIN.md](docs/integrations/LANGCHAIN.md)** - LangChain RAG
- **[docs/integrations/CURSOR.md](docs/integrations/CURSOR.md)** - Cursor IDE
- **[docs/integrations/WINDSURF.md](docs/integrations/WINDSURF.md)** - Windsurf IDE
- **[docs/integrations/CLINE.md](docs/integrations/CLINE.md)** - Cline (VS Code)
- **[docs/integrations/RAG_PIPELINES.md](docs/integrations/RAG_PIPELINES.md)** - Todos los pipelines RAG
---
## 📝 Licencia
Licencia MIT - consulta el archivo [LICENSE](LICENSE) para más detalles
---
¡Feliz construcción de skills! 🚀
---
## 🔒 Seguridad
[](https://mseep.ai/app/yusufkaraaslan-skill-seekers)