firefrost-gaming/skill-seekers-reference

Files

yusyus a1934905f6 docs: remove awesome-mcp-servers from ecosystem tables

Not a Skill Seekers-specific repo — better suited for MCP docs section.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-03-22 19:24:37 +03:00

51 KiB

Raw Permalink Blame History

Skill Seekers

⚠️ Aviso de traducción automática

Este documento ha sido traducido automáticamente por IA. Aunque nos esforzamos por garantizar la calidad, pueden existir expresiones inexactas.

¡Ayúdanos a mejorar la traducción a través de GitHub Issue #260! Tu retroalimentación es muy valiosa para nosotros.

🧠 La capa de datos para sistemas de IA. Skill Seekers convierte sitios de documentación, repositorios de GitHub, PDFs, videos, notebooks, wikis y más de 10 tipos de fuentes adicionales en activos de conocimiento estructurado, listos para potenciar AI Skills (Claude, Gemini, OpenAI), pipelines RAG (LangChain, LlamaIndex, Pinecone) y asistentes de programación con IA (Cursor, Windsurf, Cline) en minutos, no en horas.

🌐 Visita SkillSeekersWeb.com - ¡Explora más de 24 configuraciones predefinidas, comparte tus configuraciones y accede a la documentación completa!

📋 Ver hoja de ruta y tareas de desarrollo - ¡134 tareas en 10 categorías, elige cualquiera para contribuir!

🌐 Ecosistema

Skill Seekers es un proyecto multi-repositorio. Aquí es donde vive todo:

Repositorio	Descripción	Enlaces
Skill_Seekers	CLI principal y servidor MCP (este repo)	PyPI
skillseekersweb	Sitio web y documentación	Web
skill-seekers-configs	Repositorio de configuraciones comunitarias
skill-seekers-action	GitHub Action para CI/CD
skill-seekers-plugin	Plugin para Claude Code
homebrew-skill-seekers	Homebrew tap para macOS

¿Quieres contribuir? ¡Los repos del sitio web y configuraciones son excelentes puntos de partida para nuevos colaboradores!

🧠 La capa de datos para sistemas de IA

Skill Seekers es la capa universal de preprocesamiento que se ubica entre la documentación sin procesar y cada sistema de IA que la consume. Ya sea que estés construyendo Claude Skills, un pipeline RAG con LangChain o un archivo .cursorrules para Cursor, la preparación de datos es idéntica. Lo haces una vez y exportas a todos los destinos.

# Un comando → activo de conocimiento estructurado
skill-seekers create https://docs.react.dev/
# o: skill-seekers create facebook/react
# o: skill-seekers create ./my-project

# Exportar a cualquier sistema de IA
skill-seekers package output/react --target claude      # → Claude AI Skill (ZIP)
skill-seekers package output/react --target langchain   # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor      # → .cursorrules

Lo que se genera

Salida	Destino	Para qué sirve
Claude Skill (ZIP + YAML)	`--target claude`	Claude Code, Claude API
Gemini Skill (tar.gz)	`--target gemini`	Google Gemini
OpenAI / Custom GPT (ZIP)	`--target openai`	GPT-4o, asistentes personalizados
LangChain Documents	`--target langchain`	Cadenas QA, agentes, recuperadores
LlamaIndex TextNodes	`--target llama-index`	Motores de consulta, motores de chat
Haystack Documents	`--target haystack`	Pipelines RAG empresariales
Pinecone-ready (Markdown)	`--target markdown`	Carga de vectores
ChromaDB / FAISS / Qdrant	`--format chroma/faiss/qdrant`	Bases de datos vectoriales locales
Cursor `.cursorrules`	`--target claude` → copiar	Contexto IA del IDE Cursor
Windsurf / Cline / Continue	`--target claude` → copiar	VS Code, IntelliJ, Vim

Por qué es importante

⚡ 99% más rápido — Días de preparación manual → 15–45 minutos
🎯 Calidad de AI Skill — Archivos SKILL.md de más de 500 líneas con ejemplos, patrones y guías
📊 Fragmentos listos para RAG — Fragmentación inteligente que preserva bloques de código y mantiene el contexto
🎬 Videos — Extrae código, transcripciones y conocimiento estructurado de YouTube y videos locales
🔄 Multi-fuente — Combina 17 tipos de fuentes (docs, GitHub, PDFs, videos, notebooks, wikis y más) en un solo activo de conocimiento
🌐 Una preparación, todos los destinos — Exporta el mismo activo a 16 plataformas sin volver a extraer
✅ Probado en producción — Más de 2.540 tests, más de 24 presets de frameworks, listo para producción

🚀 Inicio rápido (3 comandos)

# 1. Instalar
pip install skill-seekers

# 2. Crear skill desde cualquier fuente
skill-seekers create https://docs.django.com/

# 3. Empaquetar para tu plataforma de IA
skill-seekers package output/django --target claude

¡Eso es todo! Ahora tienes output/django-claude.zip listo para usar.

Otras fuentes (17 soportadas)

# Repositorio de GitHub
skill-seekers create facebook/react

# Proyecto local
skill-seekers create ./my-project

# Documento PDF
skill-seekers create manual.pdf

# Documento Word
skill-seekers create report.docx

# Libro electrónico EPUB
skill-seekers create book.epub

# Jupyter Notebook
skill-seekers create notebook.ipynb

# Especificación OpenAPI
skill-seekers create openapi.yaml

# Presentación PowerPoint
skill-seekers create presentation.pptx

# Documento AsciiDoc
skill-seekers create guide.adoc

# Archivo HTML local
skill-seekers create page.html

# Feed RSS/Atom
skill-seekers create feed.rss

# Página de manual
skill-seekers create curl.1

# Video (YouTube, Vimeo o archivo local — requiere skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# ¿Primera vez? Instala automáticamente las dependencias visuales con detección de GPU:
skill-seekers video --setup

# Wiki de Confluence
skill-seekers confluence --space TEAM --name wiki

# Páginas de Notion
skill-seekers notion --database-id ... --name docs

# Exportación de chat de Slack/Discord
skill-seekers chat --export-dir ./slack-export --name team-chat

Exportar a todas partes

# Empaquetar para múltiples plataformas
for platform in claude gemini openai langchain; do
  skill-seekers package output/django --target $platform
done

¿Qué es Skill Seekers?

Skill Seekers es la capa de datos para sistemas de IA. Transforma 17 tipos de fuentes —sitios web de documentación, repositorios de GitHub, PDFs, videos, Jupyter Notebooks, documentos Word/EPUB/AsciiDoc, especificaciones OpenAPI, presentaciones PowerPoint, feeds RSS, páginas de manual, wikis de Confluence, páginas de Notion, exportaciones de Slack/Discord y más— en activos de conocimiento estructurado para cualquier destino de IA:

Caso de uso	Lo que obtienes	Ejemplos
AI Skills	SKILL.md completo + referencias	Claude Code, Gemini, GPT
Pipelines RAG	Documentos fragmentados con metadatos enriquecidos	LangChain, LlamaIndex, Haystack
Bases de datos vectoriales	Datos pre-formateados listos para carga	Pinecone, Chroma, Weaviate, FAISS
Asistentes de programación con IA	Archivos de contexto que tu IDE IA lee automáticamente	Cursor, Windsurf, Cline, Continue.dev

En lugar de pasar días en preprocesamiento manual, Skill Seekers:

Ingesta — documentación, repositorios de GitHub, bases de código locales, PDFs, videos, notebooks, wikis y más de 10 tipos de fuentes adicionales
Analiza — análisis profundo AST, detección de patrones, extracción de APIs
Estructura — archivos de referencia categorizados con metadatos
Mejora — generación de SKILL.md potenciada por IA (Claude, Gemini o local)
Exporta — 16 formatos específicos por plataforma desde un solo activo

¿Por qué usar Skill Seekers?

Para constructores de AI Skills (Claude, Gemini, OpenAI)

🎯 Skills de nivel producción — Archivos SKILL.md de más de 500 líneas con ejemplos de código, patrones y guías
🔄 Flujos de mejora — Aplica presets como security-focus, architecture-comprehensive o YAML personalizados
🎮 Cualquier dominio — Motores de juegos (Godot, Unity), frameworks (React, Django), herramientas internas
🔧 Equipos — Combina documentación interna + código en una única fuente de verdad
📚 Calidad — Mejorado con IA, incluye ejemplos, referencia rápida y guía de navegación

Para constructores de RAG e ingenieros de IA

🤖 Datos listos para RAG — Documents de LangChain, TextNodes de LlamaIndex y Documents de Haystack pre-fragmentados
🚀 99% más rápido — Días de preprocesamiento → 15–45 minutos
📊 Metadatos inteligentes — Categorías, fuentes, tipos → mayor precisión en la recuperación
🔄 Multi-fuente — Combina docs + GitHub + PDFs + videos en un solo pipeline
🌐 Agnóstico de plataforma — Exporta a cualquier base de datos vectorial o framework sin volver a extraer

Para usuarios de asistentes de programación con IA

💻 Cursor / Windsurf / Cline — Genera .cursorrules / .windsurfrules / .clinerules automáticamente
🎯 Contexto persistente — La IA "conoce" tus frameworks sin necesidad de repetir prompts
📚 Siempre actualizado — Actualiza el contexto en minutos cuando cambia la documentación

Funcionalidades clave

🌐 Extracción de documentación

✅ Soporte para llms.txt - Detecta y usa automáticamente archivos de documentación optimizados para LLM (10 veces más rápido)
✅ Scraper universal - Funciona con CUALQUIER sitio web de documentación
✅ Categorización inteligente - Organiza automáticamente el contenido por tema
✅ Detección de lenguajes de código - Reconoce Python, JavaScript, C++, GDScript, etc.
✅ Más de 24 presets listos para usar - Godot, React, Vue, Django, FastAPI y más

📄 Soporte para PDF

✅ Extracción básica de PDF - Extrae texto, código e imágenes de archivos PDF
✅ OCR para PDFs escaneados - Extrae texto de documentos escaneados
✅ PDFs protegidos con contraseña - Maneja PDFs cifrados
✅ Extracción de tablas - Extrae tablas complejas de PDFs
✅ Procesamiento en paralelo - 3 veces más rápido para PDFs grandes
✅ Caché inteligente - 50% más rápido en ejecuciones posteriores

🎬 Extracción de video

✅ YouTube y videos locales - Extrae transcripciones, código en pantalla y conocimiento estructurado de videos
✅ Análisis visual de fotogramas - Extracción OCR de editores de código, terminales, diapositivas y diagramas
✅ Detección automática de GPU - Instala automáticamente la compilación correcta de PyTorch (CUDA/ROCm/MPS/CPU)
✅ Mejora con IA - Dos pasadas: limpieza de artefactos OCR + generación de SKILL.md pulido
✅ Recorte temporal - Extrae secciones específicas con --start-time y --end-time
✅ Soporte para listas de reproducción - Procesa por lotes todos los videos de una lista de reproducción de YouTube
✅ Respaldo con Vision API - Usa Claude Vision para fotogramas OCR de baja confianza

🐙 Análisis de repositorios de GitHub

✅ Análisis profundo de código - Análisis AST para Python, JavaScript, TypeScript, Java, C++, Go
✅ Extracción de APIs - Funciones, clases, métodos con parámetros y tipos
✅ Metadatos del repositorio - README, árbol de archivos, desglose de lenguajes, estrellas/forks
✅ GitHub Issues y PRs - Obtiene issues abiertos/cerrados con etiquetas e hitos
✅ CHANGELOG y releases - Extrae automáticamente el historial de versiones
✅ Detección de conflictos - Compara APIs documentadas vs. implementación real del código
✅ Integración MCP - Lenguaje natural: "Extrae el repositorio de GitHub facebook/react"

🔄 Extracción unificada multi-fuente

✅ Combina múltiples fuentes - Mezcla documentación + GitHub + PDF en un solo skill
✅ Detección de conflictos - Encuentra automáticamente discrepancias entre docs y código
✅ Fusión inteligente - Resolución de conflictos basada en reglas o potenciada por IA
✅ Informes transparentes - Comparación lado a lado con advertencias ⚠️
✅ Análisis de brechas en documentación - Identifica docs obsoletos y funcionalidades no documentadas
✅ Fuente única de verdad - Un solo skill que muestra tanto la intención (docs) como la realidad (código)
✅ Compatible con versiones anteriores - Las configuraciones de fuente única legacy siguen funcionando

🤖 Soporte para múltiples plataformas LLM

✅ 12 plataformas LLM - Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown genérico, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
✅ Extracción universal - La misma documentación funciona para todas las plataformas
✅ Empaquetado específico por plataforma - Formatos optimizados para cada LLM
✅ Exportación con un solo comando - El flag --target selecciona la plataforma
✅ Dependencias opcionales - Instala solo lo que necesitas
✅ 100% compatible con versiones anteriores - Los flujos de trabajo existentes de Claude no cambian

Plataforma	Formato	Carga	Mejora	API Key	Endpoint personalizado
Claude AI	ZIP + YAML	✅ Automática	✅ Sí	ANTHROPIC_API_KEY	ANTHROPIC_BASE_URL
Google Gemini	tar.gz	✅ Automática	✅ Sí	GOOGLE_API_KEY	-
OpenAI ChatGPT	ZIP + Vector Store	✅ Automática	✅ Sí	OPENAI_API_KEY	-
Markdown genérico	ZIP	❌ Manual	❌ No	-	-

# Claude (predeterminado - ¡sin cambios necesarios!)
skill-seekers package output/react/
skill-seekers upload react.zip

# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini

# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai

# Markdown genérico (exportación universal)
skill-seekers package output/react/ --target markdown
# Usa los archivos markdown directamente en cualquier LLM

🔧 Variables de entorno para APIs compatibles con Claude (ej. GLM-4.7)

Skill Seekers soporta cualquier endpoint de API compatible con Claude:

# Opción 1: API oficial de Anthropic (predeterminado)
export ANTHROPIC_API_KEY=sk-ant-...

# Opción 2: API compatible con Claude de GLM-4.7
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1

# Todas las funciones de mejora con IA usarán el endpoint configurado
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance

Nota: Configurar ANTHROPIC_BASE_URL permite usar cualquier endpoint de API compatible con Claude, como GLM-4.7 (智谱 AI) u otros servicios compatibles.

Instalación:

# Instalar con soporte para Gemini
pip install skill-seekers[gemini]

# Instalar con soporte para OpenAI
pip install skill-seekers[openai]

# Instalar con todas las plataformas LLM
pip install skill-seekers[all-llms]

🔗 Integraciones con frameworks RAG

✅ LangChain Documents - Exportación directa al formato Document con page_content + metadatos
- Ideal para: cadenas QA, recuperadores, almacenes de vectores, agentes
- Ejemplo: Pipeline RAG con LangChain
- Guía: Integración con LangChain
✅ LlamaIndex TextNodes - Exportación al formato TextNode con IDs únicos + embeddings
- Ideal para: motores de consulta, motores de chat, contexto de almacenamiento
- Ejemplo: Motor de consulta LlamaIndex
- Guía: Integración con LlamaIndex
✅ Formato listo para Pinecone - Optimizado para carga en bases de datos vectoriales
- Ideal para: búsqueda vectorial en producción, búsqueda semántica, búsqueda híbrida
- Ejemplo: Carga en Pinecone
- Guía: Integración con Pinecone

Exportación rápida:

# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json

# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json

# Markdown (universal)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/

Guía completa de pipelines RAG: Documentación de pipelines RAG

🧠 Integraciones con asistentes de programación con IA

Transforma cualquier documentación de framework en contexto experto de programación para más de 4 asistentes de IA:

✅ Cursor IDE - Genera .cursorrules para sugerencias de código potenciadas por IA
- Ideal para: generación de código específica por framework, patrones consistentes
- Funciona con: Cursor IDE (fork de VS Code)
- Guía: Integración con Cursor
- Ejemplo: Skill de React para Cursor
✅ Windsurf - Personaliza el contexto del asistente IA de Windsurf con .windsurfrules
- Ideal para: asistencia IA nativa del IDE, programación basada en flujos
- Funciona con: Windsurf IDE de Codeium
- Guía: Integración con Windsurf
- Ejemplo: Contexto FastAPI para Windsurf
✅ Cline (VS Code) - Prompts de sistema + MCP para el agente de VS Code
- Ideal para: generación de código agéntica en VS Code
- Funciona con: extensión Cline para VS Code
- Guía: Integración con Cline
- Ejemplo: Asistente Django para Cline
✅ Continue.dev - Servidores de contexto para IA independiente del IDE
- Ideal para: entornos multi-IDE (VS Code, JetBrains, Vim), proveedores LLM personalizados
- Funciona con: cualquier IDE con el plugin Continue.dev
- Guía: Integración con Continue
- Ejemplo: Contexto universal de Continue

Exportación rápida para herramientas de programación con IA:

# Para cualquier asistente de programación con IA (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude  # o --target markdown

# Copiar a tu proyecto (ejemplo para Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules

# O para Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md

# O para Cline
cp output/django-claude/SKILL.md my-project/.clinerules

# O para Continue.dev (servidor HTTP)
python examples/continue-dev-universal/context_server.py
# Configurar en ~/.continue/config.json

Centro de integraciones: Todas las integraciones con sistemas de IA

🌊 Arquitectura de tres flujos para GitHub

✅ Análisis de triple flujo - Divide los repos de GitHub en flujos de Código, Documentación e Insights
✅ Analizador de código unificado - Funciona con URLs de GitHub Y rutas locales
✅ C3.x como profundidad de análisis - Elige entre 'basic' (1–2 min) o 'c3x' (20–60 min)
✅ Generación mejorada del router - Metadatos de GitHub, inicio rápido del README, problemas comunes
✅ Integración de issues - Problemas principales y soluciones desde GitHub Issues
✅ Palabras clave de enrutamiento inteligente - Etiquetas de GitHub con peso 2x para mejor detección de temas

Los tres flujos explicados:

Flujo 1: Código - Análisis profundo C3.x (patrones, ejemplos, guías, configuraciones, arquitectura)
Flujo 2: Documentación - Documentación del repositorio (README, CONTRIBUTING, docs/*.md)
Flujo 3: Insights - Conocimiento de la comunidad (issues, etiquetas, estrellas, forks)

from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer

# Analizar repositorio de GitHub con los tres flujos
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
    source="https://github.com/facebook/react",
    depth="c3x",  # o "basic" para análisis rápido
    fetch_github_metadata=True
)

# Acceder al flujo de código (análisis C3.x)
print(f"Patrones de diseño: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Ejemplos de tests: {result.code_analysis['c3_2_examples_count']}")

# Acceder al flujo de documentación (docs del repositorio)
print(f"README: {result.github_docs['readme'][:100]}")

# Acceder al flujo de insights (metadatos de GitHub)
print(f"Estrellas: {result.github_insights['metadata']['stars']}")
print(f"Problemas comunes: {len(result.github_insights['common_problems'])}")

Documentación completa: Resumen de implementación de tres flujos

🔐 Gestión inteligente de límites de tasa y configuración

✅ Sistema de configuración multi-token - Gestiona múltiples cuentas de GitHub (personal, trabajo, OSS)
- Almacenamiento seguro de configuración en ~/.config/skill-seekers/config.json (permisos 600)
- Estrategias de límite de tasa por perfil: prompt, wait, switch, fail
- Timeout configurable por perfil (predeterminado: 30 min, evita esperas indefinidas)
- Cadena inteligente de respaldo: argumento CLI → variable de entorno → archivo de configuración → prompt
- Gestión de API keys para Claude, Gemini, OpenAI
✅ Asistente de configuración interactivo - Interfaz de terminal atractiva para fácil configuración
- Integración con navegador para creación de tokens (abre automáticamente GitHub, etc.)
- Validación de tokens y pruebas de conexión
- Visualización de estado con códigos de color
✅ Manejador inteligente de límites de tasa - ¡No más esperas indefinidas!
- Advertencia anticipada sobre límites de tasa (60/hora vs 5000/hora)
- Detección en tiempo real desde las respuestas de la API de GitHub
- Temporizadores de cuenta regresiva en vivo con progreso
- Cambio automático de perfil cuando se alcanza el límite
- Cuatro estrategias: prompt (preguntar), wait (cuenta regresiva), switch (cambiar a otro), fail (abortar)
✅ Capacidad de reanudación - Continúa trabajos interrumpidos
- Auto-guardado de progreso en intervalos configurables (predeterminado: 60 seg)
- Lista todos los trabajos reanudables con detalles de progreso
- Limpieza automática de trabajos antiguos (predeterminado: 7 días)
✅ Soporte CI/CD - Modo no interactivo para automatización
- Flag --non-interactive que falla rápidamente sin prompts
- Flag --profile para seleccionar una cuenta de GitHub específica
- Mensajes de error claros para logs de pipelines

Configuración rápida:

# Configuración única (5 minutos)
skill-seekers config --github

# Usar perfil específico para repos privados
skill-seekers github --repo mycompany/private-repo --profile work

# Modo CI/CD (fallo rápido, sin prompts)
skill-seekers github --repo owner/repo --non-interactive

# Reanudar trabajo interrumpido
skill-seekers resume --list
skill-seekers resume github_react_20260117_143022

Estrategias de límite de tasa explicadas:

prompt (predeterminado) - Pregunta qué hacer cuando se alcanza el límite (esperar, cambiar, configurar token, cancelar)
wait - Espera automáticamente con temporizador de cuenta regresiva (respeta el timeout)
switch - Intenta automáticamente el siguiente perfil disponible (para configuraciones multi-cuenta)
fail - Falla inmediatamente con error claro (perfecto para CI/CD)

🎯 Skill Bootstrap - Auto-alojamiento

Genera skill-seekers como un Claude Code Skill para usarlo dentro de Claude:

# Generar el skill
./scripts/bootstrap_skill.sh

# Instalar en Claude Code
cp -r output/skill-seekers ~/.claude/skills/

Lo que obtienes:

✅ Documentación completa del skill - Todos los comandos CLI y patrones de uso
✅ Referencia de comandos CLI - Cada herramienta y sus opciones documentadas
✅ Ejemplos de inicio rápido - Flujos de trabajo comunes y mejores prácticas
✅ Documentación de API auto-generada - Análisis de código, patrones y ejemplos

🔐 Repositorios de configuración privados

✅ Fuentes de configuración basadas en Git - Obtén configuraciones desde repositorios git privados/de equipo
✅ Gestión multi-fuente - Registra repositorios ilimitados de GitHub, GitLab, Bitbucket
✅ Colaboración en equipo - Comparte configuraciones personalizadas entre equipos de 3–5 personas
✅ Soporte empresarial - Escala a más de 500 desarrolladores con resolución basada en prioridad
✅ Autenticación segura - Tokens como variables de entorno (GITHUB_TOKEN, GITLAB_TOKEN)
✅ Caché inteligente - Clona una vez, obtiene actualizaciones automáticamente
✅ Modo offline - Trabaja con configuraciones en caché cuando no hay conexión

🤖 Análisis de código (C3.x)

C3.4: Extracción de patrones de configuración con mejora por IA

✅ 9 formatos de configuración - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
✅ 7 tipos de patrones - Configuraciones de base de datos, API, logging, caché, correo, autenticación, servidor
✅ Mejora con IA - Análisis IA opcional en modo dual (API + LOCAL)
- Explica qué hace cada configuración
- Sugiere mejores prácticas y mejoras
- Análisis de seguridad - Encuentra secretos codificados y credenciales expuestas
✅ Auto-documentación - Genera documentación JSON + Markdown de todas las configuraciones
✅ Integración MCP - Herramienta extract_config_patterns con soporte de mejora

C3.3: Guías prácticas mejoradas con IA

✅ Mejora integral con IA - Transforma guías básicas en tutoriales profesionales
✅ 5 mejoras automáticas - Descripciones de pasos, solución de problemas, prerrequisitos, siguientes pasos, casos de uso
✅ Soporte de modo dual - Modo API (Claude API) o modo LOCAL (Claude Code CLI)
✅ Sin costos con modo LOCAL - Mejora GRATUITA usando tu plan Claude Code Max
✅ Transformación de calidad - Plantillas de 75 líneas → guías completas de más de 500 líneas

Uso:

# Análisis rápido (1–2 min, solo funciones básicas)
skill-seekers analyze --directory tests/ --quick

# Análisis completo con IA (20–60 min, todas las funciones)
skill-seekers analyze --directory tests/ --comprehensive

# Con mejora por IA
skill-seekers analyze --directory tests/ --enhance

Documentación completa: docs/HOW_TO_GUIDES.md

🔄 Presets de flujo de trabajo de mejora

Pipelines de mejora reutilizables definidos en YAML que controlan cómo la IA transforma tu documentación sin procesar en un skill pulido.

✅ 5 presets incluidos — default, minimal, security-focus, architecture-comprehensive, api-documentation
✅ Presets definidos por el usuario — añade flujos personalizados a ~/.config/skill-seekers/workflows/
✅ Múltiples flujos de trabajo — encadena dos o más flujos en un solo comando
✅ CLI completamente gestionado — lista, inspecciona, copia, añade, elimina y valida flujos de trabajo

# Aplicar un solo flujo de trabajo
skill-seekers create ./my-project --enhance-workflow security-focus

# Encadenar múltiples flujos de trabajo (se aplican en orden)
skill-seekers create ./my-project \
  --enhance-workflow security-focus \
  --enhance-workflow minimal

# Gestionar presets
skill-seekers workflows list                          # Listar todos (incluidos + usuario)
skill-seekers workflows show security-focus           # Mostrar contenido YAML
skill-seekers workflows copy security-focus           # Copiar al directorio de usuario para editar
skill-seekers workflows add ./my-workflow.yaml        # Instalar un preset personalizado
skill-seekers workflows remove my-workflow            # Eliminar un preset de usuario
skill-seekers workflows validate security-focus       # Validar estructura del preset

# Copiar varios a la vez
skill-seekers workflows copy security-focus minimal api-documentation

# Añadir varios archivos a la vez
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml

# Eliminar varios a la vez
skill-seekers workflows remove my-wf-a my-wf-b

Formato de preset YAML:

name: security-focus
description: "Revisión enfocada en seguridad: vulnerabilidades, autenticación, manejo de datos"
version: "1.0"
stages:
  - name: vulnerabilities
    type: custom
    prompt: "Revisar el OWASP top 10 y vulnerabilidades de seguridad comunes..."
  - name: auth-review
    type: custom
    prompt: "Examinar patrones de autenticación y autorización..."
    uses_history: true

⚡ Rendimiento y escalabilidad

✅ Modo asíncrono - Extracción 2–3x más rápida con async/await (usa el flag --async)
✅ Soporte para documentación grande - Maneja documentos de 10K–40K+ páginas con división inteligente
✅ Skills Router/Hub - Enrutamiento inteligente hacia sub-skills especializados
✅ Extracción en paralelo - Procesa múltiples skills simultáneamente
✅ Checkpoint/Reanudación - Nunca pierdas progreso en extracciones largas
✅ Sistema de caché - Extrae una vez, reconstruye instantáneamente

✅ Garantía de calidad

✅ Completamente probado - Más de 2.540 tests con cobertura completa

📦 Instalación

# Instalación básica (extracción de documentación, análisis de GitHub, PDF, empaquetado)
pip install skill-seekers

# Con soporte para todas las plataformas LLM
pip install skill-seekers[all-llms]

# Con servidor MCP
pip install skill-seekers[mcp]

# Todo incluido
pip install skill-seekers[all]

¿Necesitas ayuda para elegir? Ejecuta el asistente de configuración:

skill-seekers-setup

Opciones de instalación

Instalación	Funcionalidades
`pip install skill-seekers`	Extracción, análisis de GitHub, PDF, todas las plataformas
`pip install skill-seekers[gemini]`	+ Soporte para Google Gemini
`pip install skill-seekers[openai]`	+ Soporte para OpenAI ChatGPT
`pip install skill-seekers[all-llms]`	+ Todas las plataformas LLM
`pip install skill-seekers[mcp]`	+ Servidor MCP para Claude Code, Cursor, etc.
`pip install skill-seekers[video]`	+ Extracción de transcripciones y metadatos de YouTube/Vimeo
`pip install skill-seekers[video-full]`	+ Transcripción Whisper y extracción visual de fotogramas
`pip install skill-seekers[jupyter]`	+ Soporte para Jupyter Notebook
`pip install skill-seekers[pptx]`	+ Soporte para PowerPoint
`pip install skill-seekers[confluence]`	+ Soporte para wiki de Confluence
`pip install skill-seekers[notion]`	+ Soporte para páginas de Notion
`pip install skill-seekers[rss]`	+ Soporte para feeds RSS/Atom
`pip install skill-seekers[chat]`	+ Soporte para exportación de chat de Slack/Discord
`pip install skill-seekers[asciidoc]`	+ Soporte para documentos AsciiDoc
`pip install skill-seekers[all]`	Todo habilitado

Dependencias visuales para video (detección de GPU): Después de instalar skill-seekers[video-full], ejecuta skill-seekers video --setup para detectar automáticamente tu GPU e instalar la variante correcta de PyTorch

easyocr. Esta es la forma recomendada de instalar las dependencias de extracción visual.

🚀 Flujo de trabajo de instalación con un solo comando

La forma más rápida de ir desde la configuración hasta el skill subido - automatización completa:

# Instalar skill de React desde las configuraciones oficiales (se sube automáticamente a Claude)
skill-seekers install --config react

# Instalar desde archivo de configuración local
skill-seekers install --config configs/custom.json

# Instalar sin subir (solo empaquetar)
skill-seekers install --config django --no-upload

# Previsualizar flujo de trabajo sin ejecutar
skill-seekers install --config react --dry-run

Tiempo: 20–45 minutos en total | Calidad: Listo para producción (9/10) | Costo: Gratis

Fases ejecutadas:

📥 FASE 1: Obtener configuración (si se proporciona nombre de configuración)
📖 FASE 2: Extraer documentación
✨ FASE 3: Mejora con IA (OBLIGATORIA - sin opción de omitir)
📦 FASE 4: Empaquetar skill
☁️  FASE 5: Subir a Claude (opcional, requiere API key)

Requisitos:

Variable de entorno ANTHROPIC_API_KEY (para subida automática)
Plan Claude Code Max (para mejora local con IA)

📊 Matriz de funcionalidades

Skill Seekers soporta 12 plataformas LLM, 17 tipos de fuentes y paridad total de funcionalidades en todos los destinos.

Plataformas: Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown genérico, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI Tipos de fuentes: Sitios web de documentación, repos de GitHub, PDFs, Word (.docx), EPUB, Video, Bases de código locales, Jupyter Notebooks, HTML local, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), feeds RSS/Atom, páginas de manual, wikis de Confluence, páginas de Notion, exportaciones de chat de Slack/Discord

Consulta la Matriz completa de funcionalidades para información detallada de soporte por plataforma y funcionalidad.

Comparación rápida de plataformas

Funcionalidad	Claude	Gemini	OpenAI	Markdown
Formato	ZIP + YAML	tar.gz	ZIP + Vector	ZIP
Carga	✅ API	✅ API	✅ API	❌ Manual
Mejora	✅ Sonnet 4	✅ 2.0 Flash	✅ GPT-4o	❌ Ninguna
Todos los modos de skill	✅	✅	✅	✅

Ejemplos de uso

Extracción de documentación

# Extraer sitio web de documentación
skill-seekers scrape --config configs/react.json

# Extracción rápida sin configuración
skill-seekers scrape --url https://react.dev --name react

# Con modo asíncrono (3x más rápido)
skill-seekers scrape --config configs/godot.json --async --workers 8

Extracción de PDF

# Extracción básica de PDF
skill-seekers pdf --pdf docs/manual.pdf --name myskill

# Funciones avanzadas
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
    --extract-tables \        # Extraer tablas
    --parallel \              # Procesamiento paralelo rápido
    --workers 8               # Usar 8 núcleos de CPU

# PDFs escaneados (requiere: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr

Extracción de video

# Instalar soporte para video
pip install skill-seekers[video]        # Transcripciones + metadatos
pip install skill-seekers[video-full]   # + Whisper + extracción visual de fotogramas

# Detectar GPU automáticamente e instalar dependencias visuales (PyTorch + easyocr)
skill-seekers video --setup

# Extraer de video de YouTube
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial

# Extraer de una lista de reproducción de YouTube
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist

# Extraer de un archivo de video local
skill-seekers video --video-file recording.mp4 --name myrecording

# Extraer con análisis visual de fotogramas (requiere dependencias video-full)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual

# Con mejora por IA (limpia OCR + genera SKILL.md pulido)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2

# Recortar una sección específica de un video (soporta segundos, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00

# Usar Vision API para fotogramas OCR de baja confianza (requiere ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr

# Reconstruir skill desde datos previamente extraídos (saltar descarga)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial

Guía completa: Consulta docs/VIDEO_GUIDE.md para la referencia CLI completa, detalles del pipeline visual, opciones de mejora con IA y solución de problemas.

Análisis de repositorios de GitHub

# Extracción básica de repositorio
skill-seekers github --repo facebook/react

# Con autenticación (límites de tasa más altos)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react

# Personalizar qué incluir
skill-seekers github --repo django/django \
    --include-issues \        # Extraer GitHub Issues
    --max-issues 100 \        # Limitar cantidad de issues
    --include-changelog       # Extraer CHANGELOG.md

Extracción unificada multi-fuente

Combina documentación + GitHub + PDF en un solo skill unificado con detección de conflictos:

# Usar configuraciones unificadas existentes
skill-seekers unified --config configs/react_unified.json
skill-seekers unified --config configs/django_unified.json

# O crear configuración unificada
cat > configs/myframework_unified.json << 'EOF'
{
  "name": "myframework",
  "merge_mode": "rule-based",
  "sources": [
    {
      "type": "documentation",
      "base_url": "https://docs.myframework.com/",
      "max_pages": 200
    },
    {
      "type": "github",
      "repo": "owner/myframework",
      "code_analysis_depth": "surface"
    }
  ]
}
EOF

skill-seekers unified --config configs/myframework_unified.json

La detección de conflictos encuentra automáticamente:

🔴 Falta en el código (alto): Documentado pero no implementado
🟡 Falta en la documentación (medio): Implementado pero no documentado
⚠️ Discrepancia de firma: Parámetros/tipos diferentes
ℹ️ Discrepancia de descripción: Explicaciones diferentes

Guía completa: Consulta docs/UNIFIED_SCRAPING.md para documentación completa.

Repositorios de configuración privados

Comparte configuraciones personalizadas entre equipos usando repositorios git privados:

# Opción 1: Usando herramientas MCP (recomendado)
# Registrar el repo privado de tu equipo
add_config_source(
    name="team",
    git_url="https://github.com/mycompany/skill-configs.git",
    token_env="GITHUB_TOKEN"
)

# Obtener configuración del repo del equipo
fetch_config(source="team", config_name="internal-api")

Plataformas soportadas:

GitHub (GITHUB_TOKEN), GitLab (GITLAB_TOKEN), Gitea (GITEA_TOKEN), Bitbucket (BITBUCKET_TOKEN)

Guía completa: Consulta docs/GIT_CONFIG_SOURCES.md para documentación completa.

Cómo funciona

graph LR
    A[Sitio web de documentación] --> B[Skill Seekers]
    B --> C[Scraper]
    B --> D[Mejora con IA]
    B --> E[Empaquetador]
    C --> F[Referencias organizadas]
    D --> F
    F --> E
    E --> G[Claude Skill .zip]
    G --> H[Subir a Claude AI]

Detectar llms.txt - Primero verifica llms-full.txt, llms.txt, llms-small.txt
Extraer: Extrae todas las páginas de la documentación
Categorizar: Organiza el contenido en temas (API, guías, tutoriales, etc.)
Mejorar: La IA analiza los docs y crea un SKILL.md completo con ejemplos
Empaquetar: Agrupa todo en un archivo .zip listo para Claude

📋 Prerrequisitos

Antes de empezar, asegúrate de tener:

Python 3.10 o superior - Descargar | Verificar: python3 --version
Git - Descargar | Verificar: git --version
15–30 minutos para la configuración inicial

¿Primera vez? → Empieza aquí: Guía de inicio rápido a prueba de fallos 🎯

📤 Subir skills a Claude

Una vez empaquetado tu skill, necesitas subirlo a Claude:

Opción 1: Subida automática (basada en API)

# Configurar tu API key (una sola vez)
export ANTHROPIC_API_KEY=sk-ant-...

# Empaquetar y subir automáticamente
skill-seekers package output/react/ --upload

# O subir un .zip existente
skill-seekers upload output/react.zip

Opción 2: Subida manual (sin API Key)

# Empaquetar skill
skill-seekers package output/react/
# → Crea output/react.zip

# Luego subir manualmente:
# - Ve a https://claude.ai/skills
# - Haz clic en "Upload Skill"
# - Selecciona output/react.zip

Opción 3: MCP (Claude Code)

En Claude Code, simplemente pide:
"Empaqueta y sube el skill de React"

🤖 Instalación en agentes de IA

Skill Seekers puede instalar automáticamente skills en 18 agentes de programación con IA.

# Instalar en un agente específico
skill-seekers install-agent output/react/ --agent cursor

# Instalar en todos los agentes a la vez
skill-seekers install-agent output/react/ --agent all

# Previsualizar sin instalar
skill-seekers install-agent output/react/ --agent cursor --dry-run

Agentes soportados

Agente	Ruta	Tipo
Claude Code	`~/.claude/skills/`	Global
Cursor	`.cursor/skills/`	Proyecto
VS Code / Copilot	`.github/skills/`	Proyecto
Amp	`~/.amp/skills/`	Global
Goose	`~/.config/goose/skills/`	Global
OpenCode	`~/.opencode/skills/`	Global
Windsurf	`~/.windsurf/skills/`	Global
Roo Code	`.roo/skills/`	Proyecto
Cline	`.cline/skills/`	Proyecto
Aider	`~/.aider/skills/`	Global
Bolt	`.bolt/skills/`	Proyecto
Kilo Code	`.kilo/skills/`	Proyecto
Continue	`~/.continue/skills/`	Global
Kimi Code	`~/.kimi/skills/`	Global

🔌 Integración MCP (26 herramientas)

Skill Seekers incluye un servidor MCP para usar desde Claude Code, Cursor, Windsurf, VS Code + Cline o IntelliJ IDEA.

# Modo stdio (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp

# Modo HTTP (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765

# Auto-configurar todos los agentes a la vez
./setup_mcp.sh

Las 26 herramientas disponibles:

Core (9): list_configs, generate_config, validate_config, estimate_pages, scrape_docs, package_skill, upload_skill, enhance_skill, install_skill
Extendidas (10): scrape_github, scrape_pdf, unified_scrape, merge_sources, detect_conflicts, add_config_source, fetch_config, list_config_sources, remove_config_source, split_config
Bases de datos vectoriales (4): export_to_chroma, export_to_weaviate, export_to_faiss, export_to_qdrant
Nube (3): cloud_upload, cloud_download, cloud_list

Guía completa: docs/MCP_SETUP.md

⚙️ Configuración

Presets disponibles (más de 24)

# Listar todos los presets
skill-seekers list-configs

Categoría	Presets
Frameworks Web	`react`, `vue`, `angular`, `svelte`, `nextjs`
Python	`django`, `flask`, `fastapi`, `sqlalchemy`, `pytest`
Desarrollo de juegos	`godot`, `pygame`, `unity`
Herramientas y DevOps	`docker`, `kubernetes`, `terraform`, `ansible`
Unificados (Docs + GitHub)	`react-unified`, `vue-unified`, `nextjs-unified` y más

Crear tu propia configuración

# Opción 1: Interactivo
skill-seekers scrape --interactive

# Opción 2: Copiar y editar un preset
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json

Estructura del archivo de configuración

{
  "name": "myframework",
  "description": "Cuándo usar este skill",
  "base_url": "https://docs.myframework.com/",
  "selectors": {
    "main_content": "article",
    "title": "h1",
    "code_blocks": "pre code"
  },
  "url_patterns": {
    "include": ["/docs", "/guide"],
    "exclude": ["/blog", "/about"]
  },
  "categories": {
    "getting_started": ["intro", "quickstart"],
    "api": ["api", "reference"]
  },
  "rate_limit": 0.5,
  "max_pages": 500
}

Dónde almacenar las configuraciones

La herramienta busca en este orden:

Ruta exacta proporcionada
./configs/ (directorio actual)
~/.config/skill-seekers/configs/ (directorio de configuración del usuario)
API de SkillSeekersWeb.com (configuraciones predefinidas)

📊 Lo que se crea

output/
├── godot_data/              # Datos sin procesar extraídos
│   ├── pages/              # Archivos JSON (uno por página)
│   └── summary.json        # Resumen general
│
└── godot/                   # El skill
    ├── SKILL.md            # Mejorado con ejemplos reales
    ├── references/         # Docs categorizados
    │   ├── index.md
    │   ├── getting_started.md
    │   ├── scripting.md
    │   └── ...
    ├── scripts/            # Vacío (añade los tuyos)
    └── assets/             # Vacío (añade los tuyos)

🐛 Solución de problemas

¿No se extrajo contenido?

Verifica tu selector main_content
Prueba con: article, main, div[role="main"]

¿Los datos existen pero no se usan?

# Forzar re-extracción
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json

¿Categorías incorrectas?

Edita la sección categories de la configuración con mejores palabras clave.

¿Quieres actualizar la documentación?

# Eliminar datos antiguos y volver a extraer
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json

¿La mejora no funciona?

# Verificar si la API key está configurada
echo $ANTHROPIC_API_KEY

# Probar modo LOCAL (usa Claude Code Max, no requiere API key)
skill-seekers enhance output/react/ --mode LOCAL

# Monitorear el estado de mejora en segundo plano
skill-seekers enhance-status output/react/ --watch

¿Problemas con límite de tasa de GitHub?

# Configurar un token de GitHub (5000 req/hora vs 60/hora anónimo)
export GITHUB_TOKEN=ghp_your_token_here

# O configurar múltiples perfiles
skill-seekers config --github

📈 Rendimiento

Tarea	Tiempo	Notas
Extracción (síncrona)	15–45 min	Solo la primera vez, basado en hilos
Extracción (asíncrona)	5–15 min	2–3x más rápido con el flag `--async`
Construcción	1–3 min	Reconstrucción rápida desde caché
Reconstrucción	<1 min	Con `--skip-scrape`
Mejora (LOCAL)	30–60 seg	Usa Claude Code Max
Mejora (API)	20–40 seg	Requiere API key
Video (transcripción)	1–3 min	YouTube/local, solo transcripción
Video (visual)	5–15 min	+ Extracción de fotogramas OCR
Empaquetado	5–10 seg	Creación del .zip final

📚 Documentación

Primeros pasos

BULLETPROOF_QUICKSTART.md - 🎯 ¡EMPIEZA AQUÍ si eres nuevo!
QUICKSTART.md - Inicio rápido para usuarios experimentados
TROUBLESHOOTING.md - Problemas comunes y soluciones
docs/QUICK_REFERENCE.md - Hoja de referencia rápida

Guías

docs/LARGE_DOCUMENTATION.md - Manejar documentos de 10K–40K+ páginas
ASYNC_SUPPORT.md - Guía de modo asíncrono (2–3x más rápido)
docs/ENHANCEMENT_MODES.md - Guía de modos de mejora con IA
docs/MCP_SETUP.md - Configuración de integración MCP
docs/UNIFIED_SCRAPING.md - Extracción multi-fuente
docs/VIDEO_GUIDE.md - Guía de extracción de video

Guías de integración

docs/integrations/LANGCHAIN.md - LangChain RAG
docs/integrations/CURSOR.md - Cursor IDE
docs/integrations/WINDSURF.md - Windsurf IDE
docs/integrations/CLINE.md - Cline (VS Code)
docs/integrations/RAG_PIPELINES.md - Todos los pipelines RAG

📝 Licencia

Licencia MIT - consulta el archivo LICENSE para más detalles

¡Feliz construcción de skills! 🚀

51 KiB Raw Permalink Blame History Unescape Escape