Not a Skill Seekers-specific repo — better suited for MCP docs section. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
1191 lines
51 KiB
Markdown
1191 lines
51 KiB
Markdown
<p align="center">
|
||
<img src="docs/assets/logo.png" alt="Skill Seekers" width="200"/>
|
||
</p>
|
||
|
||
# Skill Seekers
|
||
|
||
[English](README.md) | [简体中文](README.zh-CN.md) | [日本語](README.ja.md) | [한국어](README.ko.md) | Español | [Français](README.fr.md) | [Deutsch](README.de.md) | [Português](README.pt-BR.md) | [Türkçe](README.tr.md) | [العربية](README.ar.md) | [हिन्दी](README.hi.md) | [Русский](README.ru.md)
|
||
|
||
> ⚠️ **Aviso de traducción automática**
|
||
>
|
||
> Este documento ha sido traducido automáticamente por IA. Aunque nos esforzamos por garantizar la calidad, pueden existir expresiones inexactas.
|
||
>
|
||
> ¡Ayúdanos a mejorar la traducción a través de [GitHub Issue #260](https://github.com/yusufkaraaslan/Skill_Seekers/issues/260)! Tu retroalimentación es muy valiosa para nosotros.
|
||
|
||
[](https://github.com/yusufkaraaslan/Skill_Seekers/releases)
|
||
[](https://opensource.org/licenses/MIT)
|
||
[](https://www.python.org/downloads/)
|
||
[](https://modelcontextprotocol.io)
|
||
[](tests/)
|
||
[](https://github.com/users/yusufkaraaslan/projects/2)
|
||
[](https://pypi.org/project/skill-seekers/)
|
||
[](https://pypi.org/project/skill-seekers/)
|
||
[](https://pypi.org/project/skill-seekers/)
|
||
[](https://skillseekersweb.com/)
|
||
[](https://x.com/_yUSyUS_)
|
||
[](https://github.com/yusufkaraaslan/Skill_Seekers)
|
||
|
||
**🧠 La capa de datos para sistemas de IA.** Skill Seekers convierte sitios de documentación, repositorios de GitHub, PDFs, videos, notebooks, wikis y más de 10 tipos de fuentes adicionales en activos de conocimiento estructurado, listos para potenciar AI Skills (Claude, Gemini, OpenAI), pipelines RAG (LangChain, LlamaIndex, Pinecone) y asistentes de programación con IA (Cursor, Windsurf, Cline) en minutos, no en horas.
|
||
|
||
> 🌐 **[Visita SkillSeekersWeb.com](https://skillseekersweb.com/)** - ¡Explora más de 24 configuraciones predefinidas, comparte tus configuraciones y accede a la documentación completa!
|
||
|
||
> 📋 **[Ver hoja de ruta y tareas de desarrollo](https://github.com/users/yusufkaraaslan/projects/2)** - ¡134 tareas en 10 categorías, elige cualquiera para contribuir!
|
||
|
||
## 🌐 Ecosistema
|
||
|
||
Skill Seekers es un proyecto multi-repositorio. Aquí es donde vive todo:
|
||
|
||
| Repositorio | Descripción | Enlaces |
|
||
|------------|-------------|---------|
|
||
| **[Skill_Seekers](https://github.com/yusufkaraaslan/Skill_Seekers)** | CLI principal y servidor MCP (este repo) | [PyPI](https://pypi.org/project/skill-seekers/) |
|
||
| **[skillseekersweb](https://github.com/yusufkaraaslan/skillseekersweb)** | Sitio web y documentación | [Web](https://skillseekersweb.com/) |
|
||
| **[skill-seekers-configs](https://github.com/yusufkaraaslan/skill-seekers-configs)** | Repositorio de configuraciones comunitarias | |
|
||
| **[skill-seekers-action](https://github.com/yusufkaraaslan/skill-seekers-action)** | GitHub Action para CI/CD | |
|
||
| **[skill-seekers-plugin](https://github.com/yusufkaraaslan/skill-seekers-plugin)** | Plugin para Claude Code | |
|
||
| **[homebrew-skill-seekers](https://github.com/yusufkaraaslan/homebrew-skill-seekers)** | Homebrew tap para macOS | |
|
||
|
||
> **¿Quieres contribuir?** ¡Los repos del sitio web y configuraciones son excelentes puntos de partida para nuevos colaboradores!
|
||
|
||
## 🧠 La capa de datos para sistemas de IA
|
||
|
||
**Skill Seekers es la capa universal de preprocesamiento** que se ubica entre la documentación sin procesar y cada sistema de IA que la consume. Ya sea que estés construyendo Claude Skills, un pipeline RAG con LangChain o un archivo `.cursorrules` para Cursor, la preparación de datos es idéntica. Lo haces una vez y exportas a todos los destinos.
|
||
|
||
```bash
|
||
# Un comando → activo de conocimiento estructurado
|
||
skill-seekers create https://docs.react.dev/
|
||
# o: skill-seekers create facebook/react
|
||
# o: skill-seekers create ./my-project
|
||
|
||
# Exportar a cualquier sistema de IA
|
||
skill-seekers package output/react --target claude # → Claude AI Skill (ZIP)
|
||
skill-seekers package output/react --target langchain # → LangChain Documents
|
||
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
|
||
skill-seekers package output/react --target cursor # → .cursorrules
|
||
```
|
||
|
||
### Lo que se genera
|
||
|
||
| Salida | Destino | Para qué sirve |
|
||
|--------|---------|-----------------|
|
||
| **Claude Skill** (ZIP + YAML) | `--target claude` | Claude Code, Claude API |
|
||
| **Gemini Skill** (tar.gz) | `--target gemini` | Google Gemini |
|
||
| **OpenAI / Custom GPT** (ZIP) | `--target openai` | GPT-4o, asistentes personalizados |
|
||
| **LangChain Documents** | `--target langchain` | Cadenas QA, agentes, recuperadores |
|
||
| **LlamaIndex TextNodes** | `--target llama-index` | Motores de consulta, motores de chat |
|
||
| **Haystack Documents** | `--target haystack` | Pipelines RAG empresariales |
|
||
| **Pinecone-ready** (Markdown) | `--target markdown` | Carga de vectores |
|
||
| **ChromaDB / FAISS / Qdrant** | `--format chroma/faiss/qdrant` | Bases de datos vectoriales locales |
|
||
| **Cursor** `.cursorrules` | `--target claude` → copiar | Contexto IA del IDE Cursor |
|
||
| **Windsurf / Cline / Continue** | `--target claude` → copiar | VS Code, IntelliJ, Vim |
|
||
|
||
### Por qué es importante
|
||
|
||
- ⚡ **99% más rápido** — Días de preparación manual → 15–45 minutos
|
||
- 🎯 **Calidad de AI Skill** — Archivos SKILL.md de más de 500 líneas con ejemplos, patrones y guías
|
||
- 📊 **Fragmentos listos para RAG** — Fragmentación inteligente que preserva bloques de código y mantiene el contexto
|
||
- 🎬 **Videos** — Extrae código, transcripciones y conocimiento estructurado de YouTube y videos locales
|
||
- 🔄 **Multi-fuente** — Combina 17 tipos de fuentes (docs, GitHub, PDFs, videos, notebooks, wikis y más) en un solo activo de conocimiento
|
||
- 🌐 **Una preparación, todos los destinos** — Exporta el mismo activo a 16 plataformas sin volver a extraer
|
||
- ✅ **Probado en producción** — Más de 2.540 tests, más de 24 presets de frameworks, listo para producción
|
||
|
||
## 🚀 Inicio rápido (3 comandos)
|
||
|
||
```bash
|
||
# 1. Instalar
|
||
pip install skill-seekers
|
||
|
||
# 2. Crear skill desde cualquier fuente
|
||
skill-seekers create https://docs.django.com/
|
||
|
||
# 3. Empaquetar para tu plataforma de IA
|
||
skill-seekers package output/django --target claude
|
||
```
|
||
|
||
**¡Eso es todo!** Ahora tienes `output/django-claude.zip` listo para usar.
|
||
|
||
### Otras fuentes (17 soportadas)
|
||
|
||
```bash
|
||
# Repositorio de GitHub
|
||
skill-seekers create facebook/react
|
||
|
||
# Proyecto local
|
||
skill-seekers create ./my-project
|
||
|
||
# Documento PDF
|
||
skill-seekers create manual.pdf
|
||
|
||
# Documento Word
|
||
skill-seekers create report.docx
|
||
|
||
# Libro electrónico EPUB
|
||
skill-seekers create book.epub
|
||
|
||
# Jupyter Notebook
|
||
skill-seekers create notebook.ipynb
|
||
|
||
# Especificación OpenAPI
|
||
skill-seekers create openapi.yaml
|
||
|
||
# Presentación PowerPoint
|
||
skill-seekers create presentation.pptx
|
||
|
||
# Documento AsciiDoc
|
||
skill-seekers create guide.adoc
|
||
|
||
# Archivo HTML local
|
||
skill-seekers create page.html
|
||
|
||
# Feed RSS/Atom
|
||
skill-seekers create feed.rss
|
||
|
||
# Página de manual
|
||
skill-seekers create curl.1
|
||
|
||
# Video (YouTube, Vimeo o archivo local — requiere skill-seekers[video])
|
||
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
|
||
# ¿Primera vez? Instala automáticamente las dependencias visuales con detección de GPU:
|
||
skill-seekers video --setup
|
||
|
||
# Wiki de Confluence
|
||
skill-seekers confluence --space TEAM --name wiki
|
||
|
||
# Páginas de Notion
|
||
skill-seekers notion --database-id ... --name docs
|
||
|
||
# Exportación de chat de Slack/Discord
|
||
skill-seekers chat --export-dir ./slack-export --name team-chat
|
||
```
|
||
|
||
### Exportar a todas partes
|
||
|
||
```bash
|
||
# Empaquetar para múltiples plataformas
|
||
for platform in claude gemini openai langchain; do
|
||
skill-seekers package output/django --target $platform
|
||
done
|
||
```
|
||
|
||
## ¿Qué es Skill Seekers?
|
||
|
||
Skill Seekers es la **capa de datos para sistemas de IA**. Transforma 17 tipos de fuentes —sitios web de documentación, repositorios de GitHub, PDFs, videos, Jupyter Notebooks, documentos Word/EPUB/AsciiDoc, especificaciones OpenAPI, presentaciones PowerPoint, feeds RSS, páginas de manual, wikis de Confluence, páginas de Notion, exportaciones de Slack/Discord y más— en activos de conocimiento estructurado para cualquier destino de IA:
|
||
|
||
| Caso de uso | Lo que obtienes | Ejemplos |
|
||
|-------------|-----------------|----------|
|
||
| **AI Skills** | SKILL.md completo + referencias | Claude Code, Gemini, GPT |
|
||
| **Pipelines RAG** | Documentos fragmentados con metadatos enriquecidos | LangChain, LlamaIndex, Haystack |
|
||
| **Bases de datos vectoriales** | Datos pre-formateados listos para carga | Pinecone, Chroma, Weaviate, FAISS |
|
||
| **Asistentes de programación con IA** | Archivos de contexto que tu IDE IA lee automáticamente | Cursor, Windsurf, Cline, Continue.dev |
|
||
|
||
En lugar de pasar días en preprocesamiento manual, Skill Seekers:
|
||
|
||
1. **Ingesta** — documentación, repositorios de GitHub, bases de código locales, PDFs, videos, notebooks, wikis y más de 10 tipos de fuentes adicionales
|
||
2. **Analiza** — análisis profundo AST, detección de patrones, extracción de APIs
|
||
3. **Estructura** — archivos de referencia categorizados con metadatos
|
||
4. **Mejora** — generación de SKILL.md potenciada por IA (Claude, Gemini o local)
|
||
5. **Exporta** — 16 formatos específicos por plataforma desde un solo activo
|
||
|
||
## ¿Por qué usar Skill Seekers?
|
||
|
||
### Para constructores de AI Skills (Claude, Gemini, OpenAI)
|
||
|
||
- 🎯 **Skills de nivel producción** — Archivos SKILL.md de más de 500 líneas con ejemplos de código, patrones y guías
|
||
- 🔄 **Flujos de mejora** — Aplica presets como `security-focus`, `architecture-comprehensive` o YAML personalizados
|
||
- 🎮 **Cualquier dominio** — Motores de juegos (Godot, Unity), frameworks (React, Django), herramientas internas
|
||
- 🔧 **Equipos** — Combina documentación interna + código en una única fuente de verdad
|
||
- 📚 **Calidad** — Mejorado con IA, incluye ejemplos, referencia rápida y guía de navegación
|
||
|
||
### Para constructores de RAG e ingenieros de IA
|
||
|
||
- 🤖 **Datos listos para RAG** — `Documents` de LangChain, `TextNodes` de LlamaIndex y `Documents` de Haystack pre-fragmentados
|
||
- 🚀 **99% más rápido** — Días de preprocesamiento → 15–45 minutos
|
||
- 📊 **Metadatos inteligentes** — Categorías, fuentes, tipos → mayor precisión en la recuperación
|
||
- 🔄 **Multi-fuente** — Combina docs + GitHub + PDFs + videos en un solo pipeline
|
||
- 🌐 **Agnóstico de plataforma** — Exporta a cualquier base de datos vectorial o framework sin volver a extraer
|
||
|
||
### Para usuarios de asistentes de programación con IA
|
||
|
||
- 💻 **Cursor / Windsurf / Cline** — Genera `.cursorrules` / `.windsurfrules` / `.clinerules` automáticamente
|
||
- 🎯 **Contexto persistente** — La IA "conoce" tus frameworks sin necesidad de repetir prompts
|
||
- 📚 **Siempre actualizado** — Actualiza el contexto en minutos cuando cambia la documentación
|
||
|
||
## Funcionalidades clave
|
||
|
||
### 🌐 Extracción de documentación
|
||
- ✅ **Soporte para llms.txt** - Detecta y usa automáticamente archivos de documentación optimizados para LLM (10 veces más rápido)
|
||
- ✅ **Scraper universal** - Funciona con CUALQUIER sitio web de documentación
|
||
- ✅ **Categorización inteligente** - Organiza automáticamente el contenido por tema
|
||
- ✅ **Detección de lenguajes de código** - Reconoce Python, JavaScript, C++, GDScript, etc.
|
||
- ✅ **Más de 24 presets listos para usar** - Godot, React, Vue, Django, FastAPI y más
|
||
|
||
### 📄 Soporte para PDF
|
||
- ✅ **Extracción básica de PDF** - Extrae texto, código e imágenes de archivos PDF
|
||
- ✅ **OCR para PDFs escaneados** - Extrae texto de documentos escaneados
|
||
- ✅ **PDFs protegidos con contraseña** - Maneja PDFs cifrados
|
||
- ✅ **Extracción de tablas** - Extrae tablas complejas de PDFs
|
||
- ✅ **Procesamiento en paralelo** - 3 veces más rápido para PDFs grandes
|
||
- ✅ **Caché inteligente** - 50% más rápido en ejecuciones posteriores
|
||
|
||
### 🎬 Extracción de video
|
||
- ✅ **YouTube y videos locales** - Extrae transcripciones, código en pantalla y conocimiento estructurado de videos
|
||
- ✅ **Análisis visual de fotogramas** - Extracción OCR de editores de código, terminales, diapositivas y diagramas
|
||
- ✅ **Detección automática de GPU** - Instala automáticamente la compilación correcta de PyTorch (CUDA/ROCm/MPS/CPU)
|
||
- ✅ **Mejora con IA** - Dos pasadas: limpieza de artefactos OCR + generación de SKILL.md pulido
|
||
- ✅ **Recorte temporal** - Extrae secciones específicas con `--start-time` y `--end-time`
|
||
- ✅ **Soporte para listas de reproducción** - Procesa por lotes todos los videos de una lista de reproducción de YouTube
|
||
- ✅ **Respaldo con Vision API** - Usa Claude Vision para fotogramas OCR de baja confianza
|
||
|
||
### 🐙 Análisis de repositorios de GitHub
|
||
- ✅ **Análisis profundo de código** - Análisis AST para Python, JavaScript, TypeScript, Java, C++, Go
|
||
- ✅ **Extracción de APIs** - Funciones, clases, métodos con parámetros y tipos
|
||
- ✅ **Metadatos del repositorio** - README, árbol de archivos, desglose de lenguajes, estrellas/forks
|
||
- ✅ **GitHub Issues y PRs** - Obtiene issues abiertos/cerrados con etiquetas e hitos
|
||
- ✅ **CHANGELOG y releases** - Extrae automáticamente el historial de versiones
|
||
- ✅ **Detección de conflictos** - Compara APIs documentadas vs. implementación real del código
|
||
- ✅ **Integración MCP** - Lenguaje natural: "Extrae el repositorio de GitHub facebook/react"
|
||
|
||
### 🔄 Extracción unificada multi-fuente
|
||
- ✅ **Combina múltiples fuentes** - Mezcla documentación + GitHub + PDF en un solo skill
|
||
- ✅ **Detección de conflictos** - Encuentra automáticamente discrepancias entre docs y código
|
||
- ✅ **Fusión inteligente** - Resolución de conflictos basada en reglas o potenciada por IA
|
||
- ✅ **Informes transparentes** - Comparación lado a lado con advertencias ⚠️
|
||
- ✅ **Análisis de brechas en documentación** - Identifica docs obsoletos y funcionalidades no documentadas
|
||
- ✅ **Fuente única de verdad** - Un solo skill que muestra tanto la intención (docs) como la realidad (código)
|
||
- ✅ **Compatible con versiones anteriores** - Las configuraciones de fuente única legacy siguen funcionando
|
||
|
||
### 🤖 Soporte para múltiples plataformas LLM
|
||
- ✅ **12 plataformas LLM** - Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown genérico, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
|
||
- ✅ **Extracción universal** - La misma documentación funciona para todas las plataformas
|
||
- ✅ **Empaquetado específico por plataforma** - Formatos optimizados para cada LLM
|
||
- ✅ **Exportación con un solo comando** - El flag `--target` selecciona la plataforma
|
||
- ✅ **Dependencias opcionales** - Instala solo lo que necesitas
|
||
- ✅ **100% compatible con versiones anteriores** - Los flujos de trabajo existentes de Claude no cambian
|
||
|
||
| Plataforma | Formato | Carga | Mejora | API Key | Endpoint personalizado |
|
||
|------------|---------|-------|--------|---------|------------------------|
|
||
| **Claude AI** | ZIP + YAML | ✅ Automática | ✅ Sí | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
|
||
| **Google Gemini** | tar.gz | ✅ Automática | ✅ Sí | GOOGLE_API_KEY | - |
|
||
| **OpenAI ChatGPT** | ZIP + Vector Store | ✅ Automática | ✅ Sí | OPENAI_API_KEY | - |
|
||
| **Markdown genérico** | ZIP | ❌ Manual | ❌ No | - | - |
|
||
|
||
```bash
|
||
# Claude (predeterminado - ¡sin cambios necesarios!)
|
||
skill-seekers package output/react/
|
||
skill-seekers upload react.zip
|
||
|
||
# Google Gemini
|
||
pip install skill-seekers[gemini]
|
||
skill-seekers package output/react/ --target gemini
|
||
skill-seekers upload react-gemini.tar.gz --target gemini
|
||
|
||
# OpenAI ChatGPT
|
||
pip install skill-seekers[openai]
|
||
skill-seekers package output/react/ --target openai
|
||
skill-seekers upload react-openai.zip --target openai
|
||
|
||
# Markdown genérico (exportación universal)
|
||
skill-seekers package output/react/ --target markdown
|
||
# Usa los archivos markdown directamente en cualquier LLM
|
||
```
|
||
|
||
<details>
|
||
<summary>🔧 <strong>Variables de entorno para APIs compatibles con Claude (ej. GLM-4.7)</strong></summary>
|
||
|
||
Skill Seekers soporta cualquier endpoint de API compatible con Claude:
|
||
|
||
```bash
|
||
# Opción 1: API oficial de Anthropic (predeterminado)
|
||
export ANTHROPIC_API_KEY=sk-ant-...
|
||
|
||
# Opción 2: API compatible con Claude de GLM-4.7
|
||
export ANTHROPIC_API_KEY=your-glm-47-api-key
|
||
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1
|
||
|
||
# Todas las funciones de mejora con IA usarán el endpoint configurado
|
||
skill-seekers enhance output/react/
|
||
skill-seekers analyze --directory . --enhance
|
||
```
|
||
|
||
**Nota**: Configurar `ANTHROPIC_BASE_URL` permite usar cualquier endpoint de API compatible con Claude, como GLM-4.7 (智谱 AI) u otros servicios compatibles.
|
||
|
||
</details>
|
||
|
||
**Instalación:**
|
||
```bash
|
||
# Instalar con soporte para Gemini
|
||
pip install skill-seekers[gemini]
|
||
|
||
# Instalar con soporte para OpenAI
|
||
pip install skill-seekers[openai]
|
||
|
||
# Instalar con todas las plataformas LLM
|
||
pip install skill-seekers[all-llms]
|
||
```
|
||
|
||
### 🔗 Integraciones con frameworks RAG
|
||
|
||
- ✅ **LangChain Documents** - Exportación directa al formato `Document` con `page_content` + metadatos
|
||
- Ideal para: cadenas QA, recuperadores, almacenes de vectores, agentes
|
||
- Ejemplo: [Pipeline RAG con LangChain](examples/langchain-rag-pipeline/)
|
||
- Guía: [Integración con LangChain](docs/integrations/LANGCHAIN.md)
|
||
|
||
- ✅ **LlamaIndex TextNodes** - Exportación al formato `TextNode` con IDs únicos + embeddings
|
||
- Ideal para: motores de consulta, motores de chat, contexto de almacenamiento
|
||
- Ejemplo: [Motor de consulta LlamaIndex](examples/llama-index-query-engine/)
|
||
- Guía: [Integración con LlamaIndex](docs/integrations/LLAMA_INDEX.md)
|
||
|
||
- ✅ **Formato listo para Pinecone** - Optimizado para carga en bases de datos vectoriales
|
||
- Ideal para: búsqueda vectorial en producción, búsqueda semántica, búsqueda híbrida
|
||
- Ejemplo: [Carga en Pinecone](examples/pinecone-upsert/)
|
||
- Guía: [Integración con Pinecone](docs/integrations/PINECONE.md)
|
||
|
||
**Exportación rápida:**
|
||
```bash
|
||
# LangChain Documents (JSON)
|
||
skill-seekers package output/django --target langchain
|
||
# → output/django-langchain.json
|
||
|
||
# LlamaIndex TextNodes (JSON)
|
||
skill-seekers package output/django --target llama-index
|
||
# → output/django-llama-index.json
|
||
|
||
# Markdown (universal)
|
||
skill-seekers package output/django --target markdown
|
||
# → output/django-markdown/SKILL.md + references/
|
||
```
|
||
|
||
**Guía completa de pipelines RAG:** [Documentación de pipelines RAG](docs/integrations/RAG_PIPELINES.md)
|
||
|
||
---
|
||
|
||
### 🧠 Integraciones con asistentes de programación con IA
|
||
|
||
Transforma cualquier documentación de framework en contexto experto de programación para más de 4 asistentes de IA:
|
||
|
||
- ✅ **Cursor IDE** - Genera `.cursorrules` para sugerencias de código potenciadas por IA
|
||
- Ideal para: generación de código específica por framework, patrones consistentes
|
||
- Funciona con: Cursor IDE (fork de VS Code)
|
||
- Guía: [Integración con Cursor](docs/integrations/CURSOR.md)
|
||
- Ejemplo: [Skill de React para Cursor](examples/cursor-react-skill/)
|
||
|
||
- ✅ **Windsurf** - Personaliza el contexto del asistente IA de Windsurf con `.windsurfrules`
|
||
- Ideal para: asistencia IA nativa del IDE, programación basada en flujos
|
||
- Funciona con: Windsurf IDE de Codeium
|
||
- Guía: [Integración con Windsurf](docs/integrations/WINDSURF.md)
|
||
- Ejemplo: [Contexto FastAPI para Windsurf](examples/windsurf-fastapi-context/)
|
||
|
||
- ✅ **Cline (VS Code)** - Prompts de sistema + MCP para el agente de VS Code
|
||
- Ideal para: generación de código agéntica en VS Code
|
||
- Funciona con: extensión Cline para VS Code
|
||
- Guía: [Integración con Cline](docs/integrations/CLINE.md)
|
||
- Ejemplo: [Asistente Django para Cline](examples/cline-django-assistant/)
|
||
|
||
- ✅ **Continue.dev** - Servidores de contexto para IA independiente del IDE
|
||
- Ideal para: entornos multi-IDE (VS Code, JetBrains, Vim), proveedores LLM personalizados
|
||
- Funciona con: cualquier IDE con el plugin Continue.dev
|
||
- Guía: [Integración con Continue](docs/integrations/CONTINUE_DEV.md)
|
||
- Ejemplo: [Contexto universal de Continue](examples/continue-dev-universal/)
|
||
|
||
**Exportación rápida para herramientas de programación con IA:**
|
||
```bash
|
||
# Para cualquier asistente de programación con IA (Cursor, Windsurf, Cline, Continue.dev)
|
||
skill-seekers scrape --config configs/django.json
|
||
skill-seekers package output/django --target claude # o --target markdown
|
||
|
||
# Copiar a tu proyecto (ejemplo para Cursor)
|
||
cp output/django-claude/SKILL.md my-project/.cursorrules
|
||
|
||
# O para Windsurf
|
||
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md
|
||
|
||
# O para Cline
|
||
cp output/django-claude/SKILL.md my-project/.clinerules
|
||
|
||
# O para Continue.dev (servidor HTTP)
|
||
python examples/continue-dev-universal/context_server.py
|
||
# Configurar en ~/.continue/config.json
|
||
```
|
||
|
||
**Centro de integraciones:** [Todas las integraciones con sistemas de IA](docs/integrations/INTEGRATIONS.md)
|
||
|
||
---
|
||
|
||
### 🌊 Arquitectura de tres flujos para GitHub
|
||
- ✅ **Análisis de triple flujo** - Divide los repos de GitHub en flujos de Código, Documentación e Insights
|
||
- ✅ **Analizador de código unificado** - Funciona con URLs de GitHub Y rutas locales
|
||
- ✅ **C3.x como profundidad de análisis** - Elige entre 'basic' (1–2 min) o 'c3x' (20–60 min)
|
||
- ✅ **Generación mejorada del router** - Metadatos de GitHub, inicio rápido del README, problemas comunes
|
||
- ✅ **Integración de issues** - Problemas principales y soluciones desde GitHub Issues
|
||
- ✅ **Palabras clave de enrutamiento inteligente** - Etiquetas de GitHub con peso 2x para mejor detección de temas
|
||
|
||
**Los tres flujos explicados:**
|
||
- **Flujo 1: Código** - Análisis profundo C3.x (patrones, ejemplos, guías, configuraciones, arquitectura)
|
||
- **Flujo 2: Documentación** - Documentación del repositorio (README, CONTRIBUTING, docs/*.md)
|
||
- **Flujo 3: Insights** - Conocimiento de la comunidad (issues, etiquetas, estrellas, forks)
|
||
|
||
```python
|
||
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer
|
||
|
||
# Analizar repositorio de GitHub con los tres flujos
|
||
analyzer = UnifiedCodebaseAnalyzer()
|
||
result = analyzer.analyze(
|
||
source="https://github.com/facebook/react",
|
||
depth="c3x", # o "basic" para análisis rápido
|
||
fetch_github_metadata=True
|
||
)
|
||
|
||
# Acceder al flujo de código (análisis C3.x)
|
||
print(f"Patrones de diseño: {len(result.code_analysis['c3_1_patterns'])}")
|
||
print(f"Ejemplos de tests: {result.code_analysis['c3_2_examples_count']}")
|
||
|
||
# Acceder al flujo de documentación (docs del repositorio)
|
||
print(f"README: {result.github_docs['readme'][:100]}")
|
||
|
||
# Acceder al flujo de insights (metadatos de GitHub)
|
||
print(f"Estrellas: {result.github_insights['metadata']['stars']}")
|
||
print(f"Problemas comunes: {len(result.github_insights['common_problems'])}")
|
||
```
|
||
|
||
**Documentación completa**: [Resumen de implementación de tres flujos](docs/IMPLEMENTATION_SUMMARY_THREE_STREAM.md)
|
||
|
||
### 🔐 Gestión inteligente de límites de tasa y configuración
|
||
- ✅ **Sistema de configuración multi-token** - Gestiona múltiples cuentas de GitHub (personal, trabajo, OSS)
|
||
- Almacenamiento seguro de configuración en `~/.config/skill-seekers/config.json` (permisos 600)
|
||
- Estrategias de límite de tasa por perfil: `prompt`, `wait`, `switch`, `fail`
|
||
- Timeout configurable por perfil (predeterminado: 30 min, evita esperas indefinidas)
|
||
- Cadena inteligente de respaldo: argumento CLI → variable de entorno → archivo de configuración → prompt
|
||
- Gestión de API keys para Claude, Gemini, OpenAI
|
||
- ✅ **Asistente de configuración interactivo** - Interfaz de terminal atractiva para fácil configuración
|
||
- Integración con navegador para creación de tokens (abre automáticamente GitHub, etc.)
|
||
- Validación de tokens y pruebas de conexión
|
||
- Visualización de estado con códigos de color
|
||
- ✅ **Manejador inteligente de límites de tasa** - ¡No más esperas indefinidas!
|
||
- Advertencia anticipada sobre límites de tasa (60/hora vs 5000/hora)
|
||
- Detección en tiempo real desde las respuestas de la API de GitHub
|
||
- Temporizadores de cuenta regresiva en vivo con progreso
|
||
- Cambio automático de perfil cuando se alcanza el límite
|
||
- Cuatro estrategias: prompt (preguntar), wait (cuenta regresiva), switch (cambiar a otro), fail (abortar)
|
||
- ✅ **Capacidad de reanudación** - Continúa trabajos interrumpidos
|
||
- Auto-guardado de progreso en intervalos configurables (predeterminado: 60 seg)
|
||
- Lista todos los trabajos reanudables con detalles de progreso
|
||
- Limpieza automática de trabajos antiguos (predeterminado: 7 días)
|
||
- ✅ **Soporte CI/CD** - Modo no interactivo para automatización
|
||
- Flag `--non-interactive` que falla rápidamente sin prompts
|
||
- Flag `--profile` para seleccionar una cuenta de GitHub específica
|
||
- Mensajes de error claros para logs de pipelines
|
||
|
||
**Configuración rápida:**
|
||
```bash
|
||
# Configuración única (5 minutos)
|
||
skill-seekers config --github
|
||
|
||
# Usar perfil específico para repos privados
|
||
skill-seekers github --repo mycompany/private-repo --profile work
|
||
|
||
# Modo CI/CD (fallo rápido, sin prompts)
|
||
skill-seekers github --repo owner/repo --non-interactive
|
||
|
||
# Reanudar trabajo interrumpido
|
||
skill-seekers resume --list
|
||
skill-seekers resume github_react_20260117_143022
|
||
```
|
||
|
||
**Estrategias de límite de tasa explicadas:**
|
||
- **prompt** (predeterminado) - Pregunta qué hacer cuando se alcanza el límite (esperar, cambiar, configurar token, cancelar)
|
||
- **wait** - Espera automáticamente con temporizador de cuenta regresiva (respeta el timeout)
|
||
- **switch** - Intenta automáticamente el siguiente perfil disponible (para configuraciones multi-cuenta)
|
||
- **fail** - Falla inmediatamente con error claro (perfecto para CI/CD)
|
||
|
||
### 🎯 Skill Bootstrap - Auto-alojamiento
|
||
|
||
Genera skill-seekers como un Claude Code Skill para usarlo dentro de Claude:
|
||
|
||
```bash
|
||
# Generar el skill
|
||
./scripts/bootstrap_skill.sh
|
||
|
||
# Instalar en Claude Code
|
||
cp -r output/skill-seekers ~/.claude/skills/
|
||
```
|
||
|
||
**Lo que obtienes:**
|
||
- ✅ **Documentación completa del skill** - Todos los comandos CLI y patrones de uso
|
||
- ✅ **Referencia de comandos CLI** - Cada herramienta y sus opciones documentadas
|
||
- ✅ **Ejemplos de inicio rápido** - Flujos de trabajo comunes y mejores prácticas
|
||
- ✅ **Documentación de API auto-generada** - Análisis de código, patrones y ejemplos
|
||
|
||
### 🔐 Repositorios de configuración privados
|
||
- ✅ **Fuentes de configuración basadas en Git** - Obtén configuraciones desde repositorios git privados/de equipo
|
||
- ✅ **Gestión multi-fuente** - Registra repositorios ilimitados de GitHub, GitLab, Bitbucket
|
||
- ✅ **Colaboración en equipo** - Comparte configuraciones personalizadas entre equipos de 3–5 personas
|
||
- ✅ **Soporte empresarial** - Escala a más de 500 desarrolladores con resolución basada en prioridad
|
||
- ✅ **Autenticación segura** - Tokens como variables de entorno (GITHUB_TOKEN, GITLAB_TOKEN)
|
||
- ✅ **Caché inteligente** - Clona una vez, obtiene actualizaciones automáticamente
|
||
- ✅ **Modo offline** - Trabaja con configuraciones en caché cuando no hay conexión
|
||
|
||
### 🤖 Análisis de código (C3.x)
|
||
|
||
**C3.4: Extracción de patrones de configuración con mejora por IA**
|
||
- ✅ **9 formatos de configuración** - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
|
||
- ✅ **7 tipos de patrones** - Configuraciones de base de datos, API, logging, caché, correo, autenticación, servidor
|
||
- ✅ **Mejora con IA** - Análisis IA opcional en modo dual (API + LOCAL)
|
||
- Explica qué hace cada configuración
|
||
- Sugiere mejores prácticas y mejoras
|
||
- **Análisis de seguridad** - Encuentra secretos codificados y credenciales expuestas
|
||
- ✅ **Auto-documentación** - Genera documentación JSON + Markdown de todas las configuraciones
|
||
- ✅ **Integración MCP** - Herramienta `extract_config_patterns` con soporte de mejora
|
||
|
||
**C3.3: Guías prácticas mejoradas con IA**
|
||
- ✅ **Mejora integral con IA** - Transforma guías básicas en tutoriales profesionales
|
||
- ✅ **5 mejoras automáticas** - Descripciones de pasos, solución de problemas, prerrequisitos, siguientes pasos, casos de uso
|
||
- ✅ **Soporte de modo dual** - Modo API (Claude API) o modo LOCAL (Claude Code CLI)
|
||
- ✅ **Sin costos con modo LOCAL** - Mejora GRATUITA usando tu plan Claude Code Max
|
||
- ✅ **Transformación de calidad** - Plantillas de 75 líneas → guías completas de más de 500 líneas
|
||
|
||
**Uso:**
|
||
```bash
|
||
# Análisis rápido (1–2 min, solo funciones básicas)
|
||
skill-seekers analyze --directory tests/ --quick
|
||
|
||
# Análisis completo con IA (20–60 min, todas las funciones)
|
||
skill-seekers analyze --directory tests/ --comprehensive
|
||
|
||
# Con mejora por IA
|
||
skill-seekers analyze --directory tests/ --enhance
|
||
```
|
||
|
||
**Documentación completa:** [docs/HOW_TO_GUIDES.md](docs/HOW_TO_GUIDES.md#ai-enhancement-new)
|
||
|
||
### 🔄 Presets de flujo de trabajo de mejora
|
||
|
||
Pipelines de mejora reutilizables definidos en YAML que controlan cómo la IA transforma tu documentación sin procesar en un skill pulido.
|
||
|
||
- ✅ **5 presets incluidos** — `default`, `minimal`, `security-focus`, `architecture-comprehensive`, `api-documentation`
|
||
- ✅ **Presets definidos por el usuario** — añade flujos personalizados a `~/.config/skill-seekers/workflows/`
|
||
- ✅ **Múltiples flujos de trabajo** — encadena dos o más flujos en un solo comando
|
||
- ✅ **CLI completamente gestionado** — lista, inspecciona, copia, añade, elimina y valida flujos de trabajo
|
||
|
||
```bash
|
||
# Aplicar un solo flujo de trabajo
|
||
skill-seekers create ./my-project --enhance-workflow security-focus
|
||
|
||
# Encadenar múltiples flujos de trabajo (se aplican en orden)
|
||
skill-seekers create ./my-project \
|
||
--enhance-workflow security-focus \
|
||
--enhance-workflow minimal
|
||
|
||
# Gestionar presets
|
||
skill-seekers workflows list # Listar todos (incluidos + usuario)
|
||
skill-seekers workflows show security-focus # Mostrar contenido YAML
|
||
skill-seekers workflows copy security-focus # Copiar al directorio de usuario para editar
|
||
skill-seekers workflows add ./my-workflow.yaml # Instalar un preset personalizado
|
||
skill-seekers workflows remove my-workflow # Eliminar un preset de usuario
|
||
skill-seekers workflows validate security-focus # Validar estructura del preset
|
||
|
||
# Copiar varios a la vez
|
||
skill-seekers workflows copy security-focus minimal api-documentation
|
||
|
||
# Añadir varios archivos a la vez
|
||
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml
|
||
|
||
# Eliminar varios a la vez
|
||
skill-seekers workflows remove my-wf-a my-wf-b
|
||
```
|
||
|
||
**Formato de preset YAML:**
|
||
```yaml
|
||
name: security-focus
|
||
description: "Revisión enfocada en seguridad: vulnerabilidades, autenticación, manejo de datos"
|
||
version: "1.0"
|
||
stages:
|
||
- name: vulnerabilities
|
||
type: custom
|
||
prompt: "Revisar el OWASP top 10 y vulnerabilidades de seguridad comunes..."
|
||
- name: auth-review
|
||
type: custom
|
||
prompt: "Examinar patrones de autenticación y autorización..."
|
||
uses_history: true
|
||
```
|
||
|
||
### ⚡ Rendimiento y escalabilidad
|
||
- ✅ **Modo asíncrono** - Extracción 2–3x más rápida con async/await (usa el flag `--async`)
|
||
- ✅ **Soporte para documentación grande** - Maneja documentos de 10K–40K+ páginas con división inteligente
|
||
- ✅ **Skills Router/Hub** - Enrutamiento inteligente hacia sub-skills especializados
|
||
- ✅ **Extracción en paralelo** - Procesa múltiples skills simultáneamente
|
||
- ✅ **Checkpoint/Reanudación** - Nunca pierdas progreso en extracciones largas
|
||
- ✅ **Sistema de caché** - Extrae una vez, reconstruye instantáneamente
|
||
|
||
### ✅ Garantía de calidad
|
||
- ✅ **Completamente probado** - Más de 2.540 tests con cobertura completa
|
||
|
||
---
|
||
|
||
## 📦 Instalación
|
||
|
||
```bash
|
||
# Instalación básica (extracción de documentación, análisis de GitHub, PDF, empaquetado)
|
||
pip install skill-seekers
|
||
|
||
# Con soporte para todas las plataformas LLM
|
||
pip install skill-seekers[all-llms]
|
||
|
||
# Con servidor MCP
|
||
pip install skill-seekers[mcp]
|
||
|
||
# Todo incluido
|
||
pip install skill-seekers[all]
|
||
```
|
||
|
||
**¿Necesitas ayuda para elegir?** Ejecuta el asistente de configuración:
|
||
```bash
|
||
skill-seekers-setup
|
||
```
|
||
|
||
### Opciones de instalación
|
||
|
||
| Instalación | Funcionalidades |
|
||
|-------------|-----------------|
|
||
| `pip install skill-seekers` | Extracción, análisis de GitHub, PDF, todas las plataformas |
|
||
| `pip install skill-seekers[gemini]` | + Soporte para Google Gemini |
|
||
| `pip install skill-seekers[openai]` | + Soporte para OpenAI ChatGPT |
|
||
| `pip install skill-seekers[all-llms]` | + Todas las plataformas LLM |
|
||
| `pip install skill-seekers[mcp]` | + Servidor MCP para Claude Code, Cursor, etc. |
|
||
| `pip install skill-seekers[video]` | + Extracción de transcripciones y metadatos de YouTube/Vimeo |
|
||
| `pip install skill-seekers[video-full]` | + Transcripción Whisper y extracción visual de fotogramas |
|
||
| `pip install skill-seekers[jupyter]` | + Soporte para Jupyter Notebook |
|
||
| `pip install skill-seekers[pptx]` | + Soporte para PowerPoint |
|
||
| `pip install skill-seekers[confluence]` | + Soporte para wiki de Confluence |
|
||
| `pip install skill-seekers[notion]` | + Soporte para páginas de Notion |
|
||
| `pip install skill-seekers[rss]` | + Soporte para feeds RSS/Atom |
|
||
| `pip install skill-seekers[chat]` | + Soporte para exportación de chat de Slack/Discord |
|
||
| `pip install skill-seekers[asciidoc]` | + Soporte para documentos AsciiDoc |
|
||
| `pip install skill-seekers[all]` | Todo habilitado |
|
||
|
||
> **Dependencias visuales para video (detección de GPU):** Después de instalar `skill-seekers[video-full]`, ejecuta
|
||
> `skill-seekers video --setup` para detectar automáticamente tu GPU e instalar la variante correcta de PyTorch
|
||
> + easyocr. Esta es la forma recomendada de instalar las dependencias de extracción visual.
|
||
|
||
---
|
||
|
||
## 🚀 Flujo de trabajo de instalación con un solo comando
|
||
|
||
**La forma más rápida de ir desde la configuración hasta el skill subido - automatización completa:**
|
||
|
||
```bash
|
||
# Instalar skill de React desde las configuraciones oficiales (se sube automáticamente a Claude)
|
||
skill-seekers install --config react
|
||
|
||
# Instalar desde archivo de configuración local
|
||
skill-seekers install --config configs/custom.json
|
||
|
||
# Instalar sin subir (solo empaquetar)
|
||
skill-seekers install --config django --no-upload
|
||
|
||
# Previsualizar flujo de trabajo sin ejecutar
|
||
skill-seekers install --config react --dry-run
|
||
```
|
||
|
||
**Tiempo:** 20–45 minutos en total | **Calidad:** Listo para producción (9/10) | **Costo:** Gratis
|
||
|
||
**Fases ejecutadas:**
|
||
```
|
||
📥 FASE 1: Obtener configuración (si se proporciona nombre de configuración)
|
||
📖 FASE 2: Extraer documentación
|
||
✨ FASE 3: Mejora con IA (OBLIGATORIA - sin opción de omitir)
|
||
📦 FASE 4: Empaquetar skill
|
||
☁️ FASE 5: Subir a Claude (opcional, requiere API key)
|
||
```
|
||
|
||
**Requisitos:**
|
||
- Variable de entorno ANTHROPIC_API_KEY (para subida automática)
|
||
- Plan Claude Code Max (para mejora local con IA)
|
||
|
||
---
|
||
|
||
## 📊 Matriz de funcionalidades
|
||
|
||
Skill Seekers soporta **12 plataformas LLM**, **17 tipos de fuentes** y paridad total de funcionalidades en todos los destinos.
|
||
|
||
**Plataformas:** Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown genérico, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
|
||
**Tipos de fuentes:** Sitios web de documentación, repos de GitHub, PDFs, Word (.docx), EPUB, Video, Bases de código locales, Jupyter Notebooks, HTML local, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), feeds RSS/Atom, páginas de manual, wikis de Confluence, páginas de Notion, exportaciones de chat de Slack/Discord
|
||
|
||
Consulta la [Matriz completa de funcionalidades](docs/FEATURE_MATRIX.md) para información detallada de soporte por plataforma y funcionalidad.
|
||
|
||
### Comparación rápida de plataformas
|
||
|
||
| Funcionalidad | Claude | Gemini | OpenAI | Markdown |
|
||
|---------------|--------|--------|--------|----------|
|
||
| Formato | ZIP + YAML | tar.gz | ZIP + Vector | ZIP |
|
||
| Carga | ✅ API | ✅ API | ✅ API | ❌ Manual |
|
||
| Mejora | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ❌ Ninguna |
|
||
| Todos los modos de skill | ✅ | ✅ | ✅ | ✅ |
|
||
|
||
---
|
||
|
||
## Ejemplos de uso
|
||
|
||
### Extracción de documentación
|
||
|
||
```bash
|
||
# Extraer sitio web de documentación
|
||
skill-seekers scrape --config configs/react.json
|
||
|
||
# Extracción rápida sin configuración
|
||
skill-seekers scrape --url https://react.dev --name react
|
||
|
||
# Con modo asíncrono (3x más rápido)
|
||
skill-seekers scrape --config configs/godot.json --async --workers 8
|
||
```
|
||
|
||
### Extracción de PDF
|
||
|
||
```bash
|
||
# Extracción básica de PDF
|
||
skill-seekers pdf --pdf docs/manual.pdf --name myskill
|
||
|
||
# Funciones avanzadas
|
||
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
|
||
--extract-tables \ # Extraer tablas
|
||
--parallel \ # Procesamiento paralelo rápido
|
||
--workers 8 # Usar 8 núcleos de CPU
|
||
|
||
# PDFs escaneados (requiere: pip install pytesseract Pillow)
|
||
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr
|
||
```
|
||
|
||
### Extracción de video
|
||
|
||
```bash
|
||
# Instalar soporte para video
|
||
pip install skill-seekers[video] # Transcripciones + metadatos
|
||
pip install skill-seekers[video-full] # + Whisper + extracción visual de fotogramas
|
||
|
||
# Detectar GPU automáticamente e instalar dependencias visuales (PyTorch + easyocr)
|
||
skill-seekers video --setup
|
||
|
||
# Extraer de video de YouTube
|
||
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial
|
||
|
||
# Extraer de una lista de reproducción de YouTube
|
||
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist
|
||
|
||
# Extraer de un archivo de video local
|
||
skill-seekers video --video-file recording.mp4 --name myrecording
|
||
|
||
# Extraer con análisis visual de fotogramas (requiere dependencias video-full)
|
||
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual
|
||
|
||
# Con mejora por IA (limpia OCR + genera SKILL.md pulido)
|
||
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2
|
||
|
||
# Recortar una sección específica de un video (soporta segundos, MM:SS, HH:MM:SS)
|
||
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00
|
||
|
||
# Usar Vision API para fotogramas OCR de baja confianza (requiere ANTHROPIC_API_KEY)
|
||
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr
|
||
|
||
# Reconstruir skill desde datos previamente extraídos (saltar descarga)
|
||
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial
|
||
```
|
||
|
||
> **Guía completa:** Consulta [docs/VIDEO_GUIDE.md](docs/VIDEO_GUIDE.md) para la referencia CLI completa,
|
||
> detalles del pipeline visual, opciones de mejora con IA y solución de problemas.
|
||
|
||
### Análisis de repositorios de GitHub
|
||
|
||
```bash
|
||
# Extracción básica de repositorio
|
||
skill-seekers github --repo facebook/react
|
||
|
||
# Con autenticación (límites de tasa más altos)
|
||
export GITHUB_TOKEN=ghp_your_token_here
|
||
skill-seekers github --repo facebook/react
|
||
|
||
# Personalizar qué incluir
|
||
skill-seekers github --repo django/django \
|
||
--include-issues \ # Extraer GitHub Issues
|
||
--max-issues 100 \ # Limitar cantidad de issues
|
||
--include-changelog # Extraer CHANGELOG.md
|
||
```
|
||
|
||
### Extracción unificada multi-fuente
|
||
|
||
**Combina documentación + GitHub + PDF en un solo skill unificado con detección de conflictos:**
|
||
|
||
```bash
|
||
# Usar configuraciones unificadas existentes
|
||
skill-seekers unified --config configs/react_unified.json
|
||
skill-seekers unified --config configs/django_unified.json
|
||
|
||
# O crear configuración unificada
|
||
cat > configs/myframework_unified.json << 'EOF'
|
||
{
|
||
"name": "myframework",
|
||
"merge_mode": "rule-based",
|
||
"sources": [
|
||
{
|
||
"type": "documentation",
|
||
"base_url": "https://docs.myframework.com/",
|
||
"max_pages": 200
|
||
},
|
||
{
|
||
"type": "github",
|
||
"repo": "owner/myframework",
|
||
"code_analysis_depth": "surface"
|
||
}
|
||
]
|
||
}
|
||
EOF
|
||
|
||
skill-seekers unified --config configs/myframework_unified.json
|
||
```
|
||
|
||
**La detección de conflictos encuentra automáticamente:**
|
||
- 🔴 **Falta en el código** (alto): Documentado pero no implementado
|
||
- 🟡 **Falta en la documentación** (medio): Implementado pero no documentado
|
||
- ⚠️ **Discrepancia de firma**: Parámetros/tipos diferentes
|
||
- ℹ️ **Discrepancia de descripción**: Explicaciones diferentes
|
||
|
||
**Guía completa:** Consulta [docs/UNIFIED_SCRAPING.md](docs/UNIFIED_SCRAPING.md) para documentación completa.
|
||
|
||
### Repositorios de configuración privados
|
||
|
||
**Comparte configuraciones personalizadas entre equipos usando repositorios git privados:**
|
||
|
||
```bash
|
||
# Opción 1: Usando herramientas MCP (recomendado)
|
||
# Registrar el repo privado de tu equipo
|
||
add_config_source(
|
||
name="team",
|
||
git_url="https://github.com/mycompany/skill-configs.git",
|
||
token_env="GITHUB_TOKEN"
|
||
)
|
||
|
||
# Obtener configuración del repo del equipo
|
||
fetch_config(source="team", config_name="internal-api")
|
||
```
|
||
|
||
**Plataformas soportadas:**
|
||
- GitHub (`GITHUB_TOKEN`), GitLab (`GITLAB_TOKEN`), Gitea (`GITEA_TOKEN`), Bitbucket (`BITBUCKET_TOKEN`)
|
||
|
||
**Guía completa:** Consulta [docs/GIT_CONFIG_SOURCES.md](docs/GIT_CONFIG_SOURCES.md) para documentación completa.
|
||
|
||
## Cómo funciona
|
||
|
||
```mermaid
|
||
graph LR
|
||
A[Sitio web de documentación] --> B[Skill Seekers]
|
||
B --> C[Scraper]
|
||
B --> D[Mejora con IA]
|
||
B --> E[Empaquetador]
|
||
C --> F[Referencias organizadas]
|
||
D --> F
|
||
F --> E
|
||
E --> G[Claude Skill .zip]
|
||
G --> H[Subir a Claude AI]
|
||
```
|
||
|
||
0. **Detectar llms.txt** - Primero verifica llms-full.txt, llms.txt, llms-small.txt
|
||
1. **Extraer**: Extrae todas las páginas de la documentación
|
||
2. **Categorizar**: Organiza el contenido en temas (API, guías, tutoriales, etc.)
|
||
3. **Mejorar**: La IA analiza los docs y crea un SKILL.md completo con ejemplos
|
||
4. **Empaquetar**: Agrupa todo en un archivo `.zip` listo para Claude
|
||
|
||
## 📋 Prerrequisitos
|
||
|
||
**Antes de empezar, asegúrate de tener:**
|
||
|
||
1. **Python 3.10 o superior** - [Descargar](https://www.python.org/downloads/) | Verificar: `python3 --version`
|
||
2. **Git** - [Descargar](https://git-scm.com/) | Verificar: `git --version`
|
||
3. **15–30 minutos** para la configuración inicial
|
||
|
||
**¿Primera vez?** → **[Empieza aquí: Guía de inicio rápido a prueba de fallos](BULLETPROOF_QUICKSTART.md)** 🎯
|
||
|
||
---
|
||
|
||
## 📤 Subir skills a Claude
|
||
|
||
Una vez empaquetado tu skill, necesitas subirlo a Claude:
|
||
|
||
### Opción 1: Subida automática (basada en API)
|
||
|
||
```bash
|
||
# Configurar tu API key (una sola vez)
|
||
export ANTHROPIC_API_KEY=sk-ant-...
|
||
|
||
# Empaquetar y subir automáticamente
|
||
skill-seekers package output/react/ --upload
|
||
|
||
# O subir un .zip existente
|
||
skill-seekers upload output/react.zip
|
||
```
|
||
|
||
### Opción 2: Subida manual (sin API Key)
|
||
|
||
```bash
|
||
# Empaquetar skill
|
||
skill-seekers package output/react/
|
||
# → Crea output/react.zip
|
||
|
||
# Luego subir manualmente:
|
||
# - Ve a https://claude.ai/skills
|
||
# - Haz clic en "Upload Skill"
|
||
# - Selecciona output/react.zip
|
||
```
|
||
|
||
### Opción 3: MCP (Claude Code)
|
||
|
||
```
|
||
En Claude Code, simplemente pide:
|
||
"Empaqueta y sube el skill de React"
|
||
```
|
||
|
||
---
|
||
|
||
## 🤖 Instalación en agentes de IA
|
||
|
||
Skill Seekers puede instalar automáticamente skills en 18 agentes de programación con IA.
|
||
|
||
```bash
|
||
# Instalar en un agente específico
|
||
skill-seekers install-agent output/react/ --agent cursor
|
||
|
||
# Instalar en todos los agentes a la vez
|
||
skill-seekers install-agent output/react/ --agent all
|
||
|
||
# Previsualizar sin instalar
|
||
skill-seekers install-agent output/react/ --agent cursor --dry-run
|
||
```
|
||
|
||
### Agentes soportados
|
||
|
||
| Agente | Ruta | Tipo |
|
||
|--------|------|------|
|
||
| **Claude Code** | `~/.claude/skills/` | Global |
|
||
| **Cursor** | `.cursor/skills/` | Proyecto |
|
||
| **VS Code / Copilot** | `.github/skills/` | Proyecto |
|
||
| **Amp** | `~/.amp/skills/` | Global |
|
||
| **Goose** | `~/.config/goose/skills/` | Global |
|
||
| **OpenCode** | `~/.opencode/skills/` | Global |
|
||
| **Windsurf** | `~/.windsurf/skills/` | Global |
|
||
| **Roo Code** | `.roo/skills/` | Proyecto |
|
||
| **Cline** | `.cline/skills/` | Proyecto |
|
||
| **Aider** | `~/.aider/skills/` | Global |
|
||
| **Bolt** | `.bolt/skills/` | Proyecto |
|
||
| **Kilo Code** | `.kilo/skills/` | Proyecto |
|
||
| **Continue** | `~/.continue/skills/` | Global |
|
||
| **Kimi Code** | `~/.kimi/skills/` | Global |
|
||
|
||
---
|
||
|
||
## 🔌 Integración MCP (26 herramientas)
|
||
|
||
Skill Seekers incluye un servidor MCP para usar desde Claude Code, Cursor, Windsurf, VS Code + Cline o IntelliJ IDEA.
|
||
|
||
```bash
|
||
# Modo stdio (Claude Code, VS Code + Cline)
|
||
python -m skill_seekers.mcp.server_fastmcp
|
||
|
||
# Modo HTTP (Cursor, Windsurf, IntelliJ)
|
||
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
|
||
|
||
# Auto-configurar todos los agentes a la vez
|
||
./setup_mcp.sh
|
||
```
|
||
|
||
**Las 26 herramientas disponibles:**
|
||
- **Core (9):** `list_configs`, `generate_config`, `validate_config`, `estimate_pages`, `scrape_docs`, `package_skill`, `upload_skill`, `enhance_skill`, `install_skill`
|
||
- **Extendidas (10):** `scrape_github`, `scrape_pdf`, `unified_scrape`, `merge_sources`, `detect_conflicts`, `add_config_source`, `fetch_config`, `list_config_sources`, `remove_config_source`, `split_config`
|
||
- **Bases de datos vectoriales (4):** `export_to_chroma`, `export_to_weaviate`, `export_to_faiss`, `export_to_qdrant`
|
||
- **Nube (3):** `cloud_upload`, `cloud_download`, `cloud_list`
|
||
|
||
**Guía completa:** [docs/MCP_SETUP.md](docs/MCP_SETUP.md)
|
||
|
||
---
|
||
|
||
## ⚙️ Configuración
|
||
|
||
### Presets disponibles (más de 24)
|
||
|
||
```bash
|
||
# Listar todos los presets
|
||
skill-seekers list-configs
|
||
```
|
||
|
||
| Categoría | Presets |
|
||
|-----------|---------|
|
||
| **Frameworks Web** | `react`, `vue`, `angular`, `svelte`, `nextjs` |
|
||
| **Python** | `django`, `flask`, `fastapi`, `sqlalchemy`, `pytest` |
|
||
| **Desarrollo de juegos** | `godot`, `pygame`, `unity` |
|
||
| **Herramientas y DevOps** | `docker`, `kubernetes`, `terraform`, `ansible` |
|
||
| **Unificados (Docs + GitHub)** | `react-unified`, `vue-unified`, `nextjs-unified` y más |
|
||
|
||
### Crear tu propia configuración
|
||
|
||
```bash
|
||
# Opción 1: Interactivo
|
||
skill-seekers scrape --interactive
|
||
|
||
# Opción 2: Copiar y editar un preset
|
||
cp configs/react.json configs/myframework.json
|
||
nano configs/myframework.json
|
||
skill-seekers scrape --config configs/myframework.json
|
||
```
|
||
|
||
### Estructura del archivo de configuración
|
||
|
||
```json
|
||
{
|
||
"name": "myframework",
|
||
"description": "Cuándo usar este skill",
|
||
"base_url": "https://docs.myframework.com/",
|
||
"selectors": {
|
||
"main_content": "article",
|
||
"title": "h1",
|
||
"code_blocks": "pre code"
|
||
},
|
||
"url_patterns": {
|
||
"include": ["/docs", "/guide"],
|
||
"exclude": ["/blog", "/about"]
|
||
},
|
||
"categories": {
|
||
"getting_started": ["intro", "quickstart"],
|
||
"api": ["api", "reference"]
|
||
},
|
||
"rate_limit": 0.5,
|
||
"max_pages": 500
|
||
}
|
||
```
|
||
|
||
### Dónde almacenar las configuraciones
|
||
|
||
La herramienta busca en este orden:
|
||
1. Ruta exacta proporcionada
|
||
2. `./configs/` (directorio actual)
|
||
3. `~/.config/skill-seekers/configs/` (directorio de configuración del usuario)
|
||
4. API de SkillSeekersWeb.com (configuraciones predefinidas)
|
||
|
||
---
|
||
|
||
## 📊 Lo que se crea
|
||
|
||
```
|
||
output/
|
||
├── godot_data/ # Datos sin procesar extraídos
|
||
│ ├── pages/ # Archivos JSON (uno por página)
|
||
│ └── summary.json # Resumen general
|
||
│
|
||
└── godot/ # El skill
|
||
├── SKILL.md # Mejorado con ejemplos reales
|
||
├── references/ # Docs categorizados
|
||
│ ├── index.md
|
||
│ ├── getting_started.md
|
||
│ ├── scripting.md
|
||
│ └── ...
|
||
├── scripts/ # Vacío (añade los tuyos)
|
||
└── assets/ # Vacío (añade los tuyos)
|
||
```
|
||
|
||
---
|
||
|
||
## 🐛 Solución de problemas
|
||
|
||
### ¿No se extrajo contenido?
|
||
- Verifica tu selector `main_content`
|
||
- Prueba con: `article`, `main`, `div[role="main"]`
|
||
|
||
### ¿Los datos existen pero no se usan?
|
||
```bash
|
||
# Forzar re-extracción
|
||
rm -rf output/myframework_data/
|
||
skill-seekers scrape --config configs/myframework.json
|
||
```
|
||
|
||
### ¿Categorías incorrectas?
|
||
Edita la sección `categories` de la configuración con mejores palabras clave.
|
||
|
||
### ¿Quieres actualizar la documentación?
|
||
```bash
|
||
# Eliminar datos antiguos y volver a extraer
|
||
rm -rf output/godot_data/
|
||
skill-seekers scrape --config configs/godot.json
|
||
```
|
||
|
||
### ¿La mejora no funciona?
|
||
```bash
|
||
# Verificar si la API key está configurada
|
||
echo $ANTHROPIC_API_KEY
|
||
|
||
# Probar modo LOCAL (usa Claude Code Max, no requiere API key)
|
||
skill-seekers enhance output/react/ --mode LOCAL
|
||
|
||
# Monitorear el estado de mejora en segundo plano
|
||
skill-seekers enhance-status output/react/ --watch
|
||
```
|
||
|
||
### ¿Problemas con límite de tasa de GitHub?
|
||
```bash
|
||
# Configurar un token de GitHub (5000 req/hora vs 60/hora anónimo)
|
||
export GITHUB_TOKEN=ghp_your_token_here
|
||
|
||
# O configurar múltiples perfiles
|
||
skill-seekers config --github
|
||
```
|
||
|
||
---
|
||
|
||
## 📈 Rendimiento
|
||
|
||
| Tarea | Tiempo | Notas |
|
||
|-------|--------|-------|
|
||
| Extracción (síncrona) | 15–45 min | Solo la primera vez, basado en hilos |
|
||
| Extracción (asíncrona) | 5–15 min | 2–3x más rápido con el flag `--async` |
|
||
| Construcción | 1–3 min | Reconstrucción rápida desde caché |
|
||
| Reconstrucción | <1 min | Con `--skip-scrape` |
|
||
| Mejora (LOCAL) | 30–60 seg | Usa Claude Code Max |
|
||
| Mejora (API) | 20–40 seg | Requiere API key |
|
||
| Video (transcripción) | 1–3 min | YouTube/local, solo transcripción |
|
||
| Video (visual) | 5–15 min | + Extracción de fotogramas OCR |
|
||
| Empaquetado | 5–10 seg | Creación del .zip final |
|
||
|
||
---
|
||
|
||
## 📚 Documentación
|
||
|
||
### Primeros pasos
|
||
- **[BULLETPROOF_QUICKSTART.md](BULLETPROOF_QUICKSTART.md)** - 🎯 **¡EMPIEZA AQUÍ si eres nuevo!**
|
||
- **[QUICKSTART.md](QUICKSTART.md)** - Inicio rápido para usuarios experimentados
|
||
- **[TROUBLESHOOTING.md](TROUBLESHOOTING.md)** - Problemas comunes y soluciones
|
||
- **[docs/QUICK_REFERENCE.md](docs/QUICK_REFERENCE.md)** - Hoja de referencia rápida
|
||
|
||
### Guías
|
||
- **[docs/LARGE_DOCUMENTATION.md](docs/LARGE_DOCUMENTATION.md)** - Manejar documentos de 10K–40K+ páginas
|
||
- **[ASYNC_SUPPORT.md](ASYNC_SUPPORT.md)** - Guía de modo asíncrono (2–3x más rápido)
|
||
- **[docs/ENHANCEMENT_MODES.md](docs/ENHANCEMENT_MODES.md)** - Guía de modos de mejora con IA
|
||
- **[docs/MCP_SETUP.md](docs/MCP_SETUP.md)** - Configuración de integración MCP
|
||
- **[docs/UNIFIED_SCRAPING.md](docs/UNIFIED_SCRAPING.md)** - Extracción multi-fuente
|
||
- **[docs/VIDEO_GUIDE.md](docs/VIDEO_GUIDE.md)** - Guía de extracción de video
|
||
|
||
### Guías de integración
|
||
- **[docs/integrations/LANGCHAIN.md](docs/integrations/LANGCHAIN.md)** - LangChain RAG
|
||
- **[docs/integrations/CURSOR.md](docs/integrations/CURSOR.md)** - Cursor IDE
|
||
- **[docs/integrations/WINDSURF.md](docs/integrations/WINDSURF.md)** - Windsurf IDE
|
||
- **[docs/integrations/CLINE.md](docs/integrations/CLINE.md)** - Cline (VS Code)
|
||
- **[docs/integrations/RAG_PIPELINES.md](docs/integrations/RAG_PIPELINES.md)** - Todos los pipelines RAG
|
||
|
||
---
|
||
|
||
## 📝 Licencia
|
||
|
||
Licencia MIT - consulta el archivo [LICENSE](LICENSE) para más detalles
|
||
|
||
---
|
||
|
||
¡Feliz construcción de skills! 🚀
|
||
|
||
---
|
||
|
||
## 🔒 Seguridad
|
||
|
||
[](https://mseep.ai/app/yusufkaraaslan-skill-seekers)
|