Not a Skill Seekers-specific repo — better suited for MCP docs section. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
50 KiB
Skill Seekers
English | 简体中文 | 日本語 | 한국어 | Español | Français | Deutsch | Português | Türkçe | العربية | हिन्दी | Русский
⚠️ Aviso de tradução automática
Este documento foi traduzido automaticamente por IA. Embora nos esforcemos para garantir a qualidade, podem existir expressões imprecisas.
Ajude a melhorar a tradução através do GitHub Issue #260! Seu feedback é muito valioso para nós.
🧠 A camada de dados para sistemas de IA. O Skill Seekers transforma sites de documentação, repositórios GitHub, PDFs, vídeos, Jupyter Notebooks, wikis e mais de 17 tipos de fontes em ativos de conhecimento estruturado — prontos para alimentar AI Skills (Claude, Gemini, OpenAI), pipelines RAG (LangChain, LlamaIndex, Pinecone) e assistentes de programação com IA (Cursor, Windsurf, Cline) em minutos, não horas.
🌐 Visite SkillSeekersWeb.com - Navegue por mais de 24 configurações predefinidas, compartilhe suas configurações e acesse a documentação completa!
📋 Veja o Roteiro de Desenvolvimento e Tarefas - 134 tarefas em 10 categorias, escolha qualquer uma para contribuir!
🌐 Ecossistema
Skill Seekers é um projeto multi-repositório. Aqui está onde tudo se encontra:
| Repositório | Descrição | Links |
|---|---|---|
| Skill_Seekers | CLI principal e servidor MCP (este repo) | PyPI |
| skillseekersweb | Website e documentação | Site |
| skill-seekers-configs | Repositório de configurações da comunidade | |
| skill-seekers-action | GitHub Action para CI/CD | |
| skill-seekers-plugin | Plugin Claude Code | |
| homebrew-skill-seekers | Homebrew tap para macOS |
Quer contribuir? Os repos do website e configurações são ótimos pontos de partida para novos contribuidores!
🧠 A Camada de Dados para Sistemas de IA
Skill Seekers é a camada universal de pré-processamento que fica entre a documentação bruta e todo sistema de IA que a consome. Seja para construir Claude Skills, um pipeline RAG com LangChain ou um arquivo .cursorrules para o Cursor — a preparação dos dados é idêntica. Faça uma vez e exporte para todos os destinos.
# Um comando → ativo de conhecimento estruturado
skill-seekers create https://docs.react.dev/
# ou: skill-seekers create facebook/react
# ou: skill-seekers create ./my-project
# Exporte para qualquer sistema de IA
skill-seekers package output/react --target claude # → Claude AI Skill (ZIP)
skill-seekers package output/react --target langchain # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor # → .cursorrules
O que é gerado
| Saída | Destino | Para que serve |
|---|---|---|
| Claude Skill (ZIP + YAML) | --target claude |
Claude Code, Claude API |
| Gemini Skill (tar.gz) | --target gemini |
Google Gemini |
| OpenAI / Custom GPT (ZIP) | --target openai |
GPT-4o, assistentes personalizados |
| LangChain Documents | --target langchain |
Cadeias de QA, agentes, recuperadores |
| LlamaIndex TextNodes | --target llama-index |
Motores de consulta, motores de chat |
| Haystack Documents | --target haystack |
Pipelines RAG empresariais |
| Pinecone-ready (Markdown) | --target markdown |
Upload de vetores |
| ChromaDB / FAISS / Qdrant | --format chroma/faiss/qdrant |
Bancos de dados vetoriais locais |
Cursor .cursorrules |
--target claude → copiar |
Contexto de IA do Cursor IDE |
| Windsurf / Cline / Continue | --target claude → copiar |
VS Code, IntelliJ, Vim |
Por que isso importa
- ⚡ 99% mais rápido — Dias de preparação manual de dados → 15–45 minutos
- 🎯 Qualidade de AI Skill — Arquivos SKILL.md com mais de 500 linhas com exemplos, padrões e guias
- 📊 Chunks prontos para RAG — Chunking inteligente que preserva blocos de código e mantém o contexto
- 🎬 Vídeos — Extraia código, transcrições e conhecimento estruturado do YouTube e vídeos locais
- 🔄 Multi-fonte — Combine 17 tipos de fontes (docs, GitHub, PDFs, vídeos, notebooks, wikis e mais) em um único ativo de conhecimento
- 🌐 Uma preparação, todos os destinos — Exporte o mesmo ativo para 16 plataformas sem precisar recoletá-lo
- ✅ Testado em batalha — Mais de 2.540 testes, mais de 24 presets de frameworks, pronto para produção
🚀 Início Rápido (3 Comandos)
# 1. Instalar
pip install skill-seekers
# 2. Criar skill a partir de qualquer fonte
skill-seekers create https://docs.django.com/
# 3. Empacotar para sua plataforma de IA
skill-seekers package output/django --target claude
Pronto! Agora você tem output/django-claude.zip pronto para usar.
Outras Fontes (17 Suportadas)
# Repositório GitHub
skill-seekers create facebook/react
# Projeto local
skill-seekers create ./my-project
# Documento PDF
skill-seekers create manual.pdf
# Documento Word
skill-seekers create report.docx
# E-book EPUB
skill-seekers create book.epub
# Jupyter Notebook
skill-seekers create notebook.ipynb
# Especificação OpenAPI
skill-seekers create openapi.yaml
# Apresentação PowerPoint
skill-seekers create presentation.pptx
# Documento AsciiDoc
skill-seekers create guide.adoc
# Arquivo HTML local
skill-seekers create page.html
# Feed RSS/Atom
skill-seekers create feed.rss
# Man page
skill-seekers create curl.1
# Vídeo (YouTube, Vimeo ou arquivo local — requer skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# Primeira vez? Instale automaticamente as dependências visuais com detecção de GPU:
skill-seekers video --setup
# Wiki Confluence
skill-seekers confluence --space TEAM --name wiki
# Páginas Notion
skill-seekers notion --database-id ... --name docs
# Exportação de chat Slack/Discord
skill-seekers chat --export-dir ./slack-export --name team-chat
Exporte para Qualquer Lugar
# Empacote para múltiplas plataformas
for platform in claude gemini openai langchain; do
skill-seekers package output/django --target $platform
done
O que é o Skill Seekers?
O Skill Seekers é a camada de dados para sistemas de IA. Ele transforma 17 tipos de fontes — sites de documentação, repositórios GitHub, PDFs, vídeos, Jupyter Notebooks, documentos Word/EPUB/AsciiDoc, especificações OpenAPI, apresentações PowerPoint, feeds RSS, man pages, wikis Confluence, páginas Notion, exportações Slack/Discord e mais — em ativos de conhecimento estruturado para qualquer destino de IA:
| Caso de Uso | O que você obtém | Exemplos |
|---|---|---|
| AI Skills | SKILL.md abrangente + referências | Claude Code, Gemini, GPT |
| Pipelines RAG | Documentos fragmentados com metadados ricos | LangChain, LlamaIndex, Haystack |
| Bancos de Dados Vetoriais | Dados pré-formatados prontos para upload | Pinecone, Chroma, Weaviate, FAISS |
| Assistentes de Programação com IA | Arquivos de contexto que sua IDE lê automaticamente | Cursor, Windsurf, Cline, Continue.dev |
O Skill Seekers substitui dias de pré-processamento manual com os seguintes passos:
- Coleta — Docs, repositórios GitHub, bases de código locais, PDFs, vídeos, Jupyter Notebooks, wikis e mais de 17 tipos de fontes
- Análise — Parsing AST profundo, detecção de padrões, extração de APIs
- Estruturação — Arquivos de referência categorizados com metadados
- Aprimoramento — Geração de SKILL.md com IA (Claude, Gemini ou local)
- Exportação — 16 formatos específicos por plataforma a partir de um único ativo
Por que Usar o Skill Seekers?
Para Construtores de AI Skills (Claude, Gemini, OpenAI)
- 🎯 Skills de nível de produção — Arquivos SKILL.md com mais de 500 linhas com exemplos de código, padrões e guias
- 🔄 Workflows de aprimoramento — Aplique
security-focus,architecture-comprehensiveou presets YAML personalizados - 🎮 Qualquer domínio — Motores de jogos (Godot, Unity), frameworks (React, Django), ferramentas internas
- 🔧 Equipes — Combine documentação interna + código em uma única fonte da verdade
- 📚 Qualidade — Aprimorado por IA com exemplos, referência rápida e orientação de navegação
Para Construtores de RAG e Engenheiros de IA
- 🤖 Dados prontos para RAG —
DocumentsLangChain,TextNodesLlamaIndex,DocumentsHaystack pré-fragmentados - 🚀 99% mais rápido — Dias de pré-processamento → 15–45 minutos
- 📊 Metadados inteligentes — Categorias, fontes, tipos → melhor precisão de recuperação
- 🔄 Multi-fonte — Combine docs + GitHub + PDFs + vídeos em um pipeline
- 🌐 Agnóstico de plataforma — Exporte para qualquer banco vetorial ou framework sem recoleta
Para Usuários de Assistentes de Programação com IA
- 💻 Cursor / Windsurf / Cline — Gere
.cursorrules/.windsurfrules/.clinerulesautomaticamente - 🎯 Contexto persistente — A IA "conhece" seus frameworks sem prompts repetidos
- 📚 Sempre atualizado — Atualize o contexto em minutos quando a documentação mudar
Funcionalidades Principais
🌐 Coleta de Documentação
- ✅ Suporte a llms.txt - Detecta e usa automaticamente arquivos de documentação prontos para LLM (10x mais rápido)
- ✅ Scraper Universal - Funciona com QUALQUER site de documentação
- ✅ Categorização Inteligente - Organiza conteúdo automaticamente por tópico
- ✅ Detecção de Linguagem de Código - Reconhece Python, JavaScript, C++, GDScript, etc.
- ✅ Mais de 24 Presets Prontos - Godot, React, Vue, Django, FastAPI e mais
📄 Suporte a PDF
- ✅ Extração Básica de PDF - Extraia texto, código e imagens de arquivos PDF
- ✅ OCR para PDFs Digitalizados - Extraia texto de documentos digitalizados
- ✅ PDFs Protegidos por Senha - Processe PDFs criptografados
- ✅ Extração de Tabelas - Extraia tabelas complexas de PDFs
- ✅ Processamento Paralelo - 3x mais rápido para PDFs grandes
- ✅ Cache Inteligente - 50% mais rápido em re-execuções
🎬 Extração de Vídeo
- ✅ YouTube e Vídeos Locais - Extraia transcrições, código na tela e conhecimento estruturado de vídeos
- ✅ Análise Visual de Frames - Extração OCR de editores de código, terminais, slides e diagramas
- ✅ Detecção Automática de GPU - Instala automaticamente a versão correta do PyTorch (CUDA/ROCm/MPS/CPU)
- ✅ Aprimoramento com IA - Dois passes: limpeza de artefatos OCR + geração de SKILL.md polido
- ✅ Recorte Temporal - Extraia seções específicas com
--start-timee--end-time - ✅ Suporte a Playlists - Processe em lote todos os vídeos de uma playlist do YouTube
- ✅ Fallback com Vision API - Use Claude Vision para frames OCR de baixa confiança
🐙 Análise de Repositórios GitHub
- ✅ Análise Profunda de Código - Parsing AST para Python, JavaScript, TypeScript, Java, C++, Go
- ✅ Extração de API - Funções, classes, métodos com parâmetros e tipos
- ✅ Metadados do Repositório - README, árvore de arquivos, distribuição de linguagens, stars/forks
- ✅ GitHub Issues e PRs - Obtenha issues abertas/fechadas com labels e milestones
- ✅ CHANGELOG e Releases - Extração automática do histórico de versões
- ✅ Detecção de Conflitos - Compare APIs documentadas vs implementação real do código
- ✅ Integração MCP - Linguagem natural: "Colete o repositório GitHub facebook/react"
🔄 Coleta Unificada Multi-Fonte
- ✅ Combine Múltiplas Fontes - Misture documentação + GitHub + PDF em uma skill
- ✅ Detecção de Conflitos - Encontra automaticamente discrepâncias entre docs e código
- ✅ Mesclagem Inteligente - Resolução de conflitos baseada em regras ou com IA
- ✅ Relatórios Transparentes - Comparação lado a lado com avisos ⚠️
- ✅ Análise de Lacunas na Documentação - Identifica docs desatualizadas e funcionalidades não documentadas
- ✅ Fonte Única da Verdade - Uma skill mostrando tanto a intenção (docs) quanto a realidade (código)
- ✅ Retrocompatível - Configurações legadas de fonte única continuam funcionando
🤖 Suporte a Múltiplas Plataformas LLM
- ✅ 12 Plataformas LLM - Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown Genérico, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
- ✅ Coleta Universal - A mesma documentação funciona para todas as plataformas
- ✅ Empacotamento Específico por Plataforma - Formatos otimizados para cada LLM
- ✅ Exportação com Um Comando - Flag
--targetseleciona a plataforma - ✅ Dependências Opcionais - Instale apenas o que precisa
- ✅ 100% Retrocompatível - Workflows existentes do Claude permanecem inalterados
| Plataforma | Formato | Upload | Aprimoramento | API Key | Endpoint Personalizado |
|---|---|---|---|---|---|
| Claude AI | ZIP + YAML | ✅ Automático | ✅ Sim | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
| Google Gemini | tar.gz | ✅ Automático | ✅ Sim | GOOGLE_API_KEY | - |
| OpenAI ChatGPT | ZIP + Vector Store | ✅ Automático | ✅ Sim | OPENAI_API_KEY | - |
| Markdown Genérico | ZIP | ❌ Manual | ❌ Não | - | - |
# Claude (padrão - sem alterações necessárias!)
skill-seekers package output/react/
skill-seekers upload react.zip
# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini
# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai
# Markdown Genérico (exportação universal)
skill-seekers package output/react/ --target markdown
# Use os arquivos markdown diretamente em qualquer LLM
🔧 Variáveis de Ambiente para APIs Compatíveis com Claude (ex.: GLM-4.7)
O Skill Seekers suporta qualquer endpoint de API compatível com Claude:
# Opção 1: API oficial da Anthropic (padrão)
export ANTHROPIC_API_KEY=sk-ant-...
# Opção 2: API compatível com Claude GLM-4.7
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1
# Todas as funcionalidades de aprimoramento com IA usarão o endpoint configurado
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance
Nota: Configurar ANTHROPIC_BASE_URL permite que você use qualquer endpoint de API compatível com Claude, como GLM-4.7 ou outros serviços compatíveis.
Instalação:
# Instalar com suporte ao Gemini
pip install skill-seekers[gemini]
# Instalar com suporte ao OpenAI
pip install skill-seekers[openai]
# Instalar com todas as plataformas LLM
pip install skill-seekers[all-llms]
🔗 Integrações com Frameworks RAG
-
✅ LangChain Documents - Exportação direta para formato
Documentcompage_content+ metadados- Ideal para: Cadeias de QA, recuperadores, armazenamentos vetoriais, agentes
- Exemplo: Pipeline RAG LangChain
- Guia: Integração LangChain
-
✅ LlamaIndex TextNodes - Exportação para formato
TextNodecom IDs únicos + embeddings- Ideal para: Motores de consulta, motores de chat, contexto de armazenamento
- Exemplo: Motor de Consulta LlamaIndex
- Guia: Integração LlamaIndex
-
✅ Formato Pinecone-Ready - Otimizado para upload em bancos de dados vetoriais
- Ideal para: Busca vetorial em produção, busca semântica, busca híbrida
- Exemplo: Upload Pinecone
- Guia: Integração Pinecone
Exportação Rápida:
# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json
# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json
# Markdown (Universal)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/
Guia Completo de Pipeline RAG: Documentação de Pipelines RAG
🧠 Integrações com Assistentes de Programação com IA
Transforme qualquer documentação de framework em contexto especializado de programação para mais de 4 assistentes de IA:
-
✅ Cursor IDE - Gere
.cursorrulespara sugestões de código com IA- Ideal para: Geração de código específica de framework, padrões consistentes
- Funciona com: Cursor IDE (fork do VS Code)
- Guia: Integração Cursor
- Exemplo: Cursor React Skill
-
✅ Windsurf - Personalize o contexto do assistente de IA do Windsurf com
.windsurfrules- Ideal para: Assistência de IA nativa na IDE, programação baseada em fluxo
- Funciona com: Windsurf IDE da Codeium
- Guia: Integração Windsurf
- Exemplo: Contexto FastAPI Windsurf
-
✅ Cline (VS Code) - Prompts de sistema + MCP para agente VS Code
- Ideal para: Geração de código agentiva no VS Code
- Funciona com: Extensão Cline para VS Code
- Guia: Integração Cline
- Exemplo: Assistente Django Cline
-
✅ Continue.dev - Servidores de contexto para IA agnóstica de IDE
- Ideal para: Ambientes multi-IDE (VS Code, JetBrains, Vim), provedores de LLM personalizados
- Funciona com: Qualquer IDE com plugin Continue.dev
- Guia: Integração Continue
- Exemplo: Contexto Universal Continue
Exportação Rápida para Ferramentas de Programação com IA:
# Para qualquer assistente de programação com IA (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude # ou --target markdown
# Copie para seu projeto (exemplo para Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules
# Ou para Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md
# Ou para Cline
cp output/django-claude/SKILL.md my-project/.clinerules
# Ou para Continue.dev (servidor HTTP)
python examples/continue-dev-universal/context_server.py
# Configure em ~/.continue/config.json
Hub de Integrações: Todas as Integrações com Sistemas de IA
🌊 Arquitetura GitHub de Três Fluxos
- ✅ Análise em Três Fluxos - Divide repositórios GitHub em fluxos de Código, Docs e Insights
- ✅ Analisador de Codebase Unificado - Funciona com URLs do GitHub E caminhos locais
- ✅ C3.x como Profundidade de Análise - Escolha 'basic' (1-2 min) ou 'c3x' (20-60 min)
- ✅ Geração Aprimorada de Router - Metadados do GitHub, quick start do README, problemas comuns
- ✅ Integração de Issues - Principais problemas e soluções dos GitHub Issues
- ✅ Keywords de Roteamento Inteligente - Labels do GitHub com peso 2x para melhor detecção de tópicos
Explicação dos Três Fluxos:
- Fluxo 1: Código - Análise profunda C3.x (padrões, exemplos, guias, configs, arquitetura)
- Fluxo 2: Docs - Documentação do repositório (README, CONTRIBUTING, docs/*.md)
- Fluxo 3: Insights - Conhecimento da comunidade (issues, labels, stars, forks)
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer
# Analise repositório GitHub com os três fluxos
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
source="https://github.com/facebook/react",
depth="c3x", # ou "basic" para análise rápida
fetch_github_metadata=True
)
# Acesse o fluxo de código (análise C3.x)
print(f"Padrões de design: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Exemplos de teste: {result.code_analysis['c3_2_examples_count']}")
# Acesse o fluxo de docs (documentação do repositório)
print(f"README: {result.github_docs['readme'][:100]}")
# Acesse o fluxo de insights (metadados do GitHub)
print(f"Stars: {result.github_insights['metadata']['stars']}")
print(f"Problemas comuns: {len(result.github_insights['common_problems'])}")
Documentação completa: Resumo da Implementação de Três Fluxos
🔐 Gerenciamento Inteligente de Rate Limit e Configuração
- ✅ Sistema de Configuração Multi-Token - Gerencie múltiplas contas GitHub (pessoal, trabalho, OSS)
- Armazenamento seguro de configurações em
~/.config/skill-seekers/config.json(permissões 600) - Estratégias de rate limit por perfil:
prompt,wait,switch,fail - Timeout configurável por perfil (padrão: 30 min, evita esperas indefinidas)
- Cadeia de fallback inteligente: Argumento CLI → Variável de ambiente → Arquivo de configuração → Prompt
- Gerenciamento de API keys para Claude, Gemini, OpenAI
- Armazenamento seguro de configurações em
- ✅ Assistente de Configuração Interativo - Interface de terminal elegante para fácil configuração
- Integração com navegador para criação de tokens (abre automaticamente GitHub, etc.)
- Validação de tokens e teste de conexão
- Exibição visual de status com código de cores
- ✅ Gerenciador Inteligente de Rate Limit - Chega de esperas indefinidas!
- Aviso prévio sobre rate limits (60/hora vs 5000/hora)
- Detecção em tempo real das respostas da API do GitHub
- Contadores regressivos ao vivo com progresso
- Troca automática de perfil quando limitado
- Quatro estratégias: prompt (perguntar), wait (contagem regressiva), switch (tentar outro), fail (abortar)
- ✅ Capacidade de Retomada - Continue trabalhos interrompidos
- Salvamento automático de progresso em intervalos configuráveis (padrão: 60 seg)
- Liste todos os trabalhos retomáveis com detalhes de progresso
- Limpeza automática de trabalhos antigos (padrão: 7 dias)
- ✅ Suporte CI/CD - Modo não interativo para automação
- Flag
--non-interactivefalha rapidamente sem prompts - Flag
--profilepara selecionar conta GitHub específica - Mensagens de erro claras para logs de pipeline
- Flag
Configuração Rápida:
# Configuração única (5 minutos)
skill-seekers config --github
# Use perfil específico para repos privados
skill-seekers github --repo mycompany/private-repo --profile work
# Modo CI/CD (falha rápida, sem prompts)
skill-seekers github --repo owner/repo --non-interactive
# Retomar trabalho interrompido
skill-seekers resume --list
skill-seekers resume github_react_20260117_143022
Estratégias de Rate Limit Explicadas:
- prompt (padrão) - Pergunta o que fazer quando limitado (esperar, trocar, configurar token, cancelar)
- wait - Espera automaticamente com contador regressivo (respeita timeout)
- switch - Tenta automaticamente o próximo perfil disponível (para configurações multi-conta)
- fail - Falha imediatamente com erro claro (ideal para CI/CD)
🎯 Bootstrap Skill - Auto-Hospedagem
Gere o skill-seekers como uma Claude Code Skill para uso dentro do Claude:
# Gere a skill
./scripts/bootstrap_skill.sh
# Instale no Claude Code
cp -r output/skill-seekers ~/.claude/skills/
O que você obtém:
- ✅ Documentação completa da skill - Todos os comandos CLI e padrões de uso
- ✅ Referência de comandos CLI - Cada ferramenta e suas opções documentadas
- ✅ Exemplos de início rápido - Workflows comuns e melhores práticas
- ✅ Documentação de API auto-gerada - Análise de código, padrões e exemplos
🔐 Repositórios Privados de Configuração
- ✅ Fontes de Config Baseadas em Git - Busque configs de repositórios Git privados/de equipe
- ✅ Gerenciamento Multi-Fonte - Registre repositórios ilimitados do GitHub, GitLab, Bitbucket
- ✅ Colaboração em Equipe - Compartilhe configs personalizadas entre equipes de 3-5 pessoas
- ✅ Suporte Empresarial - Escale para mais de 500 desenvolvedores com resolução baseada em prioridade
- ✅ Autenticação Segura - Tokens em variáveis de ambiente (GITHUB_TOKEN, GITLAB_TOKEN)
- ✅ Cache Inteligente - Clone uma vez, receba atualizações automaticamente
- ✅ Modo Offline - Trabalhe com configs em cache quando estiver offline
🤖 Análise de Codebase (C3.x)
C3.4: Extração de Padrões de Configuração com Aprimoramento por IA
- ✅ 9 Formatos de Config - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
- ✅ 7 Tipos de Padrão - Banco de dados, API, logging, cache, e-mail, autenticação, configurações de servidor
- ✅ Aprimoramento por IA - Análise de IA opcional em modo duplo (API + LOCAL)
- Explica o que cada config faz
- Sugere melhores práticas e melhorias
- Análise de segurança - Encontra segredos hardcoded, credenciais expostas
- ✅ Auto-Documentação - Gera documentação JSON + Markdown de todas as configs
- ✅ Integração MCP - Ferramenta
extract_config_patternscom suporte a aprimoramento
C3.3: Guias How-To Aprimorados por IA
- ✅ Aprimoramento Abrangente por IA - Transforma guias básicos em tutoriais profissionais
- ✅ 5 Melhorias Automáticas - Descrições de etapas, troubleshooting, pré-requisitos, próximos passos, casos de uso
- ✅ Suporte Dual-Mode - Modo API (Claude API) ou modo LOCAL (Claude Code CLI)
- ✅ Sem Custo com Modo LOCAL - Aprimoramento GRATUITO usando seu plano Claude Code Max
- ✅ Transformação de Qualidade - Templates de 75 linhas → guias abrangentes de mais de 500 linhas
Uso:
# Análise rápida (1-2 min, apenas funcionalidades básicas)
skill-seekers analyze --directory tests/ --quick
# Análise abrangente com IA (20-60 min, todas as funcionalidades)
skill-seekers analyze --directory tests/ --comprehensive
# Com aprimoramento por IA
skill-seekers analyze --directory tests/ --enhance
Documentação Completa: docs/HOW_TO_GUIDES.md
🔄 Presets de Workflow de Aprimoramento
Pipelines de aprimoramento reutilizáveis definidos em YAML que controlam como a IA transforma sua documentação bruta em uma skill polida.
- ✅ 5 Presets Incluídos —
default,minimal,security-focus,architecture-comprehensive,api-documentation - ✅ Presets Definidos pelo Usuário — Adicione workflows personalizados em
~/.config/skill-seekers/workflows/ - ✅ Múltiplos Workflows — Encadeie dois ou mais workflows em um comando
- ✅ CLI Totalmente Gerenciada — Liste, inspecione, copie, adicione, remova e valide workflows
# Aplique um único workflow
skill-seekers create ./my-project --enhance-workflow security-focus
# Encadeie múltiplos workflows (aplicados em ordem)
skill-seekers create ./my-project \
--enhance-workflow security-focus \
--enhance-workflow minimal
# Gerencie presets
skill-seekers workflows list # Liste todos (incluídos + usuário)
skill-seekers workflows show security-focus # Exiba conteúdo YAML
skill-seekers workflows copy security-focus # Copie para diretório do usuário para edição
skill-seekers workflows add ./my-workflow.yaml # Instale um preset personalizado
skill-seekers workflows remove my-workflow # Remova um preset do usuário
skill-seekers workflows validate security-focus # Valide a estrutura do preset
# Copie múltiplos de uma vez
skill-seekers workflows copy security-focus minimal api-documentation
# Adicione múltiplos arquivos de uma vez
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml
# Remova múltiplos de uma vez
skill-seekers workflows remove my-wf-a my-wf-b
Formato de preset YAML:
name: security-focus
description: "Revisão focada em segurança: vulnerabilidades, autenticação, tratamento de dados"
version: "1.0"
stages:
- name: vulnerabilities
type: custom
prompt: "Revise vulnerabilidades OWASP top 10 e vulnerabilidades de segurança comuns..."
- name: auth-review
type: custom
prompt: "Examine padrões de autenticação e autorização..."
uses_history: true
⚡ Performance e Escalabilidade
- ✅ Modo Assíncrono - Coleta 2-3x mais rápida com async/await (use a flag
--async) - ✅ Suporte a Documentações Grandes - Processe docs de 10K-40K+ páginas com divisão inteligente
- ✅ Skills Router/Hub - Roteamento inteligente para sub-skills especializadas
- ✅ Coleta Paralela - Processe múltiplas skills simultaneamente
- ✅ Checkpoint/Retomada - Nunca perca progresso em coletas longas
- ✅ Sistema de Cache - Colete uma vez, reconstrua instantaneamente
✅ Garantia de Qualidade
- ✅ Totalmente Testado - Mais de 2.540 testes com cobertura abrangente
📦 Instalação
# Instalação básica (coleta de documentação, análise GitHub, PDF, empacotamento)
pip install skill-seekers
# Com suporte a todas as plataformas LLM
pip install skill-seekers[all-llms]
# Com servidor MCP
pip install skill-seekers[mcp]
# Tudo incluído
pip install skill-seekers[all]
Precisa de ajuda para escolher? Execute o assistente de configuração:
skill-seekers-setup
Opções de Instalação
| Instalação | Funcionalidades |
|---|---|
pip install skill-seekers |
Coleta, análise GitHub, PDF, todas as plataformas |
pip install skill-seekers[gemini] |
+ Suporte ao Google Gemini |
pip install skill-seekers[openai] |
+ Suporte ao OpenAI ChatGPT |
pip install skill-seekers[all-llms] |
+ Todas as plataformas LLM |
pip install skill-seekers[mcp] |
+ Servidor MCP para Claude Code, Cursor, etc. |
pip install skill-seekers[video] |
+ Extração de transcrições e metadados do YouTube/Vimeo |
pip install skill-seekers[video-full] |
+ Transcrição Whisper e extração visual de frames |
pip install skill-seekers[jupyter] |
+ Suporte a Jupyter Notebook |
pip install skill-seekers[pptx] |
+ Suporte a PowerPoint |
pip install skill-seekers[confluence] |
+ Suporte a wiki Confluence |
pip install skill-seekers[notion] |
+ Suporte a páginas Notion |
pip install skill-seekers[rss] |
+ Suporte a feeds RSS/Atom |
pip install skill-seekers[chat] |
+ Suporte a exportação de chat Slack/Discord |
pip install skill-seekers[asciidoc] |
+ Suporte a documentos AsciiDoc |
pip install skill-seekers[all] |
Tudo habilitado |
Dependências visuais de vídeo (detecção de GPU): Após instalar
skill-seekers[video-full], executeskill-seekers video --setuppara detectar automaticamente sua GPU e instalar a variante correta do PyTorch + easyocr. Esta é a forma recomendada de instalar as dependências de extração visual.
🚀 Workflow de Instalação com Um Comando
A forma mais rápida de ir da configuração à skill enviada — automação completa:
# Instale a skill React a partir das configs oficiais (upload automático para o Claude)
skill-seekers install --config react
# Instale a partir de arquivo de configuração local
skill-seekers install --config configs/custom.json
# Instale sem fazer upload (apenas empacotar)
skill-seekers install --config django --no-upload
# Visualize o workflow sem executar
skill-seekers install --config react --dry-run
Tempo: 20-45 minutos no total | Qualidade: Pronto para produção (9/10) | Custo: Gratuito
Fases executadas:
📥 FASE 1: Buscar Configuração (se nome da config for fornecido)
📖 FASE 2: Coletar Documentação
✨ FASE 3: Aprimoramento com IA (OBRIGATÓRIO - sem opção de pular)
📦 FASE 4: Empacotar Skill
☁️ FASE 5: Upload para o Claude (opcional, requer API key)
Requisitos:
- Variável de ambiente ANTHROPIC_API_KEY (para upload automático)
- Plano Claude Code Max (para aprimoramento com IA local)
📊 Matriz de Funcionalidades
O Skill Seekers suporta 12 plataformas LLM, 17 tipos de fontes e paridade completa de funcionalidades em todos os destinos.
Plataformas: Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, Markdown Genérico, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI Tipos de Fontes: Sites de documentação, repositórios GitHub, PDFs, Word (.docx), EPUB, Vídeo, Codebases locais, Jupyter Notebooks, HTML local, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), feeds RSS/Atom, Man pages, wikis Confluence, páginas Notion, exportações de chat Slack/Discord
Consulte a Matriz Completa de Funcionalidades para suporte detalhado por plataforma e funcionalidade.
Comparação Rápida de Plataformas
| Funcionalidade | Claude | Gemini | OpenAI | Markdown |
|---|---|---|---|---|
| Formato | ZIP + YAML | tar.gz | ZIP + Vector | ZIP |
| Upload | ✅ API | ✅ API | ✅ API | ❌ Manual |
| Aprimoramento | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ❌ Nenhum |
| Todos os Modos de Skill | ✅ | ✅ | ✅ | ✅ |
Exemplos de Uso
Coleta de Documentação
# Coletar site de documentação
skill-seekers scrape --config configs/react.json
# Coleta rápida sem configuração
skill-seekers scrape --url https://react.dev --name react
# Com modo assíncrono (3x mais rápido)
skill-seekers scrape --config configs/godot.json --async --workers 8
Extração de PDF
# Extração básica de PDF
skill-seekers pdf --pdf docs/manual.pdf --name myskill
# Funcionalidades avançadas
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
--extract-tables \ # Extrair tabelas
--parallel \ # Processamento paralelo rápido
--workers 8 # Usar 8 núcleos de CPU
# PDFs digitalizados (requer: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr
Extração de Vídeo
# Instalar suporte a vídeo
pip install skill-seekers[video] # Transcrições + metadados
pip install skill-seekers[video-full] # + Whisper + extração visual de frames
# Detectar GPU automaticamente e instalar dependências visuais (PyTorch + easyocr)
skill-seekers video --setup
# Extrair de vídeo do YouTube
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial
# Extrair de uma playlist do YouTube
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist
# Extrair de um arquivo de vídeo local
skill-seekers video --video-file recording.mp4 --name myrecording
# Extrair com análise visual de frames (requer dependências video-full)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual
# Com aprimoramento por IA (limpa OCR + gera SKILL.md polido)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2
# Recortar seção específica de um vídeo (suporta segundos, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00
# Usar Vision API para frames OCR de baixa confiança (requer ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr
# Reconstruir skill a partir de dados previamente extraídos (pular download)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial
Guia completo: Consulte docs/VIDEO_GUIDE.md para referência CLI completa, detalhes do pipeline visual, opções de aprimoramento com IA e troubleshooting.
Análise de Repositórios GitHub
# Coleta básica de repositório
skill-seekers github --repo facebook/react
# Com autenticação (rate limits mais altos)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react
# Personalizar o que incluir
skill-seekers github --repo django/django \
--include-issues \ # Extrair GitHub Issues
--max-issues 100 \ # Limitar quantidade de issues
--include-changelog # Extrair CHANGELOG.md
Coleta Unificada Multi-Fonte
Combine documentação + GitHub + PDF em uma skill unificada com detecção de conflitos:
# Use configs unificadas existentes
skill-seekers unified --config configs/react_unified.json
skill-seekers unified --config configs/django_unified.json
# Ou crie uma config unificada
cat > configs/myframework_unified.json << 'EOF'
{
"name": "myframework",
"merge_mode": "rule-based",
"sources": [
{
"type": "documentation",
"base_url": "https://docs.myframework.com/",
"max_pages": 200
},
{
"type": "github",
"repo": "owner/myframework",
"code_analysis_depth": "surface"
}
]
}
EOF
skill-seekers unified --config configs/myframework_unified.json
A Detecção de Conflitos encontra automaticamente:
- 🔴 Ausente no código (alta): Documentado mas não implementado
- 🟡 Ausente nos docs (média): Implementado mas não documentado
- ⚠️ Assinatura incompatível: Parâmetros/tipos diferentes
- ℹ️ Descrição incompatível: Explicações diferentes
Guia Completo: Consulte docs/UNIFIED_SCRAPING.md para documentação completa.
Repositórios Privados de Configuração
Compartilhe configs personalizadas entre equipes usando repositórios Git privados:
# Opção 1: Usando ferramentas MCP (recomendado)
# Registre o repositório privado da sua equipe
add_config_source(
name="team",
git_url="https://github.com/mycompany/skill-configs.git",
token_env="GITHUB_TOKEN"
)
# Busque config do repositório da equipe
fetch_config(source="team", config_name="internal-api")
Plataformas Suportadas:
- GitHub (
GITHUB_TOKEN), GitLab (GITLAB_TOKEN), Gitea (GITEA_TOKEN), Bitbucket (BITBUCKET_TOKEN)
Guia Completo: Consulte docs/GIT_CONFIG_SOURCES.md para documentação completa.
Como Funciona
graph LR
A[Site de Documentação] --> B[Skill Seekers]
B --> C[Coletor]
B --> D[Aprimoramento IA]
B --> E[Empacotador]
C --> F[Referências Organizadas]
D --> F
F --> E
E --> G[Claude Skill .zip]
G --> H[Upload para Claude AI]
- Detectar llms.txt - Verifica primeiro por llms-full.txt, llms.txt, llms-small.txt
- Coletar: Extrai todas as páginas da documentação
- Categorizar: Organiza o conteúdo em tópicos (API, guias, tutoriais, etc.)
- Aprimorar: IA analisa os docs e cria SKILL.md abrangente com exemplos
- Empacotar: Empacota tudo em um arquivo
.zippronto para o Claude
📋 Pré-requisitos
Antes de começar, certifique-se de ter:
- Python 3.10 ou superior - Download | Verificar:
python3 --version - Git - Download | Verificar:
git --version - 15-30 minutos para a configuração inicial
Primeira vez? → Comece Aqui: Guia de Início Rápido Infalível 🎯
📤 Enviando Skills para o Claude
Depois que sua skill estiver empacotada, você precisa enviá-la para o Claude:
Opção 1: Upload Automático (via API)
# Configure sua API key (uma única vez)
export ANTHROPIC_API_KEY=sk-ant-...
# Empacote e faça upload automaticamente
skill-seekers package output/react/ --upload
# OU faça upload de um .zip existente
skill-seekers upload output/react.zip
Opção 2: Upload Manual (Sem API Key)
# Empacote a skill
skill-seekers package output/react/
# → Cria output/react.zip
# Depois faça upload manualmente:
# - Acesse https://claude.ai/skills
# - Clique em "Upload Skill"
# - Selecione output/react.zip
Opção 3: MCP (Claude Code)
No Claude Code, basta pedir:
"Empacote e faça upload da skill React"
🤖 Instalando em Agentes de IA
O Skill Seekers pode instalar automaticamente skills em 18 agentes de programação com IA.
# Instalar em agente específico
skill-seekers install-agent output/react/ --agent cursor
# Instalar em todos os agentes de uma vez
skill-seekers install-agent output/react/ --agent all
# Visualizar sem instalar
skill-seekers install-agent output/react/ --agent cursor --dry-run
Agentes Suportados
| Agente | Caminho | Tipo |
|---|---|---|
| Claude Code | ~/.claude/skills/ |
Global |
| Cursor | .cursor/skills/ |
Projeto |
| VS Code / Copilot | .github/skills/ |
Projeto |
| Amp | ~/.amp/skills/ |
Global |
| Goose | ~/.config/goose/skills/ |
Global |
| OpenCode | ~/.opencode/skills/ |
Global |
| Windsurf | ~/.windsurf/skills/ |
Global |
| Roo Code | .roo/skills/ |
Projeto |
| Cline | .cline/skills/ |
Projeto |
| Aider | ~/.aider/skills/ |
Global |
| Bolt | .bolt/skills/ |
Projeto |
| Kilo Code | .kilo/skills/ |
Projeto |
| Continue | ~/.continue/skills/ |
Global |
| Kimi Code | ~/.kimi/skills/ |
Global |
🔌 Integração MCP (26 Ferramentas)
O Skill Seekers inclui um servidor MCP para uso com Claude Code, Cursor, Windsurf, VS Code + Cline ou IntelliJ IDEA.
# Modo stdio (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp
# Modo HTTP (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
# Configurar automaticamente todos os agentes de uma vez
./setup_mcp.sh
Todas as 26 ferramentas disponíveis:
- Núcleo (9):
list_configs,generate_config,validate_config,estimate_pages,scrape_docs,package_skill,upload_skill,enhance_skill,install_skill - Estendidas (10):
scrape_github,scrape_pdf,unified_scrape,merge_sources,detect_conflicts,add_config_source,fetch_config,list_config_sources,remove_config_source,split_config - Bancos Vetoriais (4):
export_to_chroma,export_to_weaviate,export_to_faiss,export_to_qdrant - Nuvem (3):
cloud_upload,cloud_download,cloud_list
Guia Completo: docs/MCP_SETUP.md
⚙️ Configuração
Presets Disponíveis (24+)
# Listar todos os presets
skill-seekers list-configs
| Categoria | Presets |
|---|---|
| Frameworks Web | react, vue, angular, svelte, nextjs |
| Python | django, flask, fastapi, sqlalchemy, pytest |
| Desenvolvimento de Jogos | godot, pygame, unity |
| Ferramentas e DevOps | docker, kubernetes, terraform, ansible |
| Unificados (Docs + GitHub) | react-unified, vue-unified, nextjs-unified e mais |
Criando Sua Própria Configuração
# Opção 1: Interativo
skill-seekers scrape --interactive
# Opção 2: Copie e edite um preset
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json
Estrutura do Arquivo de Configuração
{
"name": "myframework",
"description": "Quando usar esta skill",
"base_url": "https://docs.myframework.com/",
"selectors": {
"main_content": "article",
"title": "h1",
"code_blocks": "pre code"
},
"url_patterns": {
"include": ["/docs", "/guide"],
"exclude": ["/blog", "/about"]
},
"categories": {
"getting_started": ["intro", "quickstart"],
"api": ["api", "reference"]
},
"rate_limit": 0.5,
"max_pages": 500
}
Onde Armazenar Configurações
A ferramenta busca na seguinte ordem:
- Caminho exato fornecido
./configs/(diretório atual)~/.config/skill-seekers/configs/(diretório de configuração do usuário)- API SkillSeekersWeb.com (configurações predefinidas)
📊 O que é Criado
output/
├── godot_data/ # Dados brutos coletados
│ ├── pages/ # Arquivos JSON (um por página)
│ └── summary.json # Resumo geral
│
└── godot/ # A skill
├── SKILL.md # Aprimorado com exemplos reais
├── references/ # Docs categorizados
│ ├── index.md
│ ├── getting_started.md
│ ├── scripting.md
│ └── ...
├── scripts/ # Vazio (adicione os seus)
└── assets/ # Vazio (adicione os seus)
🐛 Solução de Problemas
Nenhum Conteúdo Extraído?
- Verifique seu seletor
main_content - Tente:
article,main,div[role="main"]
Dados Existem Mas Não São Usados?
# Forçar re-coleta
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json
Categorias Não Estão Boas?
Edite a seção categories da configuração com palavras-chave melhores.
Quer Atualizar os Docs?
# Apague dados antigos e recolete
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json
Aprimoramento Não Funciona?
# Verifique se a API key está configurada
echo $ANTHROPIC_API_KEY
# Tente o modo LOCAL (usa Claude Code Max, sem necessidade de API key)
skill-seekers enhance output/react/ --mode LOCAL
# Monitore o status do aprimoramento em segundo plano
skill-seekers enhance-status output/react/ --watch
Problemas de Rate Limit do GitHub?
# Configure um token GitHub (5000 req/hora vs 60/hora anônimo)
export GITHUB_TOKEN=ghp_your_token_here
# Ou configure múltiplos perfis
skill-seekers config --github
📈 Performance
| Tarefa | Tempo | Observações |
|---|---|---|
| Coleta (síncrona) | 15-45 min | Apenas na primeira vez, baseada em threads |
| Coleta (assíncrona) | 5-15 min | 2-3x mais rápida com a flag --async |
| Construção | 1-3 min | Reconstrução rápida a partir do cache |
| Reconstrução | <1 min | Com --skip-scrape |
| Aprimoramento (LOCAL) | 30-60 seg | Usa Claude Code Max |
| Aprimoramento (API) | 20-40 seg | Requer API key |
| Vídeo (transcrição) | 1-3 min | YouTube/local, apenas transcrição |
| Vídeo (visual) | 5-15 min | + extração OCR de frames |
| Empacotamento | 5-10 seg | Criação final do .zip |
📚 Documentação
Primeiros Passos
- BULLETPROOF_QUICKSTART.md - 🎯 COMECE AQUI se você é novo!
- QUICKSTART.md - Início rápido para usuários experientes
- TROUBLESHOOTING.md - Problemas comuns e soluções
- docs/QUICK_REFERENCE.md - Folha de referência rápida
Guias
- docs/LARGE_DOCUMENTATION.md - Processar docs de 10K-40K+ páginas
- ASYNC_SUPPORT.md - Guia do modo assíncrono (coleta 2-3x mais rápida)
- docs/ENHANCEMENT_MODES.md - Guia de modos de aprimoramento com IA
- docs/MCP_SETUP.md - Configuração da integração MCP
- docs/UNIFIED_SCRAPING.md - Coleta multi-fonte
- docs/VIDEO_GUIDE.md - Guia de extração de vídeo
Guias de Integração
- docs/integrations/LANGCHAIN.md - LangChain RAG
- docs/integrations/CURSOR.md - Cursor IDE
- docs/integrations/WINDSURF.md - Windsurf IDE
- docs/integrations/CLINE.md - Cline (VS Code)
- docs/integrations/RAG_PIPELINES.md - Todos os pipelines RAG
📝 Licença
Licença MIT - consulte o arquivo LICENSE para detalhes
Bom trabalho construindo skills! 🚀

