Add machine-translated README files for Japanese, Korean, Spanish,
French, German, Portuguese (BR), Turkish, Arabic, Hindi, and Russian.
Update language selector in English and Chinese READMEs to link all 12
versions.
New files: README.{ja,ko,es,fr,de,pt-BR,tr,ar,hi,ru}.md
Modified: README.md, README.zh-CN.md (language selector bar)
48 KiB
Skill Seekers
English | 简体中文 | 日本語 | 한국어 | Español | Français | Deutsch | Português | Türkçe | العربية | हिन्दी | Русский
⚠️ Aviso de tradução automática
Este documento foi traduzido automaticamente por IA. Embora nos esforcemos para garantir a qualidade, podem existir expressões imprecisas.
Ajude a melhorar a tradução através do GitHub Issue #260! Seu feedback é muito valioso para nós.
🧠 A camada de dados para sistemas de IA. O Skill Seekers transforma sites de documentação, repositórios GitHub, PDFs, vídeos, Jupyter Notebooks, wikis e mais de 17 tipos de fontes em ativos de conhecimento estruturado — prontos para alimentar AI Skills (Claude, Gemini, OpenAI), pipelines RAG (LangChain, LlamaIndex, Pinecone) e assistentes de programação com IA (Cursor, Windsurf, Cline) em minutos, não horas.
🌐 Visite SkillSeekersWeb.com - Navegue por mais de 24 configurações predefinidas, compartilhe suas configurações e acesse a documentação completa!
📋 Veja o Roteiro de Desenvolvimento e Tarefas - 134 tarefas em 10 categorias, escolha qualquer uma para contribuir!
🧠 A Camada de Dados para Sistemas de IA
Skill Seekers é a camada universal de pré-processamento que fica entre a documentação bruta e todo sistema de IA que a consome. Seja para construir Claude Skills, um pipeline RAG com LangChain ou um arquivo .cursorrules para o Cursor — a preparação dos dados é idêntica. Faça uma vez e exporte para todos os destinos.
# Um comando → ativo de conhecimento estruturado
skill-seekers create https://docs.react.dev/
# ou: skill-seekers create facebook/react
# ou: skill-seekers create ./my-project
# Exporte para qualquer sistema de IA
skill-seekers package output/react --target claude # → Claude AI Skill (ZIP)
skill-seekers package output/react --target langchain # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor # → .cursorrules
O que é gerado
| Saída | Destino | Para que serve |
|---|---|---|
| Claude Skill (ZIP + YAML) | --target claude |
Claude Code, Claude API |
| Gemini Skill (tar.gz) | --target gemini |
Google Gemini |
| OpenAI / Custom GPT (ZIP) | --target openai |
GPT-4o, assistentes personalizados |
| LangChain Documents | --target langchain |
Cadeias de QA, agentes, recuperadores |
| LlamaIndex TextNodes | --target llama-index |
Motores de consulta, motores de chat |
| Haystack Documents | --target haystack |
Pipelines RAG empresariais |
| Pinecone-ready (Markdown) | --target markdown |
Upload de vetores |
| ChromaDB / FAISS / Qdrant | --format chroma/faiss/qdrant |
Bancos de dados vetoriais locais |
Cursor .cursorrules |
--target claude → copiar |
Contexto de IA do Cursor IDE |
| Windsurf / Cline / Continue | --target claude → copiar |
VS Code, IntelliJ, Vim |
Por que isso importa
- ⚡ 99% mais rápido — Dias de preparação manual de dados → 15–45 minutos
- 🎯 Qualidade de AI Skill — Arquivos SKILL.md com mais de 500 linhas com exemplos, padrões e guias
- 📊 Chunks prontos para RAG — Chunking inteligente que preserva blocos de código e mantém o contexto
- 🎬 Vídeos — Extraia código, transcrições e conhecimento estruturado do YouTube e vídeos locais
- 🔄 Multi-fonte — Combine 17 tipos de fontes (docs, GitHub, PDFs, vídeos, notebooks, wikis e mais) em um único ativo de conhecimento
- 🌐 Uma preparação, todos os destinos — Exporte o mesmo ativo para 16 plataformas sem precisar recoletá-lo
- ✅ Testado em batalha — Mais de 2.540 testes, mais de 24 presets de frameworks, pronto para produção
🚀 Início Rápido (3 Comandos)
# 1. Instalar
pip install skill-seekers
# 2. Criar skill a partir de qualquer fonte
skill-seekers create https://docs.django.com/
# 3. Empacotar para sua plataforma de IA
skill-seekers package output/django --target claude
Pronto! Agora você tem output/django-claude.zip pronto para usar.
Outras Fontes (17 Suportadas)
# Repositório GitHub
skill-seekers create facebook/react
# Projeto local
skill-seekers create ./my-project
# Documento PDF
skill-seekers create manual.pdf
# Documento Word
skill-seekers create report.docx
# E-book EPUB
skill-seekers create book.epub
# Jupyter Notebook
skill-seekers create notebook.ipynb
# Especificação OpenAPI
skill-seekers create openapi.yaml
# Apresentação PowerPoint
skill-seekers create presentation.pptx
# Documento AsciiDoc
skill-seekers create guide.adoc
# Arquivo HTML local
skill-seekers create page.html
# Feed RSS/Atom
skill-seekers create feed.rss
# Man page
skill-seekers create curl.1
# Vídeo (YouTube, Vimeo ou arquivo local — requer skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# Primeira vez? Instale automaticamente as dependências visuais com detecção de GPU:
skill-seekers video --setup
# Wiki Confluence
skill-seekers confluence --space TEAM --name wiki
# Páginas Notion
skill-seekers notion --database-id ... --name docs
# Exportação de chat Slack/Discord
skill-seekers chat --export-dir ./slack-export --name team-chat
Exporte para Qualquer Lugar
# Empacote para múltiplas plataformas
for platform in claude gemini openai langchain; do
skill-seekers package output/django --target $platform
done
O que é o Skill Seekers?
O Skill Seekers é a camada de dados para sistemas de IA. Ele transforma 17 tipos de fontes — sites de documentação, repositórios GitHub, PDFs, vídeos, Jupyter Notebooks, documentos Word/EPUB/AsciiDoc, especificações OpenAPI, apresentações PowerPoint, feeds RSS, man pages, wikis Confluence, páginas Notion, exportações Slack/Discord e mais — em ativos de conhecimento estruturado para qualquer destino de IA:
| Caso de Uso | O que você obtém | Exemplos |
|---|---|---|
| AI Skills | SKILL.md abrangente + referências | Claude Code, Gemini, GPT |
| Pipelines RAG | Documentos fragmentados com metadados ricos | LangChain, LlamaIndex, Haystack |
| Bancos de Dados Vetoriais | Dados pré-formatados prontos para upload | Pinecone, Chroma, Weaviate, FAISS |
| Assistentes de Programação com IA | Arquivos de contexto que sua IDE lê automaticamente | Cursor, Windsurf, Cline, Continue.dev |
O Skill Seekers substitui dias de pré-processamento manual com os seguintes passos:
- Coleta — Docs, repositórios GitHub, bases de código locais, PDFs, vídeos, Jupyter Notebooks, wikis e mais de 17 tipos de fontes
- Análise — Parsing AST profundo, detecção de padrões, extração de APIs
- Estruturação — Arquivos de referência categorizados com metadados
- Aprimoramento — Geração de SKILL.md com IA (Claude, Gemini ou local)
- Exportação — 16 formatos específicos por plataforma a partir de um único ativo
Por que Usar o Skill Seekers?
Para Construtores de AI Skills (Claude, Gemini, OpenAI)
- 🎯 Skills de nível de produção — Arquivos SKILL.md com mais de 500 linhas com exemplos de código, padrões e guias
- 🔄 Workflows de aprimoramento — Aplique
security-focus,architecture-comprehensiveou presets YAML personalizados - 🎮 Qualquer domínio — Motores de jogos (Godot, Unity), frameworks (React, Django), ferramentas internas
- 🔧 Equipes — Combine documentação interna + código em uma única fonte da verdade
- 📚 Qualidade — Aprimorado por IA com exemplos, referência rápida e orientação de navegação
Para Construtores de RAG e Engenheiros de IA
- 🤖 Dados prontos para RAG —
DocumentsLangChain,TextNodesLlamaIndex,DocumentsHaystack pré-fragmentados - 🚀 99% mais rápido — Dias de pré-processamento → 15–45 minutos
- 📊 Metadados inteligentes — Categorias, fontes, tipos → melhor precisão de recuperação
- 🔄 Multi-fonte — Combine docs + GitHub + PDFs + vídeos em um pipeline
- 🌐 Agnóstico de plataforma — Exporte para qualquer banco vetorial ou framework sem recoleta
Para Usuários de Assistentes de Programação com IA
- 💻 Cursor / Windsurf / Cline — Gere
.cursorrules/.windsurfrules/.clinerulesautomaticamente - 🎯 Contexto persistente — A IA "conhece" seus frameworks sem prompts repetidos
- 📚 Sempre atualizado — Atualize o contexto em minutos quando a documentação mudar
Funcionalidades Principais
🌐 Coleta de Documentação
- ✅ Suporte a llms.txt - Detecta e usa automaticamente arquivos de documentação prontos para LLM (10x mais rápido)
- ✅ Scraper Universal - Funciona com QUALQUER site de documentação
- ✅ Categorização Inteligente - Organiza conteúdo automaticamente por tópico
- ✅ Detecção de Linguagem de Código - Reconhece Python, JavaScript, C++, GDScript, etc.
- ✅ Mais de 24 Presets Prontos - Godot, React, Vue, Django, FastAPI e mais
📄 Suporte a PDF
- ✅ Extração Básica de PDF - Extraia texto, código e imagens de arquivos PDF
- ✅ OCR para PDFs Digitalizados - Extraia texto de documentos digitalizados
- ✅ PDFs Protegidos por Senha - Processe PDFs criptografados
- ✅ Extração de Tabelas - Extraia tabelas complexas de PDFs
- ✅ Processamento Paralelo - 3x mais rápido para PDFs grandes
- ✅ Cache Inteligente - 50% mais rápido em re-execuções
🎬 Extração de Vídeo
- ✅ YouTube e Vídeos Locais - Extraia transcrições, código na tela e conhecimento estruturado de vídeos
- ✅ Análise Visual de Frames - Extração OCR de editores de código, terminais, slides e diagramas
- ✅ Detecção Automática de GPU - Instala automaticamente a versão correta do PyTorch (CUDA/ROCm/MPS/CPU)
- ✅ Aprimoramento com IA - Dois passes: limpeza de artefatos OCR + geração de SKILL.md polido
- ✅ Recorte Temporal - Extraia seções específicas com
--start-timee--end-time - ✅ Suporte a Playlists - Processe em lote todos os vídeos de uma playlist do YouTube
- ✅ Fallback com Vision API - Use Claude Vision para frames OCR de baixa confiança
🐙 Análise de Repositórios GitHub
- ✅ Análise Profunda de Código - Parsing AST para Python, JavaScript, TypeScript, Java, C++, Go
- ✅ Extração de API - Funções, classes, métodos com parâmetros e tipos
- ✅ Metadados do Repositório - README, árvore de arquivos, distribuição de linguagens, stars/forks
- ✅ GitHub Issues e PRs - Obtenha issues abertas/fechadas com labels e milestones
- ✅ CHANGELOG e Releases - Extração automática do histórico de versões
- ✅ Detecção de Conflitos - Compare APIs documentadas vs implementação real do código
- ✅ Integração MCP - Linguagem natural: "Colete o repositório GitHub facebook/react"
🔄 Coleta Unificada Multi-Fonte
- ✅ Combine Múltiplas Fontes - Misture documentação + GitHub + PDF em uma skill
- ✅ Detecção de Conflitos - Encontra automaticamente discrepâncias entre docs e código
- ✅ Mesclagem Inteligente - Resolução de conflitos baseada em regras ou com IA
- ✅ Relatórios Transparentes - Comparação lado a lado com avisos ⚠️
- ✅ Análise de Lacunas na Documentação - Identifica docs desatualizadas e funcionalidades não documentadas
- ✅ Fonte Única da Verdade - Uma skill mostrando tanto a intenção (docs) quanto a realidade (código)
- ✅ Retrocompatível - Configurações legadas de fonte única continuam funcionando
🤖 Suporte a Múltiplas Plataformas LLM
- ✅ 4 Plataformas LLM - Claude AI, Google Gemini, OpenAI ChatGPT, Markdown Genérico
- ✅ Coleta Universal - A mesma documentação funciona para todas as plataformas
- ✅ Empacotamento Específico por Plataforma - Formatos otimizados para cada LLM
- ✅ Exportação com Um Comando - Flag
--targetseleciona a plataforma - ✅ Dependências Opcionais - Instale apenas o que precisa
- ✅ 100% Retrocompatível - Workflows existentes do Claude permanecem inalterados
| Plataforma | Formato | Upload | Aprimoramento | API Key | Endpoint Personalizado |
|---|---|---|---|---|---|
| Claude AI | ZIP + YAML | ✅ Automático | ✅ Sim | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
| Google Gemini | tar.gz | ✅ Automático | ✅ Sim | GOOGLE_API_KEY | - |
| OpenAI ChatGPT | ZIP + Vector Store | ✅ Automático | ✅ Sim | OPENAI_API_KEY | - |
| Markdown Genérico | ZIP | ❌ Manual | ❌ Não | - | - |
# Claude (padrão - sem alterações necessárias!)
skill-seekers package output/react/
skill-seekers upload react.zip
# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini
# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai
# Markdown Genérico (exportação universal)
skill-seekers package output/react/ --target markdown
# Use os arquivos markdown diretamente em qualquer LLM
🔧 Variáveis de Ambiente para APIs Compatíveis com Claude (ex.: GLM-4.7)
O Skill Seekers suporta qualquer endpoint de API compatível com Claude:
# Opção 1: API oficial da Anthropic (padrão)
export ANTHROPIC_API_KEY=sk-ant-...
# Opção 2: API compatível com Claude GLM-4.7
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1
# Todas as funcionalidades de aprimoramento com IA usarão o endpoint configurado
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance
Nota: Configurar ANTHROPIC_BASE_URL permite que você use qualquer endpoint de API compatível com Claude, como GLM-4.7 ou outros serviços compatíveis.
Instalação:
# Instalar com suporte ao Gemini
pip install skill-seekers[gemini]
# Instalar com suporte ao OpenAI
pip install skill-seekers[openai]
# Instalar com todas as plataformas LLM
pip install skill-seekers[all-llms]
🔗 Integrações com Frameworks RAG
-
✅ LangChain Documents - Exportação direta para formato
Documentcompage_content+ metadados- Ideal para: Cadeias de QA, recuperadores, armazenamentos vetoriais, agentes
- Exemplo: Pipeline RAG LangChain
- Guia: Integração LangChain
-
✅ LlamaIndex TextNodes - Exportação para formato
TextNodecom IDs únicos + embeddings- Ideal para: Motores de consulta, motores de chat, contexto de armazenamento
- Exemplo: Motor de Consulta LlamaIndex
- Guia: Integração LlamaIndex
-
✅ Formato Pinecone-Ready - Otimizado para upload em bancos de dados vetoriais
- Ideal para: Busca vetorial em produção, busca semântica, busca híbrida
- Exemplo: Upload Pinecone
- Guia: Integração Pinecone
Exportação Rápida:
# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json
# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json
# Markdown (Universal)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/
Guia Completo de Pipeline RAG: Documentação de Pipelines RAG
🧠 Integrações com Assistentes de Programação com IA
Transforme qualquer documentação de framework em contexto especializado de programação para mais de 4 assistentes de IA:
-
✅ Cursor IDE - Gere
.cursorrulespara sugestões de código com IA- Ideal para: Geração de código específica de framework, padrões consistentes
- Funciona com: Cursor IDE (fork do VS Code)
- Guia: Integração Cursor
- Exemplo: Cursor React Skill
-
✅ Windsurf - Personalize o contexto do assistente de IA do Windsurf com
.windsurfrules- Ideal para: Assistência de IA nativa na IDE, programação baseada em fluxo
- Funciona com: Windsurf IDE da Codeium
- Guia: Integração Windsurf
- Exemplo: Contexto FastAPI Windsurf
-
✅ Cline (VS Code) - Prompts de sistema + MCP para agente VS Code
- Ideal para: Geração de código agentiva no VS Code
- Funciona com: Extensão Cline para VS Code
- Guia: Integração Cline
- Exemplo: Assistente Django Cline
-
✅ Continue.dev - Servidores de contexto para IA agnóstica de IDE
- Ideal para: Ambientes multi-IDE (VS Code, JetBrains, Vim), provedores de LLM personalizados
- Funciona com: Qualquer IDE com plugin Continue.dev
- Guia: Integração Continue
- Exemplo: Contexto Universal Continue
Exportação Rápida para Ferramentas de Programação com IA:
# Para qualquer assistente de programação com IA (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude # ou --target markdown
# Copie para seu projeto (exemplo para Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules
# Ou para Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md
# Ou para Cline
cp output/django-claude/SKILL.md my-project/.clinerules
# Ou para Continue.dev (servidor HTTP)
python examples/continue-dev-universal/context_server.py
# Configure em ~/.continue/config.json
Hub de Integrações: Todas as Integrações com Sistemas de IA
🌊 Arquitetura GitHub de Três Fluxos
- ✅ Análise em Três Fluxos - Divide repositórios GitHub em fluxos de Código, Docs e Insights
- ✅ Analisador de Codebase Unificado - Funciona com URLs do GitHub E caminhos locais
- ✅ C3.x como Profundidade de Análise - Escolha 'basic' (1-2 min) ou 'c3x' (20-60 min)
- ✅ Geração Aprimorada de Router - Metadados do GitHub, quick start do README, problemas comuns
- ✅ Integração de Issues - Principais problemas e soluções dos GitHub Issues
- ✅ Keywords de Roteamento Inteligente - Labels do GitHub com peso 2x para melhor detecção de tópicos
Explicação dos Três Fluxos:
- Fluxo 1: Código - Análise profunda C3.x (padrões, exemplos, guias, configs, arquitetura)
- Fluxo 2: Docs - Documentação do repositório (README, CONTRIBUTING, docs/*.md)
- Fluxo 3: Insights - Conhecimento da comunidade (issues, labels, stars, forks)
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer
# Analise repositório GitHub com os três fluxos
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
source="https://github.com/facebook/react",
depth="c3x", # ou "basic" para análise rápida
fetch_github_metadata=True
)
# Acesse o fluxo de código (análise C3.x)
print(f"Padrões de design: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Exemplos de teste: {result.code_analysis['c3_2_examples_count']}")
# Acesse o fluxo de docs (documentação do repositório)
print(f"README: {result.github_docs['readme'][:100]}")
# Acesse o fluxo de insights (metadados do GitHub)
print(f"Stars: {result.github_insights['metadata']['stars']}")
print(f"Problemas comuns: {len(result.github_insights['common_problems'])}")
Documentação completa: Resumo da Implementação de Três Fluxos
🔐 Gerenciamento Inteligente de Rate Limit e Configuração
- ✅ Sistema de Configuração Multi-Token - Gerencie múltiplas contas GitHub (pessoal, trabalho, OSS)
- Armazenamento seguro de configurações em
~/.config/skill-seekers/config.json(permissões 600) - Estratégias de rate limit por perfil:
prompt,wait,switch,fail - Timeout configurável por perfil (padrão: 30 min, evita esperas indefinidas)
- Cadeia de fallback inteligente: Argumento CLI → Variável de ambiente → Arquivo de configuração → Prompt
- Gerenciamento de API keys para Claude, Gemini, OpenAI
- Armazenamento seguro de configurações em
- ✅ Assistente de Configuração Interativo - Interface de terminal elegante para fácil configuração
- Integração com navegador para criação de tokens (abre automaticamente GitHub, etc.)
- Validação de tokens e teste de conexão
- Exibição visual de status com código de cores
- ✅ Gerenciador Inteligente de Rate Limit - Chega de esperas indefinidas!
- Aviso prévio sobre rate limits (60/hora vs 5000/hora)
- Detecção em tempo real das respostas da API do GitHub
- Contadores regressivos ao vivo com progresso
- Troca automática de perfil quando limitado
- Quatro estratégias: prompt (perguntar), wait (contagem regressiva), switch (tentar outro), fail (abortar)
- ✅ Capacidade de Retomada - Continue trabalhos interrompidos
- Salvamento automático de progresso em intervalos configuráveis (padrão: 60 seg)
- Liste todos os trabalhos retomáveis com detalhes de progresso
- Limpeza automática de trabalhos antigos (padrão: 7 dias)
- ✅ Suporte CI/CD - Modo não interativo para automação
- Flag
--non-interactivefalha rapidamente sem prompts - Flag
--profilepara selecionar conta GitHub específica - Mensagens de erro claras para logs de pipeline
- Flag
Configuração Rápida:
# Configuração única (5 minutos)
skill-seekers config --github
# Use perfil específico para repos privados
skill-seekers github --repo mycompany/private-repo --profile work
# Modo CI/CD (falha rápida, sem prompts)
skill-seekers github --repo owner/repo --non-interactive
# Retomar trabalho interrompido
skill-seekers resume --list
skill-seekers resume github_react_20260117_143022
Estratégias de Rate Limit Explicadas:
- prompt (padrão) - Pergunta o que fazer quando limitado (esperar, trocar, configurar token, cancelar)
- wait - Espera automaticamente com contador regressivo (respeita timeout)
- switch - Tenta automaticamente o próximo perfil disponível (para configurações multi-conta)
- fail - Falha imediatamente com erro claro (ideal para CI/CD)
🎯 Bootstrap Skill - Auto-Hospedagem
Gere o skill-seekers como uma Claude Code Skill para uso dentro do Claude:
# Gere a skill
./scripts/bootstrap_skill.sh
# Instale no Claude Code
cp -r output/skill-seekers ~/.claude/skills/
O que você obtém:
- ✅ Documentação completa da skill - Todos os comandos CLI e padrões de uso
- ✅ Referência de comandos CLI - Cada ferramenta e suas opções documentadas
- ✅ Exemplos de início rápido - Workflows comuns e melhores práticas
- ✅ Documentação de API auto-gerada - Análise de código, padrões e exemplos
🔐 Repositórios Privados de Configuração
- ✅ Fontes de Config Baseadas em Git - Busque configs de repositórios Git privados/de equipe
- ✅ Gerenciamento Multi-Fonte - Registre repositórios ilimitados do GitHub, GitLab, Bitbucket
- ✅ Colaboração em Equipe - Compartilhe configs personalizadas entre equipes de 3-5 pessoas
- ✅ Suporte Empresarial - Escale para mais de 500 desenvolvedores com resolução baseada em prioridade
- ✅ Autenticação Segura - Tokens em variáveis de ambiente (GITHUB_TOKEN, GITLAB_TOKEN)
- ✅ Cache Inteligente - Clone uma vez, receba atualizações automaticamente
- ✅ Modo Offline - Trabalhe com configs em cache quando estiver offline
🤖 Análise de Codebase (C3.x)
C3.4: Extração de Padrões de Configuração com Aprimoramento por IA
- ✅ 9 Formatos de Config - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
- ✅ 7 Tipos de Padrão - Banco de dados, API, logging, cache, e-mail, autenticação, configurações de servidor
- ✅ Aprimoramento por IA - Análise de IA opcional em modo duplo (API + LOCAL)
- Explica o que cada config faz
- Sugere melhores práticas e melhorias
- Análise de segurança - Encontra segredos hardcoded, credenciais expostas
- ✅ Auto-Documentação - Gera documentação JSON + Markdown de todas as configs
- ✅ Integração MCP - Ferramenta
extract_config_patternscom suporte a aprimoramento
C3.3: Guias How-To Aprimorados por IA
- ✅ Aprimoramento Abrangente por IA - Transforma guias básicos em tutoriais profissionais
- ✅ 5 Melhorias Automáticas - Descrições de etapas, troubleshooting, pré-requisitos, próximos passos, casos de uso
- ✅ Suporte Dual-Mode - Modo API (Claude API) ou modo LOCAL (Claude Code CLI)
- ✅ Sem Custo com Modo LOCAL - Aprimoramento GRATUITO usando seu plano Claude Code Max
- ✅ Transformação de Qualidade - Templates de 75 linhas → guias abrangentes de mais de 500 linhas
Uso:
# Análise rápida (1-2 min, apenas funcionalidades básicas)
skill-seekers analyze --directory tests/ --quick
# Análise abrangente com IA (20-60 min, todas as funcionalidades)
skill-seekers analyze --directory tests/ --comprehensive
# Com aprimoramento por IA
skill-seekers analyze --directory tests/ --enhance
Documentação Completa: docs/HOW_TO_GUIDES.md
🔄 Presets de Workflow de Aprimoramento
Pipelines de aprimoramento reutilizáveis definidos em YAML que controlam como a IA transforma sua documentação bruta em uma skill polida.
- ✅ 5 Presets Incluídos —
default,minimal,security-focus,architecture-comprehensive,api-documentation - ✅ Presets Definidos pelo Usuário — Adicione workflows personalizados em
~/.config/skill-seekers/workflows/ - ✅ Múltiplos Workflows — Encadeie dois ou mais workflows em um comando
- ✅ CLI Totalmente Gerenciada — Liste, inspecione, copie, adicione, remova e valide workflows
# Aplique um único workflow
skill-seekers create ./my-project --enhance-workflow security-focus
# Encadeie múltiplos workflows (aplicados em ordem)
skill-seekers create ./my-project \
--enhance-workflow security-focus \
--enhance-workflow minimal
# Gerencie presets
skill-seekers workflows list # Liste todos (incluídos + usuário)
skill-seekers workflows show security-focus # Exiba conteúdo YAML
skill-seekers workflows copy security-focus # Copie para diretório do usuário para edição
skill-seekers workflows add ./my-workflow.yaml # Instale um preset personalizado
skill-seekers workflows remove my-workflow # Remova um preset do usuário
skill-seekers workflows validate security-focus # Valide a estrutura do preset
# Copie múltiplos de uma vez
skill-seekers workflows copy security-focus minimal api-documentation
# Adicione múltiplos arquivos de uma vez
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml
# Remova múltiplos de uma vez
skill-seekers workflows remove my-wf-a my-wf-b
Formato de preset YAML:
name: security-focus
description: "Revisão focada em segurança: vulnerabilidades, autenticação, tratamento de dados"
version: "1.0"
stages:
- name: vulnerabilities
type: custom
prompt: "Revise vulnerabilidades OWASP top 10 e vulnerabilidades de segurança comuns..."
- name: auth-review
type: custom
prompt: "Examine padrões de autenticação e autorização..."
uses_history: true
⚡ Performance e Escalabilidade
- ✅ Modo Assíncrono - Coleta 2-3x mais rápida com async/await (use a flag
--async) - ✅ Suporte a Documentações Grandes - Processe docs de 10K-40K+ páginas com divisão inteligente
- ✅ Skills Router/Hub - Roteamento inteligente para sub-skills especializadas
- ✅ Coleta Paralela - Processe múltiplas skills simultaneamente
- ✅ Checkpoint/Retomada - Nunca perca progresso em coletas longas
- ✅ Sistema de Cache - Colete uma vez, reconstrua instantaneamente
✅ Garantia de Qualidade
- ✅ Totalmente Testado - Mais de 2.540 testes com cobertura abrangente
📦 Instalação
# Instalação básica (coleta de documentação, análise GitHub, PDF, empacotamento)
pip install skill-seekers
# Com suporte a todas as plataformas LLM
pip install skill-seekers[all-llms]
# Com servidor MCP
pip install skill-seekers[mcp]
# Tudo incluído
pip install skill-seekers[all]
Precisa de ajuda para escolher? Execute o assistente de configuração:
skill-seekers-setup
Opções de Instalação
| Instalação | Funcionalidades |
|---|---|
pip install skill-seekers |
Coleta, análise GitHub, PDF, todas as plataformas |
pip install skill-seekers[gemini] |
+ Suporte ao Google Gemini |
pip install skill-seekers[openai] |
+ Suporte ao OpenAI ChatGPT |
pip install skill-seekers[all-llms] |
+ Todas as plataformas LLM |
pip install skill-seekers[mcp] |
+ Servidor MCP para Claude Code, Cursor, etc. |
pip install skill-seekers[video] |
+ Extração de transcrições e metadados do YouTube/Vimeo |
pip install skill-seekers[video-full] |
+ Transcrição Whisper e extração visual de frames |
pip install skill-seekers[jupyter] |
+ Suporte a Jupyter Notebook |
pip install skill-seekers[pptx] |
+ Suporte a PowerPoint |
pip install skill-seekers[confluence] |
+ Suporte a wiki Confluence |
pip install skill-seekers[notion] |
+ Suporte a páginas Notion |
pip install skill-seekers[rss] |
+ Suporte a feeds RSS/Atom |
pip install skill-seekers[chat] |
+ Suporte a exportação de chat Slack/Discord |
pip install skill-seekers[asciidoc] |
+ Suporte a documentos AsciiDoc |
pip install skill-seekers[all] |
Tudo habilitado |
Dependências visuais de vídeo (detecção de GPU): Após instalar
skill-seekers[video-full], executeskill-seekers video --setuppara detectar automaticamente sua GPU e instalar a variante correta do PyTorch + easyocr. Esta é a forma recomendada de instalar as dependências de extração visual.
🚀 Workflow de Instalação com Um Comando
A forma mais rápida de ir da configuração à skill enviada — automação completa:
# Instale a skill React a partir das configs oficiais (upload automático para o Claude)
skill-seekers install --config react
# Instale a partir de arquivo de configuração local
skill-seekers install --config configs/custom.json
# Instale sem fazer upload (apenas empacotar)
skill-seekers install --config django --no-upload
# Visualize o workflow sem executar
skill-seekers install --config react --dry-run
Tempo: 20-45 minutos no total | Qualidade: Pronto para produção (9/10) | Custo: Gratuito
Fases executadas:
📥 FASE 1: Buscar Configuração (se nome da config for fornecido)
📖 FASE 2: Coletar Documentação
✨ FASE 3: Aprimoramento com IA (OBRIGATÓRIO - sem opção de pular)
📦 FASE 4: Empacotar Skill
☁️ FASE 5: Upload para o Claude (opcional, requer API key)
Requisitos:
- Variável de ambiente ANTHROPIC_API_KEY (para upload automático)
- Plano Claude Code Max (para aprimoramento com IA local)
📊 Matriz de Funcionalidades
O Skill Seekers suporta 4 plataformas LLM, 17 tipos de fontes e paridade completa de funcionalidades em todos os destinos.
Plataformas: Claude AI, Google Gemini, OpenAI ChatGPT, Markdown Genérico Tipos de Fontes: Sites de documentação, repositórios GitHub, PDFs, Word (.docx), EPUB, Vídeo, Codebases locais, Jupyter Notebooks, HTML local, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), feeds RSS/Atom, Man pages, wikis Confluence, páginas Notion, exportações de chat Slack/Discord
Consulte a Matriz Completa de Funcionalidades para suporte detalhado por plataforma e funcionalidade.
Comparação Rápida de Plataformas
| Funcionalidade | Claude | Gemini | OpenAI | Markdown |
|---|---|---|---|---|
| Formato | ZIP + YAML | tar.gz | ZIP + Vector | ZIP |
| Upload | ✅ API | ✅ API | ✅ API | ❌ Manual |
| Aprimoramento | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ❌ Nenhum |
| Todos os Modos de Skill | ✅ | ✅ | ✅ | ✅ |
Exemplos de Uso
Coleta de Documentação
# Coletar site de documentação
skill-seekers scrape --config configs/react.json
# Coleta rápida sem configuração
skill-seekers scrape --url https://react.dev --name react
# Com modo assíncrono (3x mais rápido)
skill-seekers scrape --config configs/godot.json --async --workers 8
Extração de PDF
# Extração básica de PDF
skill-seekers pdf --pdf docs/manual.pdf --name myskill
# Funcionalidades avançadas
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
--extract-tables \ # Extrair tabelas
--parallel \ # Processamento paralelo rápido
--workers 8 # Usar 8 núcleos de CPU
# PDFs digitalizados (requer: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr
Extração de Vídeo
# Instalar suporte a vídeo
pip install skill-seekers[video] # Transcrições + metadados
pip install skill-seekers[video-full] # + Whisper + extração visual de frames
# Detectar GPU automaticamente e instalar dependências visuais (PyTorch + easyocr)
skill-seekers video --setup
# Extrair de vídeo do YouTube
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial
# Extrair de uma playlist do YouTube
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist
# Extrair de um arquivo de vídeo local
skill-seekers video --video-file recording.mp4 --name myrecording
# Extrair com análise visual de frames (requer dependências video-full)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual
# Com aprimoramento por IA (limpa OCR + gera SKILL.md polido)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2
# Recortar seção específica de um vídeo (suporta segundos, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00
# Usar Vision API para frames OCR de baixa confiança (requer ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr
# Reconstruir skill a partir de dados previamente extraídos (pular download)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial
Guia completo: Consulte docs/VIDEO_GUIDE.md para referência CLI completa, detalhes do pipeline visual, opções de aprimoramento com IA e troubleshooting.
Análise de Repositórios GitHub
# Coleta básica de repositório
skill-seekers github --repo facebook/react
# Com autenticação (rate limits mais altos)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react
# Personalizar o que incluir
skill-seekers github --repo django/django \
--include-issues \ # Extrair GitHub Issues
--max-issues 100 \ # Limitar quantidade de issues
--include-changelog # Extrair CHANGELOG.md
Coleta Unificada Multi-Fonte
Combine documentação + GitHub + PDF em uma skill unificada com detecção de conflitos:
# Use configs unificadas existentes
skill-seekers unified --config configs/react_unified.json
skill-seekers unified --config configs/django_unified.json
# Ou crie uma config unificada
cat > configs/myframework_unified.json << 'EOF'
{
"name": "myframework",
"merge_mode": "rule-based",
"sources": [
{
"type": "documentation",
"base_url": "https://docs.myframework.com/",
"max_pages": 200
},
{
"type": "github",
"repo": "owner/myframework",
"code_analysis_depth": "surface"
}
]
}
EOF
skill-seekers unified --config configs/myframework_unified.json
A Detecção de Conflitos encontra automaticamente:
- 🔴 Ausente no código (alta): Documentado mas não implementado
- 🟡 Ausente nos docs (média): Implementado mas não documentado
- ⚠️ Assinatura incompatível: Parâmetros/tipos diferentes
- ℹ️ Descrição incompatível: Explicações diferentes
Guia Completo: Consulte docs/UNIFIED_SCRAPING.md para documentação completa.
Repositórios Privados de Configuração
Compartilhe configs personalizadas entre equipes usando repositórios Git privados:
# Opção 1: Usando ferramentas MCP (recomendado)
# Registre o repositório privado da sua equipe
add_config_source(
name="team",
git_url="https://github.com/mycompany/skill-configs.git",
token_env="GITHUB_TOKEN"
)
# Busque config do repositório da equipe
fetch_config(source="team", config_name="internal-api")
Plataformas Suportadas:
- GitHub (
GITHUB_TOKEN), GitLab (GITLAB_TOKEN), Gitea (GITEA_TOKEN), Bitbucket (BITBUCKET_TOKEN)
Guia Completo: Consulte docs/GIT_CONFIG_SOURCES.md para documentação completa.
Como Funciona
graph LR
A[Site de Documentação] --> B[Skill Seekers]
B --> C[Coletor]
B --> D[Aprimoramento IA]
B --> E[Empacotador]
C --> F[Referências Organizadas]
D --> F
F --> E
E --> G[Claude Skill .zip]
G --> H[Upload para Claude AI]
- Detectar llms.txt - Verifica primeiro por llms-full.txt, llms.txt, llms-small.txt
- Coletar: Extrai todas as páginas da documentação
- Categorizar: Organiza o conteúdo em tópicos (API, guias, tutoriais, etc.)
- Aprimorar: IA analisa os docs e cria SKILL.md abrangente com exemplos
- Empacotar: Empacota tudo em um arquivo
.zippronto para o Claude
📋 Pré-requisitos
Antes de começar, certifique-se de ter:
- Python 3.10 ou superior - Download | Verificar:
python3 --version - Git - Download | Verificar:
git --version - 15-30 minutos para a configuração inicial
Primeira vez? → Comece Aqui: Guia de Início Rápido Infalível 🎯
📤 Enviando Skills para o Claude
Depois que sua skill estiver empacotada, você precisa enviá-la para o Claude:
Opção 1: Upload Automático (via API)
# Configure sua API key (uma única vez)
export ANTHROPIC_API_KEY=sk-ant-...
# Empacote e faça upload automaticamente
skill-seekers package output/react/ --upload
# OU faça upload de um .zip existente
skill-seekers upload output/react.zip
Opção 2: Upload Manual (Sem API Key)
# Empacote a skill
skill-seekers package output/react/
# → Cria output/react.zip
# Depois faça upload manualmente:
# - Acesse https://claude.ai/skills
# - Clique em "Upload Skill"
# - Selecione output/react.zip
Opção 3: MCP (Claude Code)
No Claude Code, basta pedir:
"Empacote e faça upload da skill React"
🤖 Instalando em Agentes de IA
O Skill Seekers pode instalar automaticamente skills em mais de 10 agentes de programação com IA.
# Instalar em agente específico
skill-seekers install-agent output/react/ --agent cursor
# Instalar em todos os agentes de uma vez
skill-seekers install-agent output/react/ --agent all
# Visualizar sem instalar
skill-seekers install-agent output/react/ --agent cursor --dry-run
Agentes Suportados
| Agente | Caminho | Tipo |
|---|---|---|
| Claude Code | ~/.claude/skills/ |
Global |
| Cursor | .cursor/skills/ |
Projeto |
| VS Code / Copilot | .github/skills/ |
Projeto |
| Amp | ~/.amp/skills/ |
Global |
| Goose | ~/.config/goose/skills/ |
Global |
| OpenCode | ~/.opencode/skills/ |
Global |
| Windsurf | ~/.windsurf/skills/ |
Global |
🔌 Integração MCP (26 Ferramentas)
O Skill Seekers inclui um servidor MCP para uso com Claude Code, Cursor, Windsurf, VS Code + Cline ou IntelliJ IDEA.
# Modo stdio (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp
# Modo HTTP (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
# Configurar automaticamente todos os agentes de uma vez
./setup_mcp.sh
Todas as 26 ferramentas disponíveis:
- Núcleo (9):
list_configs,generate_config,validate_config,estimate_pages,scrape_docs,package_skill,upload_skill,enhance_skill,install_skill - Estendidas (10):
scrape_github,scrape_pdf,unified_scrape,merge_sources,detect_conflicts,add_config_source,fetch_config,list_config_sources,remove_config_source,split_config - Bancos Vetoriais (4):
export_to_chroma,export_to_weaviate,export_to_faiss,export_to_qdrant - Nuvem (3):
cloud_upload,cloud_download,cloud_list
Guia Completo: docs/MCP_SETUP.md
⚙️ Configuração
Presets Disponíveis (24+)
# Listar todos os presets
skill-seekers list-configs
| Categoria | Presets |
|---|---|
| Frameworks Web | react, vue, angular, svelte, nextjs |
| Python | django, flask, fastapi, sqlalchemy, pytest |
| Desenvolvimento de Jogos | godot, pygame, unity |
| Ferramentas e DevOps | docker, kubernetes, terraform, ansible |
| Unificados (Docs + GitHub) | react-unified, vue-unified, nextjs-unified e mais |
Criando Sua Própria Configuração
# Opção 1: Interativo
skill-seekers scrape --interactive
# Opção 2: Copie e edite um preset
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json
Estrutura do Arquivo de Configuração
{
"name": "myframework",
"description": "Quando usar esta skill",
"base_url": "https://docs.myframework.com/",
"selectors": {
"main_content": "article",
"title": "h1",
"code_blocks": "pre code"
},
"url_patterns": {
"include": ["/docs", "/guide"],
"exclude": ["/blog", "/about"]
},
"categories": {
"getting_started": ["intro", "quickstart"],
"api": ["api", "reference"]
},
"rate_limit": 0.5,
"max_pages": 500
}
Onde Armazenar Configurações
A ferramenta busca na seguinte ordem:
- Caminho exato fornecido
./configs/(diretório atual)~/.config/skill-seekers/configs/(diretório de configuração do usuário)- API SkillSeekersWeb.com (configurações predefinidas)
📊 O que é Criado
output/
├── godot_data/ # Dados brutos coletados
│ ├── pages/ # Arquivos JSON (um por página)
│ └── summary.json # Resumo geral
│
└── godot/ # A skill
├── SKILL.md # Aprimorado com exemplos reais
├── references/ # Docs categorizados
│ ├── index.md
│ ├── getting_started.md
│ ├── scripting.md
│ └── ...
├── scripts/ # Vazio (adicione os seus)
└── assets/ # Vazio (adicione os seus)
🐛 Solução de Problemas
Nenhum Conteúdo Extraído?
- Verifique seu seletor
main_content - Tente:
article,main,div[role="main"]
Dados Existem Mas Não São Usados?
# Forçar re-coleta
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json
Categorias Não Estão Boas?
Edite a seção categories da configuração com palavras-chave melhores.
Quer Atualizar os Docs?
# Apague dados antigos e recolete
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json
Aprimoramento Não Funciona?
# Verifique se a API key está configurada
echo $ANTHROPIC_API_KEY
# Tente o modo LOCAL (usa Claude Code Max, sem necessidade de API key)
skill-seekers enhance output/react/ --mode LOCAL
# Monitore o status do aprimoramento em segundo plano
skill-seekers enhance-status output/react/ --watch
Problemas de Rate Limit do GitHub?
# Configure um token GitHub (5000 req/hora vs 60/hora anônimo)
export GITHUB_TOKEN=ghp_your_token_here
# Ou configure múltiplos perfis
skill-seekers config --github
📈 Performance
| Tarefa | Tempo | Observações |
|---|---|---|
| Coleta (síncrona) | 15-45 min | Apenas na primeira vez, baseada em threads |
| Coleta (assíncrona) | 5-15 min | 2-3x mais rápida com a flag --async |
| Construção | 1-3 min | Reconstrução rápida a partir do cache |
| Reconstrução | <1 min | Com --skip-scrape |
| Aprimoramento (LOCAL) | 30-60 seg | Usa Claude Code Max |
| Aprimoramento (API) | 20-40 seg | Requer API key |
| Vídeo (transcrição) | 1-3 min | YouTube/local, apenas transcrição |
| Vídeo (visual) | 5-15 min | + extração OCR de frames |
| Empacotamento | 5-10 seg | Criação final do .zip |
📚 Documentação
Primeiros Passos
- BULLETPROOF_QUICKSTART.md - 🎯 COMECE AQUI se você é novo!
- QUICKSTART.md - Início rápido para usuários experientes
- TROUBLESHOOTING.md - Problemas comuns e soluções
- docs/QUICK_REFERENCE.md - Folha de referência rápida
Guias
- docs/LARGE_DOCUMENTATION.md - Processar docs de 10K-40K+ páginas
- ASYNC_SUPPORT.md - Guia do modo assíncrono (coleta 2-3x mais rápida)
- docs/ENHANCEMENT_MODES.md - Guia de modos de aprimoramento com IA
- docs/MCP_SETUP.md - Configuração da integração MCP
- docs/UNIFIED_SCRAPING.md - Coleta multi-fonte
- docs/VIDEO_GUIDE.md - Guia de extração de vídeo
Guias de Integração
- docs/integrations/LANGCHAIN.md - LangChain RAG
- docs/integrations/CURSOR.md - Cursor IDE
- docs/integrations/WINDSURF.md - Windsurf IDE
- docs/integrations/CLINE.md - Cline (VS Code)
- docs/integrations/RAG_PIPELINES.md - Todos os pipelines RAG
📝 Licença
Licença MIT - consulte o arquivo LICENSE para detalhes
Bom trabalho construindo skills! 🚀

