firefrost-gaming/skill-seekers-reference

Files

yusyus 9e405df9d0 docs: add README translations for 10 languages (12 total)

Add machine-translated README files for Japanese, Korean, Spanish,
French, German, Portuguese (BR), Turkish, Arabic, Hindi, and Russian.
Update language selector in English and Chinese READMEs to link all 12
versions.

New files: README.{ja,ko,es,fr,de,pt-BR,tr,ar,hi,ru}.md
Modified: README.md, README.zh-CN.md (language selector bar)

2026-03-15 16:27:05 +03:00

48 KiB

Raw Blame History

Skill Seekers

⚠️ Aviso de tradução automática

Este documento foi traduzido automaticamente por IA. Embora nos esforcemos para garantir a qualidade, podem existir expressões imprecisas.

Ajude a melhorar a tradução através do GitHub Issue #260! Seu feedback é muito valioso para nós.

🧠 A camada de dados para sistemas de IA. O Skill Seekers transforma sites de documentação, repositórios GitHub, PDFs, vídeos, Jupyter Notebooks, wikis e mais de 17 tipos de fontes em ativos de conhecimento estruturado — prontos para alimentar AI Skills (Claude, Gemini, OpenAI), pipelines RAG (LangChain, LlamaIndex, Pinecone) e assistentes de programação com IA (Cursor, Windsurf, Cline) em minutos, não horas.

🌐 Visite SkillSeekersWeb.com - Navegue por mais de 24 configurações predefinidas, compartilhe suas configurações e acesse a documentação completa!

📋 Veja o Roteiro de Desenvolvimento e Tarefas - 134 tarefas em 10 categorias, escolha qualquer uma para contribuir!

🧠 A Camada de Dados para Sistemas de IA

Skill Seekers é a camada universal de pré-processamento que fica entre a documentação bruta e todo sistema de IA que a consome. Seja para construir Claude Skills, um pipeline RAG com LangChain ou um arquivo .cursorrules para o Cursor — a preparação dos dados é idêntica. Faça uma vez e exporte para todos os destinos.

# Um comando → ativo de conhecimento estruturado
skill-seekers create https://docs.react.dev/
# ou: skill-seekers create facebook/react
# ou: skill-seekers create ./my-project

# Exporte para qualquer sistema de IA
skill-seekers package output/react --target claude      # → Claude AI Skill (ZIP)
skill-seekers package output/react --target langchain   # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor      # → .cursorrules

O que é gerado

Saída	Destino	Para que serve
Claude Skill (ZIP + YAML)	`--target claude`	Claude Code, Claude API
Gemini Skill (tar.gz)	`--target gemini`	Google Gemini
OpenAI / Custom GPT (ZIP)	`--target openai`	GPT-4o, assistentes personalizados
LangChain Documents	`--target langchain`	Cadeias de QA, agentes, recuperadores
LlamaIndex TextNodes	`--target llama-index`	Motores de consulta, motores de chat
Haystack Documents	`--target haystack`	Pipelines RAG empresariais
Pinecone-ready (Markdown)	`--target markdown`	Upload de vetores
ChromaDB / FAISS / Qdrant	`--format chroma/faiss/qdrant`	Bancos de dados vetoriais locais
Cursor `.cursorrules`	`--target claude` → copiar	Contexto de IA do Cursor IDE
Windsurf / Cline / Continue	`--target claude` → copiar	VS Code, IntelliJ, Vim

Por que isso importa

⚡ 99% mais rápido — Dias de preparação manual de dados → 15–45 minutos
🎯 Qualidade de AI Skill — Arquivos SKILL.md com mais de 500 linhas com exemplos, padrões e guias
📊 Chunks prontos para RAG — Chunking inteligente que preserva blocos de código e mantém o contexto
🎬 Vídeos — Extraia código, transcrições e conhecimento estruturado do YouTube e vídeos locais
🔄 Multi-fonte — Combine 17 tipos de fontes (docs, GitHub, PDFs, vídeos, notebooks, wikis e mais) em um único ativo de conhecimento
🌐 Uma preparação, todos os destinos — Exporte o mesmo ativo para 16 plataformas sem precisar recoletá-lo
✅ Testado em batalha — Mais de 2.540 testes, mais de 24 presets de frameworks, pronto para produção

🚀 Início Rápido (3 Comandos)

# 1. Instalar
pip install skill-seekers

# 2. Criar skill a partir de qualquer fonte
skill-seekers create https://docs.django.com/

# 3. Empacotar para sua plataforma de IA
skill-seekers package output/django --target claude

Pronto! Agora você tem output/django-claude.zip pronto para usar.

Outras Fontes (17 Suportadas)

# Repositório GitHub
skill-seekers create facebook/react

# Projeto local
skill-seekers create ./my-project

# Documento PDF
skill-seekers create manual.pdf

# Documento Word
skill-seekers create report.docx

# E-book EPUB
skill-seekers create book.epub

# Jupyter Notebook
skill-seekers create notebook.ipynb

# Especificação OpenAPI
skill-seekers create openapi.yaml

# Apresentação PowerPoint
skill-seekers create presentation.pptx

# Documento AsciiDoc
skill-seekers create guide.adoc

# Arquivo HTML local
skill-seekers create page.html

# Feed RSS/Atom
skill-seekers create feed.rss

# Man page
skill-seekers create curl.1

# Vídeo (YouTube, Vimeo ou arquivo local — requer skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# Primeira vez? Instale automaticamente as dependências visuais com detecção de GPU:
skill-seekers video --setup

# Wiki Confluence
skill-seekers confluence --space TEAM --name wiki

# Páginas Notion
skill-seekers notion --database-id ... --name docs

# Exportação de chat Slack/Discord
skill-seekers chat --export-dir ./slack-export --name team-chat

Exporte para Qualquer Lugar

# Empacote para múltiplas plataformas
for platform in claude gemini openai langchain; do
  skill-seekers package output/django --target $platform
done

O que é o Skill Seekers?

O Skill Seekers é a camada de dados para sistemas de IA. Ele transforma 17 tipos de fontes — sites de documentação, repositórios GitHub, PDFs, vídeos, Jupyter Notebooks, documentos Word/EPUB/AsciiDoc, especificações OpenAPI, apresentações PowerPoint, feeds RSS, man pages, wikis Confluence, páginas Notion, exportações Slack/Discord e mais — em ativos de conhecimento estruturado para qualquer destino de IA:

Caso de Uso	O que você obtém	Exemplos
AI Skills	SKILL.md abrangente + referências	Claude Code, Gemini, GPT
Pipelines RAG	Documentos fragmentados com metadados ricos	LangChain, LlamaIndex, Haystack
Bancos de Dados Vetoriais	Dados pré-formatados prontos para upload	Pinecone, Chroma, Weaviate, FAISS
Assistentes de Programação com IA	Arquivos de contexto que sua IDE lê automaticamente	Cursor, Windsurf, Cline, Continue.dev

O Skill Seekers substitui dias de pré-processamento manual com os seguintes passos:

Coleta — Docs, repositórios GitHub, bases de código locais, PDFs, vídeos, Jupyter Notebooks, wikis e mais de 17 tipos de fontes
Análise — Parsing AST profundo, detecção de padrões, extração de APIs
Estruturação — Arquivos de referência categorizados com metadados
Aprimoramento — Geração de SKILL.md com IA (Claude, Gemini ou local)
Exportação — 16 formatos específicos por plataforma a partir de um único ativo

Por que Usar o Skill Seekers?

Para Construtores de AI Skills (Claude, Gemini, OpenAI)

🎯 Skills de nível de produção — Arquivos SKILL.md com mais de 500 linhas com exemplos de código, padrões e guias
🔄 Workflows de aprimoramento — Aplique security-focus, architecture-comprehensive ou presets YAML personalizados
🎮 Qualquer domínio — Motores de jogos (Godot, Unity), frameworks (React, Django), ferramentas internas
🔧 Equipes — Combine documentação interna + código em uma única fonte da verdade
📚 Qualidade — Aprimorado por IA com exemplos, referência rápida e orientação de navegação

Para Construtores de RAG e Engenheiros de IA

🤖 Dados prontos para RAG — Documents LangChain, TextNodes LlamaIndex, Documents Haystack pré-fragmentados
🚀 99% mais rápido — Dias de pré-processamento → 15–45 minutos
📊 Metadados inteligentes — Categorias, fontes, tipos → melhor precisão de recuperação
🔄 Multi-fonte — Combine docs + GitHub + PDFs + vídeos em um pipeline
🌐 Agnóstico de plataforma — Exporte para qualquer banco vetorial ou framework sem recoleta

Para Usuários de Assistentes de Programação com IA

💻 Cursor / Windsurf / Cline — Gere .cursorrules / .windsurfrules / .clinerules automaticamente
🎯 Contexto persistente — A IA "conhece" seus frameworks sem prompts repetidos
📚 Sempre atualizado — Atualize o contexto em minutos quando a documentação mudar

Funcionalidades Principais

🌐 Coleta de Documentação

✅ Suporte a llms.txt - Detecta e usa automaticamente arquivos de documentação prontos para LLM (10x mais rápido)
✅ Scraper Universal - Funciona com QUALQUER site de documentação
✅ Categorização Inteligente - Organiza conteúdo automaticamente por tópico
✅ Detecção de Linguagem de Código - Reconhece Python, JavaScript, C++, GDScript, etc.
✅ Mais de 24 Presets Prontos - Godot, React, Vue, Django, FastAPI e mais

📄 Suporte a PDF

✅ Extração Básica de PDF - Extraia texto, código e imagens de arquivos PDF
✅ OCR para PDFs Digitalizados - Extraia texto de documentos digitalizados
✅ PDFs Protegidos por Senha - Processe PDFs criptografados
✅ Extração de Tabelas - Extraia tabelas complexas de PDFs
✅ Processamento Paralelo - 3x mais rápido para PDFs grandes
✅ Cache Inteligente - 50% mais rápido em re-execuções

🎬 Extração de Vídeo

✅ YouTube e Vídeos Locais - Extraia transcrições, código na tela e conhecimento estruturado de vídeos
✅ Análise Visual de Frames - Extração OCR de editores de código, terminais, slides e diagramas
✅ Detecção Automática de GPU - Instala automaticamente a versão correta do PyTorch (CUDA/ROCm/MPS/CPU)
✅ Aprimoramento com IA - Dois passes: limpeza de artefatos OCR + geração de SKILL.md polido
✅ Recorte Temporal - Extraia seções específicas com --start-time e --end-time
✅ Suporte a Playlists - Processe em lote todos os vídeos de uma playlist do YouTube
✅ Fallback com Vision API - Use Claude Vision para frames OCR de baixa confiança

🐙 Análise de Repositórios GitHub

✅ Análise Profunda de Código - Parsing AST para Python, JavaScript, TypeScript, Java, C++, Go
✅ Extração de API - Funções, classes, métodos com parâmetros e tipos
✅ Metadados do Repositório - README, árvore de arquivos, distribuição de linguagens, stars/forks
✅ GitHub Issues e PRs - Obtenha issues abertas/fechadas com labels e milestones
✅ CHANGELOG e Releases - Extração automática do histórico de versões
✅ Detecção de Conflitos - Compare APIs documentadas vs implementação real do código
✅ Integração MCP - Linguagem natural: "Colete o repositório GitHub facebook/react"

🔄 Coleta Unificada Multi-Fonte

✅ Combine Múltiplas Fontes - Misture documentação + GitHub + PDF em uma skill
✅ Detecção de Conflitos - Encontra automaticamente discrepâncias entre docs e código
✅ Mesclagem Inteligente - Resolução de conflitos baseada em regras ou com IA
✅ Relatórios Transparentes - Comparação lado a lado com avisos ⚠️
✅ Análise de Lacunas na Documentação - Identifica docs desatualizadas e funcionalidades não documentadas
✅ Fonte Única da Verdade - Uma skill mostrando tanto a intenção (docs) quanto a realidade (código)
✅ Retrocompatível - Configurações legadas de fonte única continuam funcionando

🤖 Suporte a Múltiplas Plataformas LLM

✅ 4 Plataformas LLM - Claude AI, Google Gemini, OpenAI ChatGPT, Markdown Genérico
✅ Coleta Universal - A mesma documentação funciona para todas as plataformas
✅ Empacotamento Específico por Plataforma - Formatos otimizados para cada LLM
✅ Exportação com Um Comando - Flag --target seleciona a plataforma
✅ Dependências Opcionais - Instale apenas o que precisa
✅ 100% Retrocompatível - Workflows existentes do Claude permanecem inalterados

Plataforma	Formato	Upload	Aprimoramento	API Key	Endpoint Personalizado
Claude AI	ZIP + YAML	✅ Automático	✅ Sim	ANTHROPIC_API_KEY	ANTHROPIC_BASE_URL
Google Gemini	tar.gz	✅ Automático	✅ Sim	GOOGLE_API_KEY	-
OpenAI ChatGPT	ZIP + Vector Store	✅ Automático	✅ Sim	OPENAI_API_KEY	-
Markdown Genérico	ZIP	❌ Manual	❌ Não	-	-

# Claude (padrão - sem alterações necessárias!)
skill-seekers package output/react/
skill-seekers upload react.zip

# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini

# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai

# Markdown Genérico (exportação universal)
skill-seekers package output/react/ --target markdown
# Use os arquivos markdown diretamente em qualquer LLM

🔧 Variáveis de Ambiente para APIs Compatíveis com Claude (ex.: GLM-4.7)

O Skill Seekers suporta qualquer endpoint de API compatível com Claude:

# Opção 1: API oficial da Anthropic (padrão)
export ANTHROPIC_API_KEY=sk-ant-...

# Opção 2: API compatível com Claude GLM-4.7
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1

# Todas as funcionalidades de aprimoramento com IA usarão o endpoint configurado
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance

Nota: Configurar ANTHROPIC_BASE_URL permite que você use qualquer endpoint de API compatível com Claude, como GLM-4.7 ou outros serviços compatíveis.

Instalação:

# Instalar com suporte ao Gemini
pip install skill-seekers[gemini]

# Instalar com suporte ao OpenAI
pip install skill-seekers[openai]

# Instalar com todas as plataformas LLM
pip install skill-seekers[all-llms]

🔗 Integrações com Frameworks RAG

✅ LangChain Documents - Exportação direta para formato Document com page_content + metadados
- Ideal para: Cadeias de QA, recuperadores, armazenamentos vetoriais, agentes
- Exemplo: Pipeline RAG LangChain
- Guia: Integração LangChain
✅ LlamaIndex TextNodes - Exportação para formato TextNode com IDs únicos + embeddings
- Ideal para: Motores de consulta, motores de chat, contexto de armazenamento
- Exemplo: Motor de Consulta LlamaIndex
- Guia: Integração LlamaIndex
✅ Formato Pinecone-Ready - Otimizado para upload em bancos de dados vetoriais
- Ideal para: Busca vetorial em produção, busca semântica, busca híbrida
- Exemplo: Upload Pinecone
- Guia: Integração Pinecone

Exportação Rápida:

# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json

# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json

# Markdown (Universal)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/

Guia Completo de Pipeline RAG: Documentação de Pipelines RAG

🧠 Integrações com Assistentes de Programação com IA

Transforme qualquer documentação de framework em contexto especializado de programação para mais de 4 assistentes de IA:

✅ Cursor IDE - Gere .cursorrules para sugestões de código com IA
- Ideal para: Geração de código específica de framework, padrões consistentes
- Funciona com: Cursor IDE (fork do VS Code)
- Guia: Integração Cursor
- Exemplo: Cursor React Skill
✅ Windsurf - Personalize o contexto do assistente de IA do Windsurf com .windsurfrules
- Ideal para: Assistência de IA nativa na IDE, programação baseada em fluxo
- Funciona com: Windsurf IDE da Codeium
- Guia: Integração Windsurf
- Exemplo: Contexto FastAPI Windsurf
✅ Cline (VS Code) - Prompts de sistema + MCP para agente VS Code
- Ideal para: Geração de código agentiva no VS Code
- Funciona com: Extensão Cline para VS Code
- Guia: Integração Cline
- Exemplo: Assistente Django Cline
✅ Continue.dev - Servidores de contexto para IA agnóstica de IDE
- Ideal para: Ambientes multi-IDE (VS Code, JetBrains, Vim), provedores de LLM personalizados
- Funciona com: Qualquer IDE com plugin Continue.dev
- Guia: Integração Continue
- Exemplo: Contexto Universal Continue

Exportação Rápida para Ferramentas de Programação com IA:

# Para qualquer assistente de programação com IA (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude  # ou --target markdown

# Copie para seu projeto (exemplo para Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules

# Ou para Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md

# Ou para Cline
cp output/django-claude/SKILL.md my-project/.clinerules

# Ou para Continue.dev (servidor HTTP)
python examples/continue-dev-universal/context_server.py
# Configure em ~/.continue/config.json

Hub de Integrações: Todas as Integrações com Sistemas de IA

🌊 Arquitetura GitHub de Três Fluxos

✅ Análise em Três Fluxos - Divide repositórios GitHub em fluxos de Código, Docs e Insights
✅ Analisador de Codebase Unificado - Funciona com URLs do GitHub E caminhos locais
✅ C3.x como Profundidade de Análise - Escolha 'basic' (1-2 min) ou 'c3x' (20-60 min)
✅ Geração Aprimorada de Router - Metadados do GitHub, quick start do README, problemas comuns
✅ Integração de Issues - Principais problemas e soluções dos GitHub Issues
✅ Keywords de Roteamento Inteligente - Labels do GitHub com peso 2x para melhor detecção de tópicos

Explicação dos Três Fluxos:

Fluxo 1: Código - Análise profunda C3.x (padrões, exemplos, guias, configs, arquitetura)
Fluxo 2: Docs - Documentação do repositório (README, CONTRIBUTING, docs/*.md)
Fluxo 3: Insights - Conhecimento da comunidade (issues, labels, stars, forks)

from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer

# Analise repositório GitHub com os três fluxos
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
    source="https://github.com/facebook/react",
    depth="c3x",  # ou "basic" para análise rápida
    fetch_github_metadata=True
)

# Acesse o fluxo de código (análise C3.x)
print(f"Padrões de design: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Exemplos de teste: {result.code_analysis['c3_2_examples_count']}")

# Acesse o fluxo de docs (documentação do repositório)
print(f"README: {result.github_docs['readme'][:100]}")

# Acesse o fluxo de insights (metadados do GitHub)
print(f"Stars: {result.github_insights['metadata']['stars']}")
print(f"Problemas comuns: {len(result.github_insights['common_problems'])}")

Documentação completa: Resumo da Implementação de Três Fluxos

🔐 Gerenciamento Inteligente de Rate Limit e Configuração

✅ Sistema de Configuração Multi-Token - Gerencie múltiplas contas GitHub (pessoal, trabalho, OSS)
- Armazenamento seguro de configurações em ~/.config/skill-seekers/config.json (permissões 600)
- Estratégias de rate limit por perfil: prompt, wait, switch, fail
- Timeout configurável por perfil (padrão: 30 min, evita esperas indefinidas)
- Cadeia de fallback inteligente: Argumento CLI → Variável de ambiente → Arquivo de configuração → Prompt
- Gerenciamento de API keys para Claude, Gemini, OpenAI
✅ Assistente de Configuração Interativo - Interface de terminal elegante para fácil configuração
- Integração com navegador para criação de tokens (abre automaticamente GitHub, etc.)
- Validação de tokens e teste de conexão
- Exibição visual de status com código de cores
✅ Gerenciador Inteligente de Rate Limit - Chega de esperas indefinidas!
- Aviso prévio sobre rate limits (60/hora vs 5000/hora)
- Detecção em tempo real das respostas da API do GitHub
- Contadores regressivos ao vivo com progresso
- Troca automática de perfil quando limitado
- Quatro estratégias: prompt (perguntar), wait (contagem regressiva), switch (tentar outro), fail (abortar)
✅ Capacidade de Retomada - Continue trabalhos interrompidos
- Salvamento automático de progresso em intervalos configuráveis (padrão: 60 seg)
- Liste todos os trabalhos retomáveis com detalhes de progresso
- Limpeza automática de trabalhos antigos (padrão: 7 dias)
✅ Suporte CI/CD - Modo não interativo para automação
- Flag --non-interactive falha rapidamente sem prompts
- Flag --profile para selecionar conta GitHub específica
- Mensagens de erro claras para logs de pipeline

Configuração Rápida:

# Configuração única (5 minutos)
skill-seekers config --github

# Use perfil específico para repos privados
skill-seekers github --repo mycompany/private-repo --profile work

# Modo CI/CD (falha rápida, sem prompts)
skill-seekers github --repo owner/repo --non-interactive

# Retomar trabalho interrompido
skill-seekers resume --list
skill-seekers resume github_react_20260117_143022

Estratégias de Rate Limit Explicadas:

prompt (padrão) - Pergunta o que fazer quando limitado (esperar, trocar, configurar token, cancelar)
wait - Espera automaticamente com contador regressivo (respeita timeout)
switch - Tenta automaticamente o próximo perfil disponível (para configurações multi-conta)
fail - Falha imediatamente com erro claro (ideal para CI/CD)

🎯 Bootstrap Skill - Auto-Hospedagem

Gere o skill-seekers como uma Claude Code Skill para uso dentro do Claude:

# Gere a skill
./scripts/bootstrap_skill.sh

# Instale no Claude Code
cp -r output/skill-seekers ~/.claude/skills/

O que você obtém:

✅ Documentação completa da skill - Todos os comandos CLI e padrões de uso
✅ Referência de comandos CLI - Cada ferramenta e suas opções documentadas
✅ Exemplos de início rápido - Workflows comuns e melhores práticas
✅ Documentação de API auto-gerada - Análise de código, padrões e exemplos

🔐 Repositórios Privados de Configuração

✅ Fontes de Config Baseadas em Git - Busque configs de repositórios Git privados/de equipe
✅ Gerenciamento Multi-Fonte - Registre repositórios ilimitados do GitHub, GitLab, Bitbucket
✅ Colaboração em Equipe - Compartilhe configs personalizadas entre equipes de 3-5 pessoas
✅ Suporte Empresarial - Escale para mais de 500 desenvolvedores com resolução baseada em prioridade
✅ Autenticação Segura - Tokens em variáveis de ambiente (GITHUB_TOKEN, GITLAB_TOKEN)
✅ Cache Inteligente - Clone uma vez, receba atualizações automaticamente
✅ Modo Offline - Trabalhe com configs em cache quando estiver offline

🤖 Análise de Codebase (C3.x)

C3.4: Extração de Padrões de Configuração com Aprimoramento por IA

✅ 9 Formatos de Config - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
✅ 7 Tipos de Padrão - Banco de dados, API, logging, cache, e-mail, autenticação, configurações de servidor
✅ Aprimoramento por IA - Análise de IA opcional em modo duplo (API + LOCAL)
- Explica o que cada config faz
- Sugere melhores práticas e melhorias
- Análise de segurança - Encontra segredos hardcoded, credenciais expostas
✅ Auto-Documentação - Gera documentação JSON + Markdown de todas as configs
✅ Integração MCP - Ferramenta extract_config_patterns com suporte a aprimoramento

C3.3: Guias How-To Aprimorados por IA

✅ Aprimoramento Abrangente por IA - Transforma guias básicos em tutoriais profissionais
✅ 5 Melhorias Automáticas - Descrições de etapas, troubleshooting, pré-requisitos, próximos passos, casos de uso
✅ Suporte Dual-Mode - Modo API (Claude API) ou modo LOCAL (Claude Code CLI)
✅ Sem Custo com Modo LOCAL - Aprimoramento GRATUITO usando seu plano Claude Code Max
✅ Transformação de Qualidade - Templates de 75 linhas → guias abrangentes de mais de 500 linhas

Uso:

# Análise rápida (1-2 min, apenas funcionalidades básicas)
skill-seekers analyze --directory tests/ --quick

# Análise abrangente com IA (20-60 min, todas as funcionalidades)
skill-seekers analyze --directory tests/ --comprehensive

# Com aprimoramento por IA
skill-seekers analyze --directory tests/ --enhance

Documentação Completa: docs/HOW_TO_GUIDES.md

🔄 Presets de Workflow de Aprimoramento

Pipelines de aprimoramento reutilizáveis definidos em YAML que controlam como a IA transforma sua documentação bruta em uma skill polida.

✅ 5 Presets Incluídos — default, minimal, security-focus, architecture-comprehensive, api-documentation
✅ Presets Definidos pelo Usuário — Adicione workflows personalizados em ~/.config/skill-seekers/workflows/
✅ Múltiplos Workflows — Encadeie dois ou mais workflows em um comando
✅ CLI Totalmente Gerenciada — Liste, inspecione, copie, adicione, remova e valide workflows

# Aplique um único workflow
skill-seekers create ./my-project --enhance-workflow security-focus

# Encadeie múltiplos workflows (aplicados em ordem)
skill-seekers create ./my-project \
  --enhance-workflow security-focus \
  --enhance-workflow minimal

# Gerencie presets
skill-seekers workflows list                          # Liste todos (incluídos + usuário)
skill-seekers workflows show security-focus           # Exiba conteúdo YAML
skill-seekers workflows copy security-focus           # Copie para diretório do usuário para edição
skill-seekers workflows add ./my-workflow.yaml        # Instale um preset personalizado
skill-seekers workflows remove my-workflow            # Remova um preset do usuário
skill-seekers workflows validate security-focus       # Valide a estrutura do preset

# Copie múltiplos de uma vez
skill-seekers workflows copy security-focus minimal api-documentation

# Adicione múltiplos arquivos de uma vez
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml

# Remova múltiplos de uma vez
skill-seekers workflows remove my-wf-a my-wf-b

Formato de preset YAML:

name: security-focus
description: "Revisão focada em segurança: vulnerabilidades, autenticação, tratamento de dados"
version: "1.0"
stages:
  - name: vulnerabilities
    type: custom
    prompt: "Revise vulnerabilidades OWASP top 10 e vulnerabilidades de segurança comuns..."
  - name: auth-review
    type: custom
    prompt: "Examine padrões de autenticação e autorização..."
    uses_history: true

⚡ Performance e Escalabilidade

✅ Modo Assíncrono - Coleta 2-3x mais rápida com async/await (use a flag --async)
✅ Suporte a Documentações Grandes - Processe docs de 10K-40K+ páginas com divisão inteligente
✅ Skills Router/Hub - Roteamento inteligente para sub-skills especializadas
✅ Coleta Paralela - Processe múltiplas skills simultaneamente
✅ Checkpoint/Retomada - Nunca perca progresso em coletas longas
✅ Sistema de Cache - Colete uma vez, reconstrua instantaneamente

✅ Garantia de Qualidade

✅ Totalmente Testado - Mais de 2.540 testes com cobertura abrangente

📦 Instalação

# Instalação básica (coleta de documentação, análise GitHub, PDF, empacotamento)
pip install skill-seekers

# Com suporte a todas as plataformas LLM
pip install skill-seekers[all-llms]

# Com servidor MCP
pip install skill-seekers[mcp]

# Tudo incluído
pip install skill-seekers[all]

Precisa de ajuda para escolher? Execute o assistente de configuração:

skill-seekers-setup

Opções de Instalação

Instalação	Funcionalidades
`pip install skill-seekers`	Coleta, análise GitHub, PDF, todas as plataformas
`pip install skill-seekers[gemini]`	+ Suporte ao Google Gemini
`pip install skill-seekers[openai]`	+ Suporte ao OpenAI ChatGPT
`pip install skill-seekers[all-llms]`	+ Todas as plataformas LLM
`pip install skill-seekers[mcp]`	+ Servidor MCP para Claude Code, Cursor, etc.
`pip install skill-seekers[video]`	+ Extração de transcrições e metadados do YouTube/Vimeo
`pip install skill-seekers[video-full]`	+ Transcrição Whisper e extração visual de frames
`pip install skill-seekers[jupyter]`	+ Suporte a Jupyter Notebook
`pip install skill-seekers[pptx]`	+ Suporte a PowerPoint
`pip install skill-seekers[confluence]`	+ Suporte a wiki Confluence
`pip install skill-seekers[notion]`	+ Suporte a páginas Notion
`pip install skill-seekers[rss]`	+ Suporte a feeds RSS/Atom
`pip install skill-seekers[chat]`	+ Suporte a exportação de chat Slack/Discord
`pip install skill-seekers[asciidoc]`	+ Suporte a documentos AsciiDoc
`pip install skill-seekers[all]`	Tudo habilitado

Dependências visuais de vídeo (detecção de GPU): Após instalar skill-seekers[video-full], execute skill-seekers video --setup para detectar automaticamente sua GPU e instalar a variante correta do PyTorch + easyocr. Esta é a forma recomendada de instalar as dependências de extração visual.

🚀 Workflow de Instalação com Um Comando

A forma mais rápida de ir da configuração à skill enviada — automação completa:

# Instale a skill React a partir das configs oficiais (upload automático para o Claude)
skill-seekers install --config react

# Instale a partir de arquivo de configuração local
skill-seekers install --config configs/custom.json

# Instale sem fazer upload (apenas empacotar)
skill-seekers install --config django --no-upload

# Visualize o workflow sem executar
skill-seekers install --config react --dry-run

Tempo: 20-45 minutos no total | Qualidade: Pronto para produção (9/10) | Custo: Gratuito

Fases executadas:

📥 FASE 1: Buscar Configuração (se nome da config for fornecido)
📖 FASE 2: Coletar Documentação
✨ FASE 3: Aprimoramento com IA (OBRIGATÓRIO - sem opção de pular)
📦 FASE 4: Empacotar Skill
☁️  FASE 5: Upload para o Claude (opcional, requer API key)

Requisitos:

Variável de ambiente ANTHROPIC_API_KEY (para upload automático)
Plano Claude Code Max (para aprimoramento com IA local)

📊 Matriz de Funcionalidades

O Skill Seekers suporta 4 plataformas LLM, 17 tipos de fontes e paridade completa de funcionalidades em todos os destinos.

Plataformas: Claude AI, Google Gemini, OpenAI ChatGPT, Markdown Genérico Tipos de Fontes: Sites de documentação, repositórios GitHub, PDFs, Word (.docx), EPUB, Vídeo, Codebases locais, Jupyter Notebooks, HTML local, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), feeds RSS/Atom, Man pages, wikis Confluence, páginas Notion, exportações de chat Slack/Discord

Consulte a Matriz Completa de Funcionalidades para suporte detalhado por plataforma e funcionalidade.

Comparação Rápida de Plataformas

Funcionalidade	Claude	Gemini	OpenAI	Markdown
Formato	ZIP + YAML	tar.gz	ZIP + Vector	ZIP
Upload	✅ API	✅ API	✅ API	❌ Manual
Aprimoramento	✅ Sonnet 4	✅ 2.0 Flash	✅ GPT-4o	❌ Nenhum
Todos os Modos de Skill	✅	✅	✅	✅

Exemplos de Uso

Coleta de Documentação

# Coletar site de documentação
skill-seekers scrape --config configs/react.json

# Coleta rápida sem configuração
skill-seekers scrape --url https://react.dev --name react

# Com modo assíncrono (3x mais rápido)
skill-seekers scrape --config configs/godot.json --async --workers 8

Extração de PDF

# Extração básica de PDF
skill-seekers pdf --pdf docs/manual.pdf --name myskill

# Funcionalidades avançadas
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
    --extract-tables \        # Extrair tabelas
    --parallel \              # Processamento paralelo rápido
    --workers 8               # Usar 8 núcleos de CPU

# PDFs digitalizados (requer: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr

Extração de Vídeo

# Instalar suporte a vídeo
pip install skill-seekers[video]        # Transcrições + metadados
pip install skill-seekers[video-full]   # + Whisper + extração visual de frames

# Detectar GPU automaticamente e instalar dependências visuais (PyTorch + easyocr)
skill-seekers video --setup

# Extrair de vídeo do YouTube
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial

# Extrair de uma playlist do YouTube
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist

# Extrair de um arquivo de vídeo local
skill-seekers video --video-file recording.mp4 --name myrecording

# Extrair com análise visual de frames (requer dependências video-full)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual

# Com aprimoramento por IA (limpa OCR + gera SKILL.md polido)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2

# Recortar seção específica de um vídeo (suporta segundos, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00

# Usar Vision API para frames OCR de baixa confiança (requer ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr

# Reconstruir skill a partir de dados previamente extraídos (pular download)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial

Guia completo: Consulte docs/VIDEO_GUIDE.md para referência CLI completa, detalhes do pipeline visual, opções de aprimoramento com IA e troubleshooting.

Análise de Repositórios GitHub

# Coleta básica de repositório
skill-seekers github --repo facebook/react

# Com autenticação (rate limits mais altos)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react

# Personalizar o que incluir
skill-seekers github --repo django/django \
    --include-issues \        # Extrair GitHub Issues
    --max-issues 100 \        # Limitar quantidade de issues
    --include-changelog       # Extrair CHANGELOG.md

Coleta Unificada Multi-Fonte

Combine documentação + GitHub + PDF em uma skill unificada com detecção de conflitos:

# Use configs unificadas existentes
skill-seekers unified --config configs/react_unified.json
skill-seekers unified --config configs/django_unified.json

# Ou crie uma config unificada
cat > configs/myframework_unified.json << 'EOF'
{
  "name": "myframework",
  "merge_mode": "rule-based",
  "sources": [
    {
      "type": "documentation",
      "base_url": "https://docs.myframework.com/",
      "max_pages": 200
    },
    {
      "type": "github",
      "repo": "owner/myframework",
      "code_analysis_depth": "surface"
    }
  ]
}
EOF

skill-seekers unified --config configs/myframework_unified.json

A Detecção de Conflitos encontra automaticamente:

🔴 Ausente no código (alta): Documentado mas não implementado
🟡 Ausente nos docs (média): Implementado mas não documentado
⚠️ Assinatura incompatível: Parâmetros/tipos diferentes
ℹ️ Descrição incompatível: Explicações diferentes

Guia Completo: Consulte docs/UNIFIED_SCRAPING.md para documentação completa.

Repositórios Privados de Configuração

Compartilhe configs personalizadas entre equipes usando repositórios Git privados:

# Opção 1: Usando ferramentas MCP (recomendado)
# Registre o repositório privado da sua equipe
add_config_source(
    name="team",
    git_url="https://github.com/mycompany/skill-configs.git",
    token_env="GITHUB_TOKEN"
)

# Busque config do repositório da equipe
fetch_config(source="team", config_name="internal-api")

Plataformas Suportadas:

GitHub (GITHUB_TOKEN), GitLab (GITLAB_TOKEN), Gitea (GITEA_TOKEN), Bitbucket (BITBUCKET_TOKEN)

Guia Completo: Consulte docs/GIT_CONFIG_SOURCES.md para documentação completa.

Como Funciona

graph LR
    A[Site de Documentação] --> B[Skill Seekers]
    B --> C[Coletor]
    B --> D[Aprimoramento IA]
    B --> E[Empacotador]
    C --> F[Referências Organizadas]
    D --> F
    F --> E
    E --> G[Claude Skill .zip]
    G --> H[Upload para Claude AI]

Detectar llms.txt - Verifica primeiro por llms-full.txt, llms.txt, llms-small.txt
Coletar: Extrai todas as páginas da documentação
Categorizar: Organiza o conteúdo em tópicos (API, guias, tutoriais, etc.)
Aprimorar: IA analisa os docs e cria SKILL.md abrangente com exemplos
Empacotar: Empacota tudo em um arquivo .zip pronto para o Claude

📋 Pré-requisitos

Antes de começar, certifique-se de ter:

Python 3.10 ou superior - Download | Verificar: python3 --version
Git - Download | Verificar: git --version
15-30 minutos para a configuração inicial

Primeira vez? → Comece Aqui: Guia de Início Rápido Infalível 🎯

📤 Enviando Skills para o Claude

Depois que sua skill estiver empacotada, você precisa enviá-la para o Claude:

Opção 1: Upload Automático (via API)

# Configure sua API key (uma única vez)
export ANTHROPIC_API_KEY=sk-ant-...

# Empacote e faça upload automaticamente
skill-seekers package output/react/ --upload

# OU faça upload de um .zip existente
skill-seekers upload output/react.zip

Opção 2: Upload Manual (Sem API Key)

# Empacote a skill
skill-seekers package output/react/
# → Cria output/react.zip

# Depois faça upload manualmente:
# - Acesse https://claude.ai/skills
# - Clique em "Upload Skill"
# - Selecione output/react.zip

Opção 3: MCP (Claude Code)

No Claude Code, basta pedir:
"Empacote e faça upload da skill React"

🤖 Instalando em Agentes de IA

O Skill Seekers pode instalar automaticamente skills em mais de 10 agentes de programação com IA.

# Instalar em agente específico
skill-seekers install-agent output/react/ --agent cursor

# Instalar em todos os agentes de uma vez
skill-seekers install-agent output/react/ --agent all

# Visualizar sem instalar
skill-seekers install-agent output/react/ --agent cursor --dry-run

Agentes Suportados

Agente	Caminho	Tipo
Claude Code	`~/.claude/skills/`	Global
Cursor	`.cursor/skills/`	Projeto
VS Code / Copilot	`.github/skills/`	Projeto
Amp	`~/.amp/skills/`	Global
Goose	`~/.config/goose/skills/`	Global
OpenCode	`~/.opencode/skills/`	Global
Windsurf	`~/.windsurf/skills/`	Global

🔌 Integração MCP (26 Ferramentas)

O Skill Seekers inclui um servidor MCP para uso com Claude Code, Cursor, Windsurf, VS Code + Cline ou IntelliJ IDEA.

# Modo stdio (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp

# Modo HTTP (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765

# Configurar automaticamente todos os agentes de uma vez
./setup_mcp.sh

Todas as 26 ferramentas disponíveis:

Núcleo (9): list_configs, generate_config, validate_config, estimate_pages, scrape_docs, package_skill, upload_skill, enhance_skill, install_skill
Estendidas (10): scrape_github, scrape_pdf, unified_scrape, merge_sources, detect_conflicts, add_config_source, fetch_config, list_config_sources, remove_config_source, split_config
Bancos Vetoriais (4): export_to_chroma, export_to_weaviate, export_to_faiss, export_to_qdrant
Nuvem (3): cloud_upload, cloud_download, cloud_list

Guia Completo: docs/MCP_SETUP.md

⚙️ Configuração

Presets Disponíveis (24+)

# Listar todos os presets
skill-seekers list-configs

Categoria	Presets
Frameworks Web	`react`, `vue`, `angular`, `svelte`, `nextjs`
Python	`django`, `flask`, `fastapi`, `sqlalchemy`, `pytest`
Desenvolvimento de Jogos	`godot`, `pygame`, `unity`
Ferramentas e DevOps	`docker`, `kubernetes`, `terraform`, `ansible`
Unificados (Docs + GitHub)	`react-unified`, `vue-unified`, `nextjs-unified` e mais

Criando Sua Própria Configuração

# Opção 1: Interativo
skill-seekers scrape --interactive

# Opção 2: Copie e edite um preset
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json

Estrutura do Arquivo de Configuração

{
  "name": "myframework",
  "description": "Quando usar esta skill",
  "base_url": "https://docs.myframework.com/",
  "selectors": {
    "main_content": "article",
    "title": "h1",
    "code_blocks": "pre code"
  },
  "url_patterns": {
    "include": ["/docs", "/guide"],
    "exclude": ["/blog", "/about"]
  },
  "categories": {
    "getting_started": ["intro", "quickstart"],
    "api": ["api", "reference"]
  },
  "rate_limit": 0.5,
  "max_pages": 500
}

Onde Armazenar Configurações

A ferramenta busca na seguinte ordem:

Caminho exato fornecido
./configs/ (diretório atual)
~/.config/skill-seekers/configs/ (diretório de configuração do usuário)
API SkillSeekersWeb.com (configurações predefinidas)

📊 O que é Criado

output/
├── godot_data/              # Dados brutos coletados
│   ├── pages/              # Arquivos JSON (um por página)
│   └── summary.json        # Resumo geral
│
└── godot/                   # A skill
    ├── SKILL.md            # Aprimorado com exemplos reais
    ├── references/         # Docs categorizados
    │   ├── index.md
    │   ├── getting_started.md
    │   ├── scripting.md
    │   └── ...
    ├── scripts/            # Vazio (adicione os seus)
    └── assets/             # Vazio (adicione os seus)

🐛 Solução de Problemas

Nenhum Conteúdo Extraído?

Verifique seu seletor main_content
Tente: article, main, div[role="main"]

Dados Existem Mas Não São Usados?

# Forçar re-coleta
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json

Categorias Não Estão Boas?

Edite a seção categories da configuração com palavras-chave melhores.

Quer Atualizar os Docs?

# Apague dados antigos e recolete
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json

Aprimoramento Não Funciona?

# Verifique se a API key está configurada
echo $ANTHROPIC_API_KEY

# Tente o modo LOCAL (usa Claude Code Max, sem necessidade de API key)
skill-seekers enhance output/react/ --mode LOCAL

# Monitore o status do aprimoramento em segundo plano
skill-seekers enhance-status output/react/ --watch

Problemas de Rate Limit do GitHub?

# Configure um token GitHub (5000 req/hora vs 60/hora anônimo)
export GITHUB_TOKEN=ghp_your_token_here

# Ou configure múltiplos perfis
skill-seekers config --github

📈 Performance

Tarefa	Tempo	Observações
Coleta (síncrona)	15-45 min	Apenas na primeira vez, baseada em threads
Coleta (assíncrona)	5-15 min	2-3x mais rápida com a flag `--async`
Construção	1-3 min	Reconstrução rápida a partir do cache
Reconstrução	<1 min	Com `--skip-scrape`
Aprimoramento (LOCAL)	30-60 seg	Usa Claude Code Max
Aprimoramento (API)	20-40 seg	Requer API key
Vídeo (transcrição)	1-3 min	YouTube/local, apenas transcrição
Vídeo (visual)	5-15 min	+ extração OCR de frames
Empacotamento	5-10 seg	Criação final do .zip

📚 Documentação

Primeiros Passos

BULLETPROOF_QUICKSTART.md - 🎯 COMECE AQUI se você é novo!
QUICKSTART.md - Início rápido para usuários experientes
TROUBLESHOOTING.md - Problemas comuns e soluções
docs/QUICK_REFERENCE.md - Folha de referência rápida

Guias

docs/LARGE_DOCUMENTATION.md - Processar docs de 10K-40K+ páginas
ASYNC_SUPPORT.md - Guia do modo assíncrono (coleta 2-3x mais rápida)
docs/ENHANCEMENT_MODES.md - Guia de modos de aprimoramento com IA
docs/MCP_SETUP.md - Configuração da integração MCP
docs/UNIFIED_SCRAPING.md - Coleta multi-fonte
docs/VIDEO_GUIDE.md - Guia de extração de vídeo

Guias de Integração

docs/integrations/LANGCHAIN.md - LangChain RAG
docs/integrations/CURSOR.md - Cursor IDE
docs/integrations/WINDSURF.md - Windsurf IDE
docs/integrations/CLINE.md - Cline (VS Code)
docs/integrations/RAG_PIPELINES.md - Todos os pipelines RAG

📝 Licença

Licença MIT - consulte o arquivo LICENSE para detalhes

Bom trabalho construindo skills! 🚀

48 KiB Raw Blame History Unescape Escape