Not a Skill Seekers-specific repo — better suited for MCP docs section. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
64 KiB
Skill Seekers
English | 简体中文 | 日本語 | 한국어 | Español | Français | Deutsch | Português | Türkçe | العربية | हिन्दी | Русский
⚠️ Уведомление о машинном переводе
Этот документ был автоматически переведён с помощью ИИ. Несмотря на наши усилия по обеспечению качества, возможны неточные выражения.
🧠 Слой данных для ИИ-систем. Skill Seekers преобразует документацию сайтов, репозитории GitHub, PDF, видео, Jupyter-ноутбуки, вики и более 17 типов источников в структурированные базы знаний — готовые к использованию в ИИ-навыках (Claude, Gemini, OpenAI), RAG-конвейерах (LangChain, LlamaIndex, Pinecone) и ИИ-помощниках для программирования (Cursor, Windsurf, Cline) за считанные минуты.
🌐 Посетите SkillSeekersWeb.com — просматривайте 24+ готовых конфигураций, делитесь своими настройками и получайте доступ к полной документации!
📋 Смотрите дорожную карту разработки и задачи — 134 задачи в 10 категориях, выберите любую для участия!
🌐 Экосистема
Skill Seekers — это мульти-репозиторный проект. Вот где находится каждая часть:
| Репозиторий | Описание | Ссылки |
|---|---|---|
| Skill_Seekers | Основной CLI и MCP сервер (этот репозиторий) | PyPI |
| skillseekersweb | Веб-сайт и документация | Сайт |
| skill-seekers-configs | Репозиторий конфигураций сообщества | |
| skill-seekers-action | GitHub Action для CI/CD | |
| skill-seekers-plugin | Плагин Claude Code | |
| homebrew-skill-seekers | Homebrew tap для macOS |
Хотите внести вклад? Репозитории сайта и конфигураций — отличная отправная точка для новых участников!
🧠 Слой данных для ИИ-систем
Skill Seekers — это универсальный слой предобработки, расположенный между необработанной документацией и всеми ИИ-системами, которые её потребляют. Независимо от того, создаёте ли вы навыки для Claude, RAG-конвейер LangChain или файл .cursorrules для Cursor — подготовка данных одинакова. Выполните её один раз и экспортируйте во все целевые платформы.
# Одна команда → структурированная база знаний
skill-seekers create https://docs.react.dev/
# или: skill-seekers create facebook/react
# или: skill-seekers create ./my-project
# Экспорт в любую ИИ-систему
skill-seekers package output/react --target claude # → Claude AI навык (ZIP)
skill-seekers package output/react --target langchain # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor # → .cursorrules
Что создаётся
| Результат | Цель | Где используется |
|---|---|---|
| Claude навык (ZIP + YAML) | --target claude |
Claude Code, Claude API |
| Gemini навык (tar.gz) | --target gemini |
Google Gemini |
| OpenAI / Custom GPT (ZIP) | --target openai |
GPT-4o, пользовательские ассистенты |
| LangChain Documents | --target langchain |
QA-цепочки, агенты, ретриверы |
| LlamaIndex TextNodes | --target llama-index |
Движки запросов, движки диалогов |
| Haystack Documents | --target haystack |
Корпоративные RAG-конвейеры |
| Pinecone-ready (Markdown) | --target markdown |
Загрузка в векторное хранилище |
| ChromaDB / FAISS / Qdrant | --format chroma/faiss/qdrant |
Локальные векторные базы данных |
Cursor .cursorrules |
--target claude → скопировать |
Cursor IDE ИИ-контекст |
| Windsurf / Cline / Continue | --target claude → скопировать |
VS Code, IntelliJ, Vim |
Почему это важно
- ⚡ На 99% быстрее — дни ручной подготовки данных → 15–45 минут
- 🎯 Качество ИИ-навыков — файлы SKILL.md на 500+ строк с примерами, шаблонами и руководствами
- 📊 Готовые к RAG блоки — умная разбивка сохраняет блоки кода и контекст
- 🎬 Видео — извлечение кода, субтитров и структурированных знаний из YouTube и локальных видео
- 🔄 Множество источников — объединение 17 типов источников (документация, GitHub, PDF, видео, ноутбуки, вики и другие) в единую базу знаний
- 🌐 Одна подготовка — все платформы — экспорт одного актива на 16 платформ без повторного сканирования
- ✅ Проверено в бою — 2 540+ тестов, 24+ пресетов для фреймворков, готово к продакшену
Быстрый старт
pip install skill-seekers
# Создание ИИ-навыка из любого источника
skill-seekers create https://docs.django.com/ # Документация сайта
skill-seekers create django/django # Репозиторий GitHub
skill-seekers create ./my-codebase # Локальный проект
skill-seekers create manual.pdf # PDF-файл
skill-seekers create manual.docx # Документ Word
skill-seekers create book.epub # Электронная книга EPUB
skill-seekers create notebook.ipynb # Jupyter-ноутбук
skill-seekers create page.html # Локальный HTML
skill-seekers create api-spec.yaml # Спецификация OpenAPI/Swagger
skill-seekers create guide.adoc # Документ AsciiDoc
skill-seekers create slides.pptx # Презентация PowerPoint
# Видео (YouTube, Vimeo или локальный файл — требуется skill-seekers[video])
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# Первый запуск? Автоматическая установка зависимостей с поддержкой GPU:
skill-seekers video --setup
# Экспорт по назначению
skill-seekers package output/django --target claude # Claude AI навык
skill-seekers package output/django --target langchain # LangChain RAG
skill-seekers package output/django --target cursor # Cursor IDE контекст
Полные примеры:
- Claude AI навык — навык для Claude Code
- LangChain RAG-конвейер — QA-цепочка на основе Chroma
- Cursor IDE контекст — ИИ-программирование с учётом фреймворка
Что такое Skill Seekers?
Skill Seekers — это слой данных для ИИ-систем, который преобразует 17 типов источников — документацию сайтов, репозитории GitHub, PDF, видео, Jupyter-ноутбуки, документы Word/EPUB/AsciiDoc, спецификации OpenAPI/Swagger, презентации PowerPoint, RSS/Atom-ленты, man-страницы, вики Confluence, страницы Notion, экспорты Slack/Discord и другое — в структурированные базы знаний для всех ИИ-целей:
| Сценарий использования | Что вы получаете | Примеры |
|---|---|---|
| ИИ-навыки | Полный SKILL.md + справочные файлы | Claude Code, Gemini, GPT |
| RAG-конвейеры | Документы, разбитые на блоки с метаданными | LangChain, LlamaIndex, Haystack |
| Векторные базы данных | Предварительно отформатированные данные для загрузки | Pinecone, Chroma, Weaviate, FAISS |
| ИИ-помощники для кода | Файлы контекста, которые IDE-ИИ читает автоматически | Cursor, Windsurf, Cline, Continue.dev |
Skill Seekers заменяет дни ручной предобработки следующими шагами:
- Сбор — документация, репозитории GitHub, локальные кодовые базы, PDF, видео, Jupyter-ноутбуки, вики и более 17 типов источников
- Анализ — глубокий AST-разбор, обнаружение паттернов, извлечение API
- Структурирование — категоризированные справочные файлы с метаданными
- Улучшение — генерация SKILL.md с помощью ИИ (Claude, Gemini или локально)
- Экспорт — 16 платформоспецифичных форматов из одного актива
Зачем использовать Skill Seekers?
Для создателей ИИ-навыков (Claude, Gemini, OpenAI)
- 🎯 Навыки продакшен-уровня — файлы SKILL.md на 500+ строк с примерами кода, шаблонами и руководствами
- 🔄 Рабочие процессы улучшения — применяйте
security-focus,architecture-comprehensiveили пользовательские YAML-пресеты - 🎮 Любая предметная область — игровые движки (Godot, Unity), фреймворки (React, Django), внутренние инструменты
- 🔧 Командная работа — объединяйте внутреннюю документацию + код в единый источник истины
- 📚 Качество — ИИ-улучшение с примерами, кратким справочником и навигацией
Для RAG-разработчиков и ИИ-инженеров
- 🤖 Данные, готовые к RAG — предварительно разбитые LangChain
Documents, LlamaIndexTextNodes, HaystackDocuments - 🚀 На 99% быстрее — дни предобработки → 15–45 минут
- 📊 Умные метаданные — категории, источники, типы → более точный поиск
- 🔄 Множество источников — объединяйте документацию + GitHub + PDF в одном конвейере
- 🌐 Платформонезависимость — экспорт в любую векторную базу данных или фреймворк без повторного сканирования
Для пользователей ИИ-помощников для программирования
- 💻 Cursor / Windsurf / Cline — автоматическая генерация
.cursorrules/.windsurfrules/.clinerules - 🎯 Постоянный контекст — ИИ «знает» ваши фреймворки без повторных подсказок
- 📚 Всегда актуально — обновляйте контекст за минуты при изменении документации
Ключевые возможности
🌐 Сканирование документации
- ✅ Поддержка llms.txt — автоматическое обнаружение и использование LLM-ready файлов документации (в 10 раз быстрее)
- ✅ Универсальный сканер — работает с ЛЮБЫМ сайтом документации
- ✅ Умная категоризация — автоматическая организация контента по темам
- ✅ Определение языка кода — распознавание Python, JavaScript, C++, GDScript и других
- ✅ 24+ готовых пресетов — Godot, React, Vue, Django, FastAPI и другие
📄 Поддержка PDF
- ✅ Базовое извлечение PDF — извлечение текста, кода и изображений из PDF-файлов
- ✅ OCR для сканированных PDF — извлечение текста из сканированных документов
- ✅ PDF с паролем — обработка зашифрованных PDF
- ✅ Извлечение таблиц — извлечение сложных таблиц из PDF
- ✅ Параллельная обработка — в 3 раза быстрее для больших PDF
- ✅ Умное кэширование — на 50% быстрее при повторных запусках
🎬 Извлечение из видео
- ✅ YouTube и локальные видео — извлечение субтитров, кода и структурированных знаний из видео
- ✅ Анализ визуальных кадров — OCR-извлечение из редакторов кода, терминалов, слайдов и диаграмм
- ✅ Автоопределение GPU — автоматическая установка правильной сборки PyTorch (CUDA/ROCm/MPS/CPU)
- ✅ ИИ-улучшение — двухэтапное: очистка артефактов OCR + генерация отполированного SKILL.md
- ✅ Обрезка по времени — извлечение определённых фрагментов с
--start-timeи--end-time - ✅ Поддержка плейлистов — пакетная обработка всех видео в плейлисте YouTube
🐙 Анализ репозиториев GitHub
- ✅ Глубокий анализ кода — AST-разбор для Python, JavaScript, TypeScript, Java, C++, Go
- ✅ Извлечение API — функции, классы, методы с параметрами и типами
- ✅ Метаданные репозитория — README, дерево файлов, распределение языков, звёзды/форки
- ✅ GitHub Issues и PR — получение открытых/закрытых issues с метками и вехами
- ✅ CHANGELOG и релизы — автоматическое извлечение истории версий
- ✅ Обнаружение конфликтов — сравнение документированных API с фактической реализацией кода
- ✅ MCP-интеграция — на естественном языке: «Просканируй GitHub-репозиторий facebook/react»
🔄 Унифицированное мультиисточниковое сканирование
- ✅ Объединение нескольких источников — смешивайте документацию + GitHub + PDF в одном навыке
- ✅ Обнаружение конфликтов — автоматическое нахождение расхождений между документацией и кодом
- ✅ Умное слияние — на основе правил или с помощью ИИ
- ✅ Прозрачная отчётность — сравнение бок о бок с предупреждениями ⚠️
- ✅ Анализ пробелов в документации — выявление устаревшей документации и недокументированных функций
- ✅ Единый источник истины — один навык показывает и намерение (документация), и реальность (код)
- ✅ Обратная совместимость — устаревшие одноисточниковые конфигурации продолжают работать
🤖 Поддержка нескольких LLM-платформ
- ✅ 12 LLM-платформ — Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, универсальный Markdown, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI
- ✅ Универсальное сканирование — одна и та же документация для всех платформ
- ✅ Платформоспецифичная упаковка — оптимизированные форматы для каждой LLM
- ✅ Экспорт одной командой — флаг
--targetдля выбора платформы - ✅ Опциональные зависимости — устанавливайте только то, что нужно
- ✅ 100% обратная совместимость — существующие рабочие процессы Claude без изменений
| Платформа | Формат | Загрузка | Улучшение | API Key | Пользовательский эндпоинт |
|---|---|---|---|---|---|
| Claude AI | ZIP + YAML | ✅ Авто | ✅ Да | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
| Google Gemini | tar.gz | ✅ Авто | ✅ Да | GOOGLE_API_KEY | - |
| OpenAI ChatGPT | ZIP + Vector Store | ✅ Авто | ✅ Да | OPENAI_API_KEY | - |
| Универсальный Markdown | ZIP | ❌ Вручную | ❌ Нет | - | - |
# Claude (по умолчанию — без изменений!)
skill-seekers package output/react/
skill-seekers upload react.zip
# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini
# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai
# Универсальный Markdown (универсальный экспорт)
skill-seekers package output/react/ --target markdown
🔧 Переменные окружения для Claude-совместимых API (например, GLM-4.7)
Skill Seekers поддерживает любой Claude-совместимый API-эндпоинт:
# Вариант 1: Официальный Anthropic API (по умолчанию)
export ANTHROPIC_API_KEY=sk-ant-...
# Вариант 2: GLM-4.7 Claude-совместимый API
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1
# Все функции ИИ-улучшения будут использовать настроенный эндпоинт
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance
Примечание: Установка ANTHROPIC_BASE_URL позволяет использовать любой Claude-совместимый API-эндпоинт, например GLM-4.7 или другие совместимые сервисы.
Установка:
# Установка с поддержкой Gemini
pip install skill-seekers[gemini]
# Установка с поддержкой OpenAI
pip install skill-seekers[openai]
# Установка всех LLM-платформ
pip install skill-seekers[all-llms]
🔗 Интеграции с RAG-фреймворками
-
✅ LangChain Documents — прямой экспорт в формат
Documentсpage_content+ метаданными- Подходит для: QA-цепочек, ретриверов, векторных хранилищ, агентов
- Пример: LangChain RAG-конвейер
- Руководство: Интеграция с LangChain
-
✅ LlamaIndex TextNodes — экспорт в формат
TextNodeс уникальными ID + эмбеддингами- Подходит для: движков запросов, движков диалогов, контекста хранилища
- Пример: LlamaIndex движок запросов
- Руководство: Интеграция с LlamaIndex
-
✅ Формат, готовый к Pinecone — оптимизирован для загрузки в векторную базу данных
- Подходит для: продакшен-поиска по векторам, семантического и гибридного поиска
- Пример: Загрузка в Pinecone
- Руководство: Интеграция с Pinecone
Быстрый экспорт:
# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json
# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json
# Markdown (универсальный)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/
Полное руководство по RAG-конвейерам: Документация по RAG-конвейерам
🧠 Интеграции с ИИ-помощниками для программирования
Преобразуйте документацию любого фреймворка в экспертный контекст для 4+ ИИ-помощников:
-
✅ Cursor IDE — генерация
.cursorrulesдля ИИ-подсказок при написании кода- Подходит для: генерации кода с учётом фреймворка, единообразных паттернов
- Руководство: Интеграция с Cursor
- Пример: Cursor React навык
-
✅ Windsurf — настройка контекста ИИ-помощника Windsurf через
.windsurfrules- Подходит для: встроенной ИИ-помощи в IDE, потоковое программирование
- Руководство: Интеграция с Windsurf
- Пример: Windsurf FastAPI контекст
-
✅ Cline (VS Code) — системные промпты + MCP для VS Code-агента
- Подходит для: автономной генерации кода в VS Code
- Руководство: Интеграция с Cline
- Пример: Cline Django ассистент
-
✅ Continue.dev — контекстные серверы для IDE-независимого ИИ
- Подходит для: мультисредных окружений (VS Code, JetBrains, Vim), пользовательских LLM-провайдеров
- Руководство: Интеграция с Continue
- Пример: Continue универсальный контекст
Быстрый экспорт для ИИ-инструментов программирования:
# Для любого ИИ-помощника (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude
# Скопируйте в свой проект (пример для Cursor)
cp output/django-claude/SKILL.md my-project/.cursorrules
# Или для Windsurf
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md
# Или для Cline
cp output/django-claude/SKILL.md my-project/.clinerules
Центр интеграций: Все интеграции с ИИ-системами
🌊 Трёхпоточная архитектура GitHub
- ✅ Трёхпоточный анализ — разделение GitHub-репозитория на потоки «Код», «Документация» и «Аналитика»
- ✅ Унифицированный анализатор кодовой базы — работает как с URL GitHub, так и с локальными путями
- ✅ C3.x как глубина анализа — выбор «basic» (1–2 мин) или «c3x» (20–60 мин)
- ✅ Расширенная генерация маршрутизатора — метаданные GitHub, быстрый старт из README, типичные проблемы
- ✅ Интеграция Issues — распространённые проблемы и решения из GitHub Issues
- ✅ Умные ключевые слова маршрутизации — метки GitHub с двойным весом для лучшего определения тем
Описание трёх потоков:
- Поток 1: Код — глубокий C3.x-анализ (паттерны, примеры, руководства, конфигурации, архитектура)
- Поток 2: Документация — документация репозитория (README, CONTRIBUTING, docs/*.md)
- Поток 3: Аналитика — знания сообщества (Issues, метки, звёзды, форки)
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer
# Анализ GitHub-репозитория со всеми тремя потоками
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
source="https://github.com/facebook/react",
depth="c3x", # или "basic" для быстрого анализа
fetch_github_metadata=True
)
print(f"Паттерны проектирования: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Звёзды: {result.github_insights['metadata']['stars']}")
Полная документация: Сводка по реализации трёхпоточной архитектуры
🔐 Умное управление лимитами запросов и конфигурация
- ✅ Система конфигурации с несколькими токенами — управление несколькими аккаунтами GitHub (личный, рабочий, open source)
- Безопасное хранение конфигурации в
~/.config/skill-seekers/config.json(права 600) - Стратегии лимита запросов для каждого профиля:
prompt,wait,switch,fail - Умная цепочка резервирования: аргумент CLI → переменная окружения → файл конфигурации → запрос
- Безопасное хранение конфигурации в
- ✅ Интерактивный мастер настройки — красивый терминальный интерфейс для простой настройки
- ✅ Умный обработчик лимитов запросов — больше никаких бесконечных ожиданий!
- Обратный отсчёт в реальном времени, автоматическое переключение профилей
- Четыре стратегии: prompt (спросить), wait (обратный отсчёт), switch (переключить), fail (прервать)
- ✅ Возобновление — продолжение прерванных задач
- ✅ Поддержка CI/CD — флаг
--non-interactiveдля автоматизации
Быстрая настройка:
# Однократная настройка (5 минут)
skill-seekers config --github
# Использование определённого профиля для приватных репозиториев
skill-seekers github --repo mycompany/private-repo --profile work
# Режим CI/CD (быстрый отказ, без запросов)
skill-seekers github --repo owner/repo --non-interactive
🎯 Bootstrap-навык — самохостинг
Генерация skill-seekers как навыка для Claude Code:
./scripts/bootstrap_skill.sh
cp -r output/skill-seekers ~/.claude/skills/
🔐 Приватные репозитории конфигураций
- ✅ Git-источники конфигураций — получение конфигураций из приватных/командных Git-репозиториев
- ✅ Управление несколькими источниками — регистрация неограниченного количества репозиториев GitHub, GitLab, Bitbucket
- ✅ Командная работа — обмен пользовательскими конфигурациями в командах из 3–5 человек
- ✅ Корпоративная поддержка — масштабирование до 500+ разработчиков
- ✅ Безопасная аутентификация — токены через переменные окружения (GITHUB_TOKEN, GITLAB_TOKEN)
🤖 Анализ кодовой базы (C3.x)
C3.4: Извлечение паттернов конфигурации с ИИ-улучшением
- ✅ 9 форматов конфигурации — JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
- ✅ 7 типов паттернов — база данных, API, логирование, кэш, почта, аутентификация, сервер
- ✅ ИИ-улучшение — опциональный двухрежимный ИИ-анализ (API + LOCAL)
- ✅ Анализ безопасности — обнаружение жёстко закодированных секретов и открытых учётных данных
C3.3: ИИ-улучшенные пошаговые руководства
- ✅ Полное ИИ-улучшение — преобразование базовых руководств в профессиональные учебники
- ✅ 5 автоматических улучшений — описание шагов, устранение неполадок, предварительные требования, следующие шаги, сценарии использования
- ✅ Двухрежимная поддержка — API-режим (Claude API) или LOCAL-режим (Claude Code CLI)
- ✅ Нулевые затраты в LOCAL-режиме — БЕСПЛАТНОЕ улучшение с вашим планом Claude Code Max
Использование:
# Быстрый анализ (1–2 мин, только базовые функции)
skill-seekers analyze --directory tests/ --quick
# Комплексный анализ (с ИИ, 20–60 мин)
skill-seekers analyze --directory tests/ --comprehensive
# С ИИ-улучшением
skill-seekers analyze --directory tests/ --enhance
Полная документация: docs/HOW_TO_GUIDES.md
🔄 Пресеты рабочих процессов улучшения
Многоразовые YAML-определённые конвейеры улучшения, управляющие тем, как ИИ преобразует необработанную документацию в отшлифованный навык.
- ✅ 5 встроенных пресетов —
default,minimal,security-focus,architecture-comprehensive,api-documentation - ✅ Пользовательские пресеты — добавляйте собственные рабочие процессы в
~/.config/skill-seekers/workflows/ - ✅ Цепочки рабочих процессов — объединяйте два или более рабочих процесса в одной команде
- ✅ Полное управление через CLI — просмотр, копирование, добавление, удаление и валидация рабочих процессов
# Применение одного рабочего процесса
skill-seekers create ./my-project --enhance-workflow security-focus
# Цепочка нескольких рабочих процессов (применяются по порядку)
skill-seekers create ./my-project \
--enhance-workflow security-focus \
--enhance-workflow minimal
# Управление пресетами
skill-seekers workflows list # Список всех (встроенные + пользовательские)
skill-seekers workflows show security-focus # Показать содержимое YAML
skill-seekers workflows copy security-focus # Скопировать в пользовательскую директорию для редактирования
skill-seekers workflows add ./my-workflow.yaml # Установить пользовательский пресет
skill-seekers workflows remove my-workflow # Удалить пользовательский пресет
skill-seekers workflows validate security-focus # Проверить структуру пресета
# Копирование нескольких сразу
skill-seekers workflows copy security-focus minimal api-documentation
# Добавление нескольких файлов сразу
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml
# Удаление нескольких сразу
skill-seekers workflows remove my-wf-a my-wf-b
Формат YAML-пресета:
name: security-focus
description: "Обзор безопасности: уязвимости, аутентификация, обработка данных"
version: "1.0"
stages:
- name: vulnerabilities
type: custom
prompt: "Проверить на OWASP Top 10 и распространённые уязвимости..."
- name: auth-review
type: custom
prompt: "Исследовать паттерны аутентификации и авторизации..."
uses_history: true
⚡ Производительность и масштаб
- ✅ Асинхронный режим — сканирование в 2–3 раза быстрее с async/await (флаг
--async) - ✅ Поддержка большой документации — обработка документов на 10K–40K+ страниц с умным разделением
- ✅ Маршрутизатор/Hub-навыки — интеллектуальная маршрутизация к специализированным поднавыкам
- ✅ Параллельное сканирование — одновременная обработка нескольких навыков
- ✅ Контрольные точки/Возобновление — прогресс никогда не теряется при длительном сканировании
- ✅ Система кэширования — сканируйте один раз, пересобирайте мгновенно
✅ Контроль качества
- ✅ Полное покрытие тестами — 2 540+ тестов с обширным покрытием
📦 Установка
# Базовая установка (сканирование документации, анализ GitHub, PDF, упаковка)
pip install skill-seekers
# С поддержкой всех LLM-платформ
pip install skill-seekers[all-llms]
# С MCP-сервером
pip install skill-seekers[mcp]
# Всё включено
pip install skill-seekers[all]
Нужна помощь с выбором? Запустите мастер настройки:
skill-seekers-setup
Варианты установки
| Команда установки | Функциональность |
|---|---|
pip install skill-seekers |
Сканирование, анализ GitHub, PDF, все платформы |
pip install skill-seekers[gemini] |
+ Поддержка Google Gemini |
pip install skill-seekers[openai] |
+ Поддержка OpenAI ChatGPT |
pip install skill-seekers[all-llms] |
+ Все LLM-платформы |
pip install skill-seekers[mcp] |
+ MCP-сервер |
pip install skill-seekers[video] |
+ Извлечение субтитров и метаданных YouTube/Vimeo |
pip install skill-seekers[video-full] |
+ Транскрипция Whisper и извлечение визуальных кадров |
pip install skill-seekers[jupyter] |
+ Поддержка Jupyter-ноутбуков |
pip install skill-seekers[pptx] |
+ Поддержка PowerPoint |
pip install skill-seekers[confluence] |
+ Поддержка вики Confluence |
pip install skill-seekers[notion] |
+ Поддержка страниц Notion |
pip install skill-seekers[rss] |
+ Поддержка RSS/Atom-лент |
pip install skill-seekers[chat] |
+ Поддержка экспорта чатов Slack/Discord |
pip install skill-seekers[asciidoc] |
+ Поддержка документов AsciiDoc |
pip install skill-seekers[all] |
Всё включено |
Визуальные зависимости для видео (с поддержкой GPU): После установки
skill-seekers[video-full]запуститеskill-seekers video --setupдля автоопределения вашего GPU и установки правильной сборки PyTorch
- easyocr. Это рекомендуемый способ установки зависимостей для визуального извлечения.
🚀 Рабочий процесс установки одной командой
Самый быстрый способ от конфигурации до загруженного навыка — полная автоматизация:
# Установка навыка React из официальных конфигураций (автозагрузка в Claude)
skill-seekers install --config react
# Установка из локального файла конфигурации
skill-seekers install --config configs/custom.json
# Установка без загрузки (только упаковка)
skill-seekers install --config django --no-upload
# Предпросмотр рабочего процесса без выполнения
skill-seekers install --config react --dry-run
Выполняемые фазы:
📥 ФАЗА 1: Получение конфигурации (если указано имя конфигурации)
📖 ФАЗА 2: Сканирование документации
✨ ФАЗА 3: ИИ-улучшение
📦 ФАЗА 4: Упаковка навыка
☁️ ФАЗА 5: Загрузка в Claude (опционально, требуется API Key)
📊 Матрица функций
Skill Seekers поддерживает 12 LLM-платформ, 17 типов источников и полный паритет функций по всем целевым платформам.
Платформы: Claude AI, Google Gemini, OpenAI ChatGPT, MiniMax AI, универсальный Markdown, OpenCode, Kimi, DeepSeek, Qwen, OpenRouter, Together AI, Fireworks AI Типы источников: Документация сайтов, репозитории GitHub, PDF, Word (.docx), EPUB, видео, локальные кодовые базы, Jupyter-ноутбуки, локальный HTML, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), RSS/Atom-ленты, man-страницы, вики Confluence, страницы Notion, экспорты чатов Slack/Discord
Подробности см. в Полной матрице функций.
Быстрое сравнение платформ
| Функция | Claude | Gemini | OpenAI | Markdown |
|---|---|---|---|---|
| Формат | ZIP + YAML | tar.gz | ZIP + Vector | ZIP |
| Загрузка | ✅ API | ✅ API | ✅ API | ❌ Вручную |
| Улучшение | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ❌ Нет |
| Все режимы навыков | ✅ | ✅ | ✅ | ✅ |
Примеры использования
Сканирование документации
# Сканирование документации сайта
skill-seekers scrape --config configs/react.json
# Быстрое сканирование без конфигурации
skill-seekers scrape --url https://react.dev --name react
# Асинхронный режим (в 3 раза быстрее)
skill-seekers scrape --config configs/godot.json --async --workers 8
Извлечение из PDF
# Базовое извлечение из PDF
skill-seekers pdf --pdf docs/manual.pdf --name myskill
# Расширенные функции
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
--extract-tables \ # Извлечение таблиц
--parallel \ # Быстрая параллельная обработка
--workers 8 # Использование 8 ядер CPU
# Сканированные PDF (требуется: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr
Извлечение из видео
# Установка поддержки видео
pip install skill-seekers[video] # Субтитры + метаданные
pip install skill-seekers[video-full] # + Whisper транскрипция + извлечение визуальных кадров
# Автоопределение GPU и установка визуальных зависимостей (PyTorch + easyocr)
skill-seekers video --setup
# Извлечение из видео YouTube
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial
# Извлечение из плейлиста YouTube
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist
# Извлечение из локального видеофайла
skill-seekers video --video-file recording.mp4 --name myrecording
# Извлечение с анализом визуальных кадров (требуются зависимости video-full)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual
# С ИИ-улучшением (очистка OCR + генерация отполированного SKILL.md)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2
# Обрезка определённого фрагмента видео (поддерживаются секунды, MM:SS, HH:MM:SS)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00
# Использование Vision API для OCR-кадров с низкой достоверностью (требуется ANTHROPIC_API_KEY)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr
# Пересборка навыка из ранее извлечённых данных (пропуск загрузки)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial
Полное руководство: см. docs/VIDEO_GUIDE.md для полной справки по CLI, деталей визуального конвейера, опций ИИ-улучшения и устранения неполадок.
Анализ репозиториев GitHub
# Базовое сканирование репозитория
skill-seekers github --repo facebook/react
# С аутентификацией (более высокие лимиты запросов)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react
# Настройка содержимого
skill-seekers github --repo django/django \
--include-issues \ # Извлечение GitHub Issues
--max-issues 100 \ # Ограничение количества issues
--include-changelog # Извлечение CHANGELOG.md
Унифицированное мультиисточниковое сканирование
Объединение документации + GitHub + PDF в один навык с обнаружением конфликтов:
# Использование готовых унифицированных конфигураций
skill-seekers unified --config configs/react_unified.json
# Или создание унифицированной конфигурации
cat > configs/myframework_unified.json << 'EOF'
{
"name": "myframework",
"merge_mode": "rule-based",
"sources": [
{
"type": "documentation",
"base_url": "https://docs.myframework.com/",
"max_pages": 200
},
{
"type": "github",
"repo": "owner/myframework",
"code_analysis_depth": "surface"
}
]
}
EOF
skill-seekers unified --config configs/myframework_unified.json
Обнаружение конфликтов автоматически находит:
- 🔴 Отсутствует в коде (высокий приоритет): задокументировано, но не реализовано
- 🟡 Отсутствует в документации (средний приоритет): реализовано, но не задокументировано
- ⚠️ Несовпадение сигнатур: различные параметры/типы
- ℹ️ Несовпадение описаний: различные пояснения
Полное руководство: см. docs/UNIFIED_SCRAPING.md.
Приватные репозитории конфигураций
Обмен пользовательскими конфигурациями в команде через приватные Git-репозитории:
# Использование MCP-инструментов для регистрации приватного командного репозитория
add_config_source(
name="team",
git_url="https://github.com/mycompany/skill-configs.git",
token_env="GITHUB_TOKEN"
)
# Получение конфигурации из командного репозитория
fetch_config(source="team", config_name="internal-api")
Поддерживаемые платформы:
- GitHub (
GITHUB_TOKEN), GitLab (GITLAB_TOKEN), Gitea (GITEA_TOKEN), Bitbucket (BITBUCKET_TOKEN)
Полное руководство: см. docs/GIT_CONFIG_SOURCES.md.
Как это работает
graph LR
A[Документация сайта] --> B[Skill Seekers]
B --> C[Сканер]
B --> D[ИИ-улучшение]
B --> E[Упаковщик]
C --> F[Организованные справочные файлы]
D --> F
F --> E
E --> G[Claude навык .zip]
G --> H[Загрузка в Claude AI]
- Обнаружение llms.txt — проверка наличия llms-full.txt, llms.txt, llms-small.txt
- Сканирование: извлечение всех страниц из документации
- Категоризация: организация контента по темам (API, руководства, учебники и т.д.)
- Улучшение: ИИ анализирует документацию и создаёт всеобъемлющий SKILL.md с примерами
- Упаковка: объединение всего в готовый для Claude
.zip-файл
📋 Предварительные требования
Перед началом убедитесь, что у вас есть:
- Python 3.10 или выше — Скачать | Проверить:
python3 --version - Git — Скачать | Проверить:
git --version - 15–30 минут для первоначальной настройки
Впервые? → Начните здесь: Безотказное руководство быстрого старта 🎯
📤 Загрузка навыков в Claude
После упаковки навыка его необходимо загрузить в Claude:
Вариант 1: Автоматическая загрузка (через API)
# Установка API Key (однократно)
export ANTHROPIC_API_KEY=sk-ant-...
# Упаковка и автоматическая загрузка
skill-seekers package output/react/ --upload
# ИЛИ загрузка существующего .zip
skill-seekers upload output/react.zip
Вариант 2: Ручная загрузка (без API Key)
# Упаковка навыка
skill-seekers package output/react/
# → Создаёт output/react.zip
# Затем загрузите вручную:
# - Перейдите на https://claude.ai/skills
# - Нажмите «Upload Skill»
# - Выберите output/react.zip
Вариант 3: MCP (Claude Code)
В Claude Code просто попросите:
"Упакуй и загрузи навык React"
🤖 Установка в ИИ-агенты
Skill Seekers может автоматически устанавливать навыки в 18 ИИ-агентов для программирования.
# Установка в конкретный агент
skill-seekers install-agent output/react/ --agent cursor
# Установка во все агенты сразу
skill-seekers install-agent output/react/ --agent all
# Предпросмотр без установки
skill-seekers install-agent output/react/ --agent cursor --dry-run
Поддерживаемые агенты
| Агент | Путь | Тип |
|---|---|---|
| Claude Code | ~/.claude/skills/ |
Глобальный |
| Cursor | .cursor/skills/ |
Проектный |
| VS Code / Copilot | .github/skills/ |
Проектный |
| Amp | ~/.amp/skills/ |
Глобальный |
| Goose | ~/.config/goose/skills/ |
Глобальный |
| OpenCode | ~/.opencode/skills/ |
Глобальный |
| Windsurf | ~/.windsurf/skills/ |
Глобальный |
| Roo Code | .roo/skills/ |
Проектный |
| Cline | .cline/skills/ |
Проектный |
| Aider | ~/.aider/skills/ |
Глобальный |
| Bolt | .bolt/skills/ |
Проектный |
| Kilo Code | .kilo/skills/ |
Проектный |
| Continue | ~/.continue/skills/ |
Глобальный |
| Kimi Code | ~/.kimi/skills/ |
Глобальный |
🔌 MCP-интеграция (26 инструментов)
Skill Seekers поставляется с MCP-сервером для использования из Claude Code, Cursor, Windsurf, VS Code + Cline или IntelliJ IDEA.
# Режим stdio (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp
# Режим HTTP (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
# Автоматическая настройка всех агентов за раз
./setup_mcp.sh
Все 26 инструментов:
- Основные (9):
list_configs,generate_config,validate_config,estimate_pages,scrape_docs,package_skill,upload_skill,enhance_skill,install_skill - Расширенные (10):
scrape_github,scrape_pdf,unified_scrape,merge_sources,detect_conflicts,add_config_source,fetch_config,list_config_sources,remove_config_source,split_config - Векторные БД (4):
export_to_chroma,export_to_weaviate,export_to_faiss,export_to_qdrant - Облачные (3):
cloud_upload,cloud_download,cloud_list
Полное руководство: docs/MCP_SETUP.md
⚙️ Конфигурация
Доступные пресеты (24+)
# Список всех пресетов
skill-seekers list-configs
| Категория | Пресеты |
|---|---|
| Веб-фреймворки | react, vue, angular, svelte, nextjs |
| Python | django, flask, fastapi, sqlalchemy, pytest |
| Разработка игр | godot, pygame, unity |
| Инструменты и DevOps | docker, kubernetes, terraform, ansible |
| Унифицированные (документация + GitHub) | react-unified, vue-unified, nextjs-unified и другие |
Создание собственной конфигурации
# Вариант 1: Интерактивный
skill-seekers scrape --interactive
# Вариант 2: Копирование и редактирование пресета
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json
Структура файла конфигурации
{
"name": "myframework",
"description": "Когда использовать этот навык",
"base_url": "https://docs.myframework.com/",
"selectors": {
"main_content": "article",
"title": "h1",
"code_blocks": "pre code"
},
"url_patterns": {
"include": ["/docs", "/guide"],
"exclude": ["/blog", "/about"]
},
"categories": {
"getting_started": ["intro", "quickstart"],
"api": ["api", "reference"]
},
"rate_limit": 0.5,
"max_pages": 500
}
Где хранить конфигурации
Инструмент выполняет поиск в следующем порядке:
- Точный путь, как указан
./configs/(текущая директория)~/.config/skill-seekers/configs/(пользовательская директория конфигурации)- SkillSeekersWeb.com API (готовые конфигурации)
📊 Что создаётся
output/
├── godot_data/ # Полученные необработанные данные
│ ├── pages/ # JSON-файлы (по одному на страницу)
│ └── summary.json # Обзор
│
└── godot/ # Навык
├── SKILL.md # Улучшенный с реальными примерами
├── references/ # Категоризированная документация
│ ├── index.md
│ ├── getting_started.md
│ ├── scripting.md
│ └── ...
├── scripts/ # Пусто (добавьте свои скрипты)
└── assets/ # Пусто (добавьте свои ресурсы)
🐛 Устранение неполадок
Контент не извлечён?
- Проверьте селектор
main_content - Попробуйте:
article,main,div[role="main"]
Данные есть, но не используются?
# Принудительное повторное сканирование
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json
Категоризация не устраивает?
Отредактируйте раздел categories в конфигурации, используя более подходящие ключевые слова.
Хотите обновить документацию?
# Удалите старые данные и просканируйте заново
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json
Улучшение не работает?
# Проверьте, установлен ли API Key
echo $ANTHROPIC_API_KEY
# Попробуйте LOCAL-режим (использует Claude Code Max, API Key не нужен)
skill-seekers enhance output/react/ --mode LOCAL
# Мониторинг статуса фонового улучшения
skill-seekers enhance-status output/react/ --watch
Проблемы с лимитами GitHub?
# Установите GitHub Token (5000 запросов/час вместо 60/час анонимно)
export GITHUB_TOKEN=ghp_your_token_here
# Или настройте несколько профилей
skill-seekers config --github
📈 Производительность
| Задача | Время | Примечания |
|---|---|---|
| Сканирование (синхр.) | 15–45 мин | Только первый раз, на основе потоков |
| Сканирование (асинхр.) | 5–15 мин | В 2–3 раза быстрее с флагом --async |
| Сборка | 1–3 мин | Быстрая пересборка из кэша |
| Пересборка | <1 мин | С --skip-scrape |
| Улучшение (LOCAL) | 30–60 сек | Использует Claude Code Max |
| Улучшение (API) | 20–40 сек | Требуется API Key |
| Видео (субтитры) | 1–3 мин | YouTube/локальное, только субтитры |
| Видео (визуальное) | 5–15 мин | + OCR-извлечение кадров |
| Упаковка | 5–10 сек | Создание итогового .zip |
📚 Документация
Начало работы
- BULLETPROOF_QUICKSTART.md — 🎯 НАЧНИТЕ ЗДЕСЬ, если вы новичок!
- QUICKSTART.md — Быстрый старт для опытных пользователей
- TROUBLESHOOTING.md — Распространённые проблемы и решения
- docs/QUICK_REFERENCE.md — Краткая справка на одну страницу
Руководства
- docs/LARGE_DOCUMENTATION.md — Работа с документами на 10K–40K+ страниц
- ASYNC_SUPPORT.md — Руководство по асинхронному режиму (в 2–3 раза быстрее)
- docs/ENHANCEMENT_MODES.md — Руководство по режимам ИИ-улучшения
- docs/MCP_SETUP.md — Настройка MCP-интеграции
- docs/UNIFIED_SCRAPING.md — Мультиисточниковое сканирование
- docs/VIDEO_GUIDE.md — Полное руководство по извлечению из видео
Руководства по интеграции
- docs/integrations/LANGCHAIN.md — LangChain RAG
- docs/integrations/CURSOR.md — Cursor IDE
- docs/integrations/WINDSURF.md — Windsurf IDE
- docs/integrations/CLINE.md — Cline (VS Code)
- docs/integrations/RAG_PIPELINES.md — Все RAG-конвейеры
📝 Лицензия
Лицензия MIT — подробности в файле LICENSE
Удачного создания навыков! 🚀

