Files
skill-seekers-reference/README.ja.md
yusyus 9e405df9d0 docs: add README translations for 10 languages (12 total)
Add machine-translated README files for Japanese, Korean, Spanish,
French, German, Portuguese (BR), Turkish, Arabic, Hindi, and Russian.
Update language selector in English and Chinese READMEs to link all 12
versions.

New files: README.{ja,ko,es,fr,de,pt-BR,tr,ar,hi,ru}.md
Modified: README.md, README.zh-CN.md (language selector bar)
2026-03-15 16:27:05 +03:00

50 KiB
Raw Blame History

MseeP.ai セキュリティ評価バッジ

Skill Seekers

English | 简体中文 | 日本語 | 한국어 | Español | Français | Deutsch | Português | Türkçe | العربية | हिन्दी | Русский

⚠️ 機械翻訳に関する注意

この文書はAIによって自動翻訳されたものです。翻訳の品質向上に努めていますが、不正確な表現が含まれる場合があります。

翻訳の改善にご協力いただける方は、GitHub Issue #260 からフィードバックをお寄せください。

バージョン ライセンス: MIT Python 3.10+ MCP 統合 テスト通過 プロジェクトボード PyPI バージョン PyPI - ダウンロード数 PyPI - Python バージョン 公式サイト Twitter フォロー GitHub Stars

🧠 AI システムのデータレイヤー。 Skill Seekers はドキュメントサイト、GitHub リポジトリ、PDF、動画、Jupyter Notebook、Wiki など 17 種類以上のソースタイプを構造化されたナレッジアセットに変換します。AI スキルClaude、Gemini、OpenAI、RAG パイプラインLangChain、LlamaIndex、Pinecone、AI コーディングアシスタントCursor、Windsurf、Clineを数分で構築できます。

🌐 SkillSeekersWeb.com にアクセス - 24 以上のプリセット設定を閲覧、設定の共有、完全なドキュメントへのアクセス!

📋 開発ロードマップとタスクを確認 - 10 カテゴリで 134 タスク、好きなものを選んで貢献できます!

🧠 AI システムのデータレイヤー

Skill Seekers は汎用的な前処理レイヤーであり、生のドキュメントとそれを利用するすべての AI システムの間に位置します。Claude スキル、LangChain RAG パイプライン、Cursor の .cursorrules ファイルのいずれを構築する場合でも、データの準備作業は同じです。一度実行すれば、すべてのターゲットにエクスポートできます。

# 1コマンド → 構造化ナレッジアセット
skill-seekers create https://docs.react.dev/
# または: skill-seekers create facebook/react
# または: skill-seekers create ./my-project

# 任意の AI システムにエクスポート
skill-seekers package output/react --target claude      # → Claude AI スキル (ZIP)
skill-seekers package output/react --target langchain   # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor      # → .cursorrules

生成される出力

出力 ターゲット 用途
Claude スキル (ZIP + YAML) --target claude Claude Code、Claude API
Gemini スキル (tar.gz) --target gemini Google Gemini
OpenAI / Custom GPT (ZIP) --target openai GPT-4o、カスタムアシスタント
LangChain Documents --target langchain QA チェーン、エージェント、リトリーバー
LlamaIndex TextNodes --target llama-index クエリエンジン、チャットエンジン
Haystack Documents --target haystack エンタープライズ RAG パイプライン
Pinecone 対応 (Markdown) --target markdown ベクトルアップサート
ChromaDB / FAISS / Qdrant --format chroma/faiss/qdrant ローカルベクトル DB
Cursor .cursorrules --target claude → コピー Cursor IDE AI コンテキスト
Windsurf / Cline / Continue --target claude → コピー VS Code、IntelliJ、Vim

選ばれる理由

  • 99% 高速化 — 数日の手作業データ準備 → 15〜45 分
  • 🎯 AI スキル品質 — サンプル、パターン、ガイドを含む 500 行以上の SKILL.md ファイル
  • 📊 RAG 対応チャンク — コードブロックを保持しコンテキストを維持するスマートチャンキング
  • 🔄 17 種類のソースタイプ — ドキュメント + GitHub + PDF + 動画 + ノートブック + Wiki などを 1 つのナレッジアセットに統合
  • 🌐 一度の準備で全ターゲット — 再スクレイピングなしで 16 プラットフォームにエクスポート
  • 🎬 動画 — YouTube やローカル動画からコード、字幕、構造化知識を抽出
  • 実戦テスト済み — 2,540 以上のテスト、24 以上のフレームワークプリセット、本番運用可能

クイックスタート

pip install skill-seekers

# 任意のソースから AI スキルを構築
skill-seekers create https://docs.django.com/    # ドキュメントサイト
skill-seekers create django/django               # GitHub リポジトリ
skill-seekers create ./my-codebase               # ローカルプロジェクト
skill-seekers create manual.pdf                  # PDF ファイル
skill-seekers create manual.docx                 # Word ドキュメント
skill-seekers create book.epub                   # EPUB 電子書籍
skill-seekers create notebook.ipynb              # Jupyter Notebook
skill-seekers create page.html                   # ローカル HTML
skill-seekers create api-spec.yaml               # OpenAPI/Swagger 仕様
skill-seekers create guide.adoc                  # AsciiDoc ドキュメント
skill-seekers create slides.pptx                 # PowerPoint プレゼンテーション

# 動画YouTube、Vimeo、またはローカルファイル — skill-seekers[video] が必要)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# 初回使用時は GPU 対応のビジュアル依存関係を自動インストール:
skill-seekers video --setup

# 用途に応じてエクスポート
skill-seekers package output/django --target claude     # Claude AI スキル
skill-seekers package output/django --target langchain  # LangChain RAG
skill-seekers package output/django --target cursor     # Cursor IDE コンテキスト

完全なサンプル:

Skill Seekers とは?

Skill Seekers は AI システムのデータレイヤーであり、17 種類のソースタイプ——ドキュメントサイト、GitHub リポジトリ、PDF、動画、Jupyter Notebook、Word/EPUB/AsciiDoc ドキュメント、OpenAPI/Swagger 仕様、PowerPoint プレゼンテーション、RSS/Atom フィード、Man ページ、Confluence Wiki、Notion ページ、Slack/Discord チャットエクスポートなど——をすべての AI ターゲットに適した構造化ナレッジアセットに変換します:

ユースケース 得られるもの
AI スキル 包括的な SKILL.md + 参照ファイル Claude Code、Gemini、GPT
RAG パイプライン リッチなメタデータ付きチャンクドキュメント LangChain、LlamaIndex、Haystack
ベクトルデータベース アップサート用にフォーマット済みデータ Pinecone、Chroma、Weaviate、FAISS
AI コーディングアシスタント IDE の AI が自動的に読み取るコンテキストファイル Cursor、Windsurf、Cline、Continue.dev

Skill Seekers は以下のステップで数日の手動前処理作業を代替します:

  1. 取り込み — ドキュメント、GitHub リポジトリ、ローカルコードベース、PDF、動画、Jupyter Notebook、Wiki など 17 種類以上のソースタイプ
  2. 分析 — 高度な AST 解析、パターン検出、API 抽出
  3. 構造化 — メタデータ付きのカテゴリ分類された参照ファイル
  4. 強化 — AI 駆動の SKILL.md 生成Claude、Gemini、またはローカル
  5. エクスポート — 1 つのアセットから 16 種類のプラットフォーム専用フォーマットにエクスポート

なぜ Skill Seekers を使うのか?

AI スキルビルダー向けClaude、Gemini、OpenAI

  • 🎯 本番グレードのスキル — コード例、パターン、ガイドを含む 500 行以上の SKILL.md ファイル
  • 🔄 強化ワークフローsecurity-focusarchitecture-comprehensive またはカスタム YAML プリセットを適用
  • 🎮 あらゆるドメイン — ゲームエンジンGodot、Unity、フレームワークReact、Django、社内ツール
  • 🔧 チーム向け — 社内ドキュメント + コードを単一の信頼できるソースに統合
  • 📚 高品質 — サンプル、クイックリファレンス、ナビゲーションガイド付きの AI 強化

RAG ビルダー & AI エンジニア向け

  • 🤖 RAG 対応データ — 事前チャンク済みの LangChain Documents、LlamaIndex TextNodes、Haystack Documents
  • 🚀 99% 高速化 — 数日の前処理 → 15〜45 分
  • 📊 スマートメタデータ — カテゴリ、ソース、タイプ → より高い検索精度
  • 🔄 マルチソース — 1 つのパイプラインでドキュメント + GitHub + PDF を統合
  • 🌐 プラットフォーム非依存 — 再スクレイピングなしで任意のベクトル DB やフレームワークにエクスポート

AI コーディングアシスタントユーザー向け

  • 💻 Cursor / Windsurf / Cline.cursorrules / .windsurfrules / .clinerules を自動生成
  • 🎯 永続的コンテキスト — AI がフレームワークを「理解」し、繰り返しのプロンプトが不要に
  • 📚 常に最新 — ドキュメント更新時に数分でコンテキストを更新

主要機能

🌐 ドキュメントスクレイピング

  • llms.txt サポート - LLM 対応ドキュメントファイルを自動検出し使用10 倍高速)
  • 汎用スクレイパー - あらゆるドキュメントサイトに対応
  • スマート分類 - トピック別にコンテンツを自動整理
  • コード言語検出 - Python、JavaScript、C++、GDScript などを認識
  • 24 以上のプリセット - Godot、React、Vue、Django、FastAPI など

📄 PDF サポート

  • 基本 PDF 抽出 - PDF からテキスト、コード、画像を抽出
  • スキャン PDF の OCR - スキャンドキュメントからテキストを抽出
  • パスワード保護 PDF - 暗号化 PDF の処理
  • テーブル抽出 - 複雑なテーブルの抽出
  • 並列処理 - 大規模 PDF で 3 倍高速
  • インテリジェントキャッシュ - 再実行時に 50% 高速

🎬 動画抽出

  • YouTube & ローカル動画 - 動画から字幕、コード、構造化知識を抽出
  • ビジュアルフレーム分析 - コードエディタ、ターミナル、スライドの OCR 抽出
  • GPU 自動検出 - 正しい PyTorch ビルドCUDA/ROCm/MPS/CPUを自動インストール
  • AI 強化 - 2 パス処理OCR アーティファクトのクリーンアップ + 洗練された SKILL.md の生成
  • 時間トリミング - --start-time--end-time で特定のセクションを抽出
  • プレイリストサポート - YouTube プレイリスト内のすべての動画を一括処理

🐙 GitHub リポジトリ分析

  • 高度なコード分析 - Python、JavaScript、TypeScript、Java、C++、Go の AST 解析
  • API 抽出 - 関数、クラス、メソッドのパラメータと型情報
  • リポジトリメタデータ - README、ファイルツリー、言語構成、スター/フォーク数
  • GitHub Issues & PR - ラベルとマイルストーン付きの Issue を取得
  • CHANGELOG & リリース - バージョン履歴を自動抽出
  • コンフリクト検出 - ドキュメント化された API と実際のコード実装を比較
  • MCP 統合 - 自然言語で操作「GitHub リポジトリ facebook/react をスクレイプ」

🔄 統合マルチソーススクレイピング

  • 複数ソースの統合 - 1 つのスキルでドキュメント + GitHub + PDF を混合
  • コンフリクト検出 - ドキュメントとコード間の不一致を自動検出
  • インテリジェントマージ - ルールベースまたは AI 駆動のコンフリクト解決
  • 透明なレポート - ⚠️ 警告付きの並列比較
  • ドキュメントギャップ分析 - 古いドキュメントや未文書化機能を特定
  • 唯一の信頼できるソース - 意図(ドキュメント)と現実(コード)の両方を示す 1 つのスキル
  • 後方互換性 - レガシーの単一ソース設定は引き続き動作

🤖 マルチ LLM プラットフォームサポート

  • 4 つの LLM プラットフォーム - Claude AI、Google Gemini、OpenAI ChatGPT、汎用 Markdown
  • 汎用スクレイピング - 同じドキュメントがすべてのプラットフォームで使用可能
  • プラットフォーム固有のパッケージング - 各 LLM に最適化されたフォーマット
  • ワンコマンドエクスポート - --target フラグでプラットフォームを選択
  • オプション依存関係 - 必要なものだけインストール
  • 100% 後方互換 - 既存の Claude ワークフローは変更不要
プラットフォーム フォーマット アップロード 強化 API キー カスタムエンドポイント
Claude AI ZIP + YAML 自動 あり ANTHROPIC_API_KEY ANTHROPIC_BASE_URL
Google Gemini tar.gz 自動 あり GOOGLE_API_KEY -
OpenAI ChatGPT ZIP + Vector Store 自動 あり OPENAI_API_KEY -
汎用 Markdown ZIP 手動 なし - -
# Claudeデフォルト — 変更不要!)
skill-seekers package output/react/
skill-seekers upload react.zip

# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini

# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai

# 汎用 Markdownユニバーサルエクスポート
skill-seekers package output/react/ --target markdown
🔧 Claude 互換 API の環境変数GLM-4.7

Skill Seekers は任意の Claude 互換 API エンドポイントをサポートしています:

# オプション 1公式 Anthropic APIデフォルト
export ANTHROPIC_API_KEY=sk-ant-...

# オプション 2GLM-4.7 Claude 互換 API
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1

# すべての AI 強化機能は設定されたエンドポイントを使用します
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance

注意ANTHROPIC_BASE_URL を設定すると、GLM-4.7(智谱 AIやその他の互換サービスなど、任意の Claude 互換 API エンドポイントを使用できます。

インストール:

# Gemini サポートをインストール
pip install skill-seekers[gemini]

# OpenAI サポートをインストール
pip install skill-seekers[openai]

# すべての LLM プラットフォームをインストール
pip install skill-seekers[all-llms]

🔗 RAG フレームワーク統合

  • LangChain Documents - page_content + メタデータ付きの Document フォーマットに直接エクスポート

  • LlamaIndex TextNodes - ユニーク ID + エンベディング付きの TextNode フォーマットにエクスポート

  • Pinecone 対応フォーマット - ベクトルデータベースアップサートに最適化

クイックエクスポート:

# LangChain DocumentsJSON
skill-seekers package output/django --target langchain
# → output/django-langchain.json

# LlamaIndex TextNodesJSON
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json

# Markdown汎用
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/

完全な RAG パイプラインガイド: RAG パイプラインドキュメント


🧠 AI コーディングアシスタント統合

任意のフレームワークドキュメントを 4 つ以上の AI アシスタント向けのエキスパートコーディングコンテキストに変換:

  • Cursor IDE - AI 駆動のコード提案用に .cursorrules を生成

  • Windsurf - .windsurfrules で Windsurf AI アシスタントのコンテキストをカスタマイズ

  • ClineVS Code - VS Code エージェント用のシステムプロンプト + MCP

  • Continue.dev - IDE 非依存の AI コンテキストサーバー

AI コーディングツール向けクイックエクスポート:

# 任意の AI コーディングアシスタント向けCursor、Windsurf、Cline、Continue.dev
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude

# プロジェクトにコピーCursor の場合)
cp output/django-claude/SKILL.md my-project/.cursorrules

# Windsurf の場合
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md

# Cline の場合
cp output/django-claude/SKILL.md my-project/.clinerules

統合ハブ: すべての AI システム統合


🌊 3 ストリーム GitHub アーキテクチャ

  • 3 ストリーム分析 - GitHub リポジトリをコード、ドキュメント、インサイトの 3 ストリームに分割
  • 統合コードベースアナライザー - GitHub URL とローカルパスの両方に対応
  • C3.x 分析深度 - 「basic」1〜2 分または「c3x」20〜60 分)分析を選択
  • 強化ルーター生成 - GitHub メタデータ、README クイックスタート、よくある問題
  • Issue 統合 - GitHub Issues からのよくある問題と解決策
  • スマートルーティングキーワード - GitHub ラベルの重み付けが 2 倍でトピック検出精度を向上

3 ストリームの説明:

  • ストリーム 1コード - 高度な C3.x 分析(パターン、サンプル、ガイド、設定、アーキテクチャ)
  • ストリーム 2ドキュメント - リポジトリドキュメントREADME、CONTRIBUTING、docs/*.md
  • ストリーム 3インサイト - コミュニティ知識Issues、ラベル、Stars、Forks
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer

# 3 ストリームで GitHub リポジトリを分析
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
    source="https://github.com/facebook/react",
    depth="c3x",  # または "basic" でクイック分析
    fetch_github_metadata=True
)

print(f"デザインパターン: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Stars: {result.github_insights['metadata']['stars']}")

完全なドキュメント3 ストリーム実装サマリー

🔐 スマートレート制限管理と設定

  • マルチトークン設定システム - 複数の GitHub アカウント個人、仕事、OSSを管理
    • セキュアな設定ストレージ ~/.config/skill-seekers/config.json(パーミッション 600
    • プロファイルごとのレート制限戦略:promptwaitswitchfail
    • スマートフォールバックチェーンCLI 引数 → 環境変数 → 設定ファイル → プロンプト
  • 対話式設定ウィザード - 美しいターミナル UI で簡単セットアップ
  • インテリジェントレート制限ハンドラー - 無限待ちはもう終わり!
    • リアルタイムカウントダウンと自動プロファイル切り替え
    • 4 つの戦略prompt確認、waitカウントダウン、switch切り替え、fail中止
  • レジューム機能 - 中断されたジョブの再開
  • CI/CD サポート - --non-interactive フラグで自動化対応

クイックセットアップ:

# 初回設定5 分)
skill-seekers config --github

# プライベートリポジトリ用に特定のプロファイルを使用
skill-seekers github --repo mycompany/private-repo --profile work

# CI/CD モード(即時失敗、プロンプトなし)
skill-seekers github --repo owner/repo --non-interactive

🎯 Bootstrap スキル — セルフホスティング

skill-seekers 自体を Claude Code スキルとして生成:

./scripts/bootstrap_skill.sh
cp -r output/skill-seekers ~/.claude/skills/

🔐 プライベート設定リポジトリ

  • Git ベースの設定ソース - プライベート/チーム Git リポジトリから設定を取得
  • マルチソース管理 - GitHub、GitLab、Bitbucket リポジトリを無制限に登録
  • チームコラボレーション - 3〜5 人のチーム間でカスタム設定を共有
  • エンタープライズサポート - 500 人以上の開発者にスケール
  • セキュア認証 - 環境変数トークンGITHUB_TOKEN、GITLAB_TOKEN

🤖 コードベース分析C3.x

C3.4AI 強化付き設定パターン抽出

  • 9 つの設定フォーマット - JSON、YAML、TOML、ENV、INI、Python、JavaScript、Dockerfile、Docker Compose
  • 7 つのパターンタイプ - データベース、API、ロギング、キャッシュ、メール、認証、サーバー設定
  • AI 強化 - オプションのデュアルモード AI 分析API + LOCAL
  • セキュリティ分析 - ハードコードされたシークレットや公開された認証情報を検出

C3.3AI 強化操作ガイド

  • 包括的な AI 強化 - 基本ガイドをプロフェッショナルなチュートリアルに変換
  • 5 つの自動改善 - ステップ説明、トラブルシューティング、前提条件、次のステップ、ユースケース
  • デュアルモードサポート - API モードClaude APIまたは LOCAL モードClaude Code CLI
  • LOCAL モードはコスト無料 - Claude Code Max プランで無料強化

使用方法:

# クイック分析1〜2 分、基本機能のみ)
skill-seekers analyze --directory tests/ --quick

# 包括的分析AI 付き、20〜60 分)
skill-seekers analyze --directory tests/ --comprehensive

# AI 強化付き
skill-seekers analyze --directory tests/ --enhance

完全なドキュメント: docs/HOW_TO_GUIDES.md

🔄 強化ワークフロープリセット

再利用可能な YAML 定義の強化パイプラインで、AI が生のドキュメントを洗練されたスキルに変換する方法を制御します。

  • 5 つの組み込みプリセットdefaultminimalsecurity-focusarchitecture-comprehensiveapi-documentation
  • ユーザー定義プリセット~/.config/skill-seekers/workflows/ にカスタムワークフローを追加
  • 複数ワークフローチェーン — 1 つのコマンドで 2 つ以上のワークフローをチェーン
  • 完全な CLI 管理 — ワークフローの一覧表示、確認、コピー、追加、削除、検証
# 単一ワークフローの適用
skill-seekers create ./my-project --enhance-workflow security-focus

# 複数ワークフローのチェーン(順序どおりに適用)
skill-seekers create ./my-project \
  --enhance-workflow security-focus \
  --enhance-workflow minimal

# プリセットの管理
skill-seekers workflows list                          # すべて一覧表示(組み込み + ユーザー)
skill-seekers workflows show security-focus           # YAML 内容を表示
skill-seekers workflows copy security-focus           # 編集用にユーザーディレクトリにコピー
skill-seekers workflows add ./my-workflow.yaml        # カスタムプリセットをインストール
skill-seekers workflows remove my-workflow            # ユーザープリセットを削除
skill-seekers workflows validate security-focus       # プリセット構造を検証

# 複数を同時にコピー
skill-seekers workflows copy security-focus minimal api-documentation

# 複数ファイルを同時に追加
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml

# 複数を同時に削除
skill-seekers workflows remove my-wf-a my-wf-b

YAML プリセットフォーマット:

name: security-focus
description: "セキュリティ重点レビュー:脆弱性、認証、データ処理"
version: "1.0"
stages:
  - name: vulnerabilities
    type: custom
    prompt: "OWASP Top 10 と一般的なセキュリティ脆弱性をレビュー..."
  - name: auth-review
    type: custom
    prompt: "認証と認可パターンを検査..."
    uses_history: true

パフォーマンスとスケール

  • 非同期モード - async/await で 2〜3 倍高速なスクレイピング(--async フラグを使用)
  • 大規模ドキュメントサポート - インテリジェントな分割で 10K〜40K 以上のページを処理
  • ルーター/ハブスキル - 専用サブスキルへのインテリジェントルーティング
  • 並列スクレイピング - 複数のスキルを同時処理
  • チェックポイント/レジューム - 長時間スクレイプでも進捗を失わない
  • キャッシュシステム - 一度スクレイプすれば即座にリビルド

品質保証

  • 完全テスト - 2,540 以上のテスト、包括的なカバレッジ

📦 インストール

# 基本インストールドキュメントスクレイピング、GitHub 分析、PDF、パッケージング
pip install skill-seekers

# すべての LLM プラットフォームサポート付き
pip install skill-seekers[all-llms]

# MCP サーバー付き
pip install skill-seekers[mcp]

# 全機能
pip install skill-seekers[all]

選択に迷ったら? セットアップウィザードを実行:

skill-seekers-setup

インストールオプション

インストールコマンド 機能
pip install skill-seekers スクレイピング、GitHub 分析、PDF、全プラットフォーム
pip install skill-seekers[gemini] + Google Gemini サポート
pip install skill-seekers[openai] + OpenAI ChatGPT サポート
pip install skill-seekers[all-llms] + すべての LLM プラットフォーム
pip install skill-seekers[mcp] + MCP サーバー
pip install skill-seekers[video] + YouTube/Vimeo 字幕 & メタデータ抽出
pip install skill-seekers[video-full] + Whisper 文字起こし & ビジュアルフレーム抽出
pip install skill-seekers[jupyter] + Jupyter Notebook サポート
pip install skill-seekers[ocr] + OCR サポートPDF スキャン、ビジュアルフレーム)
pip install skill-seekers[confluence] + Confluence Wiki サポート
pip install skill-seekers[notion] + Notion ページサポート
pip install skill-seekers[all] 全機能

動画ビジュアル依存関係GPU 対応): skill-seekers[video-full] をインストールした後、 skill-seekers video --setup を実行して GPU を自動検出し、正しい PyTorch バージョン + easyocr をインストールします。これはビジュアル抽出依存関係のインストールに推奨される方法です。


🚀 ワンコマンドインストールワークフロー

設定からスキルアップロードまでの最速の方法——完全自動化:

# 公式設定から React スキルをインストールClaude に自動アップロード)
skill-seekers install --config react

# ローカル設定ファイルからインストール
skill-seekers install --config configs/custom.json

# アップロードなしでインストール(パッケージのみ)
skill-seekers install --config django --no-upload

# 実行せずにワークフローをプレビュー
skill-seekers install --config react --dry-run

実行フェーズ:

📥 フェーズ 1設定の取得設定名が指定された場合
📖 フェーズ 2ドキュメントのスクレイピング
✨ フェーズ 3AI 強化
📦 フェーズ 4スキルのパッケージング
☁️  フェーズ 5Claude にアップロードオプション、API キーが必要)

📊 機能マトリックス

Skill Seekers は 4 つの LLM プラットフォーム17 種類のソースタイプ5 つのスキルモードをサポートし、機能は完全に同等です。

プラットフォーム: Claude AI、Google Gemini、OpenAI ChatGPT、汎用 Markdown ソースタイプ: ドキュメントサイト、GitHub リポジトリ、PDF、Word、EPUB、動画、ローカルコードベース、Jupyter Notebook、ローカル HTML、OpenAPI/Swagger 仕様、AsciiDoc ドキュメント、PowerPoint プレゼンテーション、RSS/Atom フィード、Man ページ、Confluence Wiki、Notion ページ、Slack/Discord チャットエクスポート スキルモード: ドキュメント、GitHub、PDF、統合マルチソース、ローカルリポジトリ

詳細は 完全な機能マトリックス をご覧ください。

プラットフォーム簡易比較

機能 Claude Gemini OpenAI Markdown
フォーマット ZIP + YAML tar.gz ZIP + Vector ZIP
アップロード API API API 手動
強化 Sonnet 4 2.0 Flash GPT-4o なし
全スキルモード

使用例

ドキュメントスクレイピング

# ドキュメントサイトをスクレイプ
skill-seekers scrape --config configs/react.json

# 設定なしでクイックスクレイプ
skill-seekers scrape --url https://react.dev --name react

# 非同期モード3 倍高速)
skill-seekers scrape --config configs/godot.json --async --workers 8

PDF 抽出

# 基本 PDF 抽出
skill-seekers pdf --pdf docs/manual.pdf --name myskill

# 高度な機能
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
    --extract-tables \        # テーブル抽出
    --parallel \              # 高速並列処理
    --workers 8               # 8 CPU コアを使用

# スキャン PDF必要pip install pytesseract Pillow
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr

動画抽出

# 動画サポートのインストール
pip install skill-seekers[video]        # 字幕 + メタデータ
pip install skill-seekers[video-full]   # + Whisper 文字起こし + ビジュアルフレーム抽出

# GPU 自動検出とビジュアル依存関係のインストールPyTorch + easyocr
skill-seekers video --setup

# YouTube 動画から抽出
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial

# YouTube プレイリストから抽出
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist

# ローカル動画ファイルから抽出
skill-seekers video --video-file recording.mp4 --name myrecording

# ビジュアルフレーム分析付きで抽出video-full 依存関係が必要)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual

# AI 強化付きOCR クリーンアップ + 洗練された SKILL.md を生成)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2

# 動画の特定セクションをトリミング秒数、MM:SS、HH:MM:SS 形式に対応)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00

# 低信頼度 OCR フレームに Vision API を使用ANTHROPIC_API_KEY が必要)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr

# 以前に抽出したデータからスキルを再構築(ダウンロードをスキップ)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial

完全ガイド: docs/VIDEO_GUIDE.md で完全な CLI リファレンス、 ビジュアルパイプラインの詳細、AI 強化オプション、トラブルシューティングを参照してください。

GitHub リポジトリ分析

# 基本リポジトリスクレイピング
skill-seekers github --repo facebook/react

# 認証付き(より高いレート制限)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react

# 含めるコンテンツのカスタマイズ
skill-seekers github --repo django/django \
    --include-issues \        # GitHub Issues を抽出
    --max-issues 100 \        # Issue 数を制限
    --include-changelog       # CHANGELOG.md を抽出

統合マルチソーススクレイピング

ドキュメント + GitHub + PDF をコンフリクト検出付きの統合スキルに統合:

# 既存の統合設定を使用
skill-seekers unified --config configs/react_unified.json

# または統合設定を作成
cat > configs/myframework_unified.json << 'EOF'
{
  "name": "myframework",
  "merge_mode": "rule-based",
  "sources": [
    {
      "type": "documentation",
      "base_url": "https://docs.myframework.com/",
      "max_pages": 200
    },
    {
      "type": "github",
      "repo": "owner/myframework",
      "code_analysis_depth": "surface"
    }
  ]
}
EOF

skill-seekers unified --config configs/myframework_unified.json

コンフリクト検出が自動的に発見するもの:

  • 🔴 コードに存在しない(高):文書化されているが未実装
  • 🟡 ドキュメントに存在しない(中):実装されているが未文書化
  • ⚠️ シグネチャ不一致:パラメータ/型が異なる
  • 説明の不一致:説明が異なる

完全ガイド: docs/UNIFIED_SCRAPING.md を参照してください。

プライベート設定リポジトリ

プライベート Git リポジトリを使用してチーム間でカスタム設定を共有:

# MCP ツールでチームのプライベートリポジトリを登録
add_config_source(
    name="team",
    git_url="https://github.com/mycompany/skill-configs.git",
    token_env="GITHUB_TOKEN"
)

# チームリポジトリから設定を取得
fetch_config(source="team", config_name="internal-api")

サポートされるプラットフォーム:

  • GitHubGITHUB_TOKEN、GitLabGITLAB_TOKEN、GiteaGITEA_TOKEN、BitbucketBITBUCKET_TOKEN

完全ガイド: docs/GIT_CONFIG_SOURCES.md を参照してください。

仕組み

graph LR
    A[ドキュメントサイト] --> B[Skill Seekers]
    B --> C[スクレイパー]
    B --> D[AI 強化]
    B --> E[パッケージャー]
    C --> F[整理された参照ファイル]
    D --> F
    F --> E
    E --> G[Claude スキル .zip]
    G --> H[Claude AI にアップロード]
  1. llms.txt の検出 - llms-full.txt、llms.txt、llms-small.txt を優先チェック
  2. スクレイプ:ドキュメントからすべてのページを抽出
  3. カテゴリ分類コンテンツをトピック別に整理API、ガイド、チュートリアルなど
  4. 強化AI がドキュメントを分析し、サンプル付きの包括的な SKILL.md を作成
  5. パッケージ:すべてを Claude 対応の .zip ファイルにバンドル

📋 前提条件

開始前に以下を確認してください:

  1. Python 3.10 以上 - ダウンロード | 確認:python3 --version
  2. Git - ダウンロード | 確認:git --version
  3. 15〜30 分の初回セットアップ時間

初めての方は?こちらから開始:確実なクイックスタートガイド 🎯


📤 Claude へのスキルアップロード

スキルのパッケージが完了したら、Claude にアップロードする必要があります:

オプション 1自動アップロードAPI ベース)

# API キーを設定(一度だけ)
export ANTHROPIC_API_KEY=sk-ant-...

# パッケージと自動アップロード
skill-seekers package output/react/ --upload

# または既存の .zip をアップロード
skill-seekers upload output/react.zip

オプション 2手動アップロードAPI キー不要)

# スキルをパッケージ
skill-seekers package output/react/
# → output/react.zip が作成されます

# 手動でアップロード:
# - https://claude.ai/skills にアクセス
# - 「スキルをアップロード」をクリック
# - output/react.zip を選択

オプション 3MCPClaude Code

Claude Code で直接聞くだけ:
「React スキルをパッケージしてアップロードして」

🤖 AI エージェントへのインストール

Skill Seekers は 10 以上の AI コーディングエージェントにスキルを自動インストールできます。

# 特定のエージェントにインストール
skill-seekers install-agent output/react/ --agent cursor

# すべてのエージェントに一括インストール
skill-seekers install-agent output/react/ --agent all

# インストールせずにプレビュー
skill-seekers install-agent output/react/ --agent cursor --dry-run

サポートされるエージェント

エージェント パス タイプ
Claude Code ~/.claude/skills/ グローバル
Cursor .cursor/skills/ プロジェクト
VS Code / Copilot .github/skills/ プロジェクト
Amp ~/.amp/skills/ グローバル
Goose ~/.config/goose/skills/ グローバル
OpenCode ~/.opencode/skills/ グローバル
Windsurf ~/.windsurf/skills/ グローバル

🔌 MCP 統合27 ツール)

Skill Seekers は Claude Code、Cursor、Windsurf、VS Code + Cline、IntelliJ IDEA で使用できる MCP サーバーを提供します。

# stdio モードClaude Code、VS Code + Cline
python -m skill_seekers.mcp.server_fastmcp

# HTTP モードCursor、Windsurf、IntelliJ
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765

# すべてのエージェントを一括自動設定
./setup_mcp.sh

全 27 ツール:

  • コア9 list_configsgenerate_configvalidate_configestimate_pagesscrape_docspackage_skillupload_skillenhance_skillinstall_skill
  • 拡張11 scrape_githubscrape_pdfscrape_genericunified_scrapemerge_sourcesdetect_conflictsadd_config_sourcefetch_configlist_config_sourcesremove_config_sourcesplit_config
  • ベクトル DB4 export_to_chromaexport_to_weaviateexport_to_faissexport_to_qdrant
  • クラウドストレージ3 cloud_uploadcloud_downloadcloud_list

scrape_generic は 10 種類の新しいソースタイプをサポートJupyter Notebook、ローカル HTML、OpenAPI/Swagger 仕様、AsciiDoc ドキュメント、PowerPoint プレゼンテーション、RSS/Atom フィード、Man ページ、Confluence Wiki、Notion ページ、Slack/Discord チャットエクスポート。

完全ガイド: docs/MCP_SETUP.md


⚙️ 設定

利用可能なプリセット24 以上)

# すべてのプリセットを一覧表示
skill-seekers list-configs
カテゴリ プリセット
Web フレームワーク reactvueangularsveltenextjs
Python djangoflaskfastapisqlalchemypytest
ゲーム開発 godotpygameunity
ツール & DevOps dockerkubernetesterraformansible
統合(ドキュメント + GitHub react-unifiedvue-unifiednextjs-unified など

独自の設定を作成

# オプション 1対話式
skill-seekers scrape --interactive

# オプション 2プリセットをコピーして編集
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json

設定ファイルの構造

{
  "name": "myframework",
  "description": "このスキルを使用するタイミング",
  "base_url": "https://docs.myframework.com/",
  "selectors": {
    "main_content": "article",
    "title": "h1",
    "code_blocks": "pre code"
  },
  "url_patterns": {
    "include": ["/docs", "/guide"],
    "exclude": ["/blog", "/about"]
  },
  "categories": {
    "getting_started": ["intro", "quickstart"],
    "api": ["api", "reference"]
  },
  "rate_limit": 0.5,
  "max_pages": 500
}

設定の保存場所

ツールは以下の順序で検索します:

  1. 指定された正確なパス
  2. ./configs/(カレントディレクトリ)
  3. ~/.config/skill-seekers/configs/(ユーザー設定ディレクトリ)
  4. SkillSeekersWeb.com APIプリセット設定

📊 作成されるもの

output/
├── godot_data/              # スクレイプされた生データ
│   ├── pages/              # JSON ファイル(ページごとに 1 つ)
│   └── summary.json        # 概要
│
└── godot/                   # スキルファイル
    ├── SKILL.md            # 実際のサンプル付き強化版
    ├── references/         # カテゴリ分類されたドキュメント
    │   ├── index.md
    │   ├── getting_started.md
    │   ├── scripting.md
    │   └── ...
    ├── scripts/            # 空(独自のスクリプトを追加可能)
    └── assets/             # 空(独自のアセットを追加可能)

🐛 トラブルシューティング

コンテンツが抽出されない場合

  • main_content セレクタを確認してください
  • 試してみてください:articlemaindiv[role="main"]

データはあるのに使用されない場合

# 強制再スクレイプ
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json

カテゴリ分類が不適切な場合

設定の categories セクションをより適切なキーワードで編集してください。

ドキュメントを更新したい場合

# 古いデータを削除して再スクレイプ
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json

強化が動作しない場合

# API キーが設定されているか確認
echo $ANTHROPIC_API_KEY

# LOCAL モードを試すClaude Code Max を使用、API キー不要)
skill-seekers enhance output/react/ --mode LOCAL

# バックグラウンド強化の状態を監視
skill-seekers enhance-status output/react/ --watch

GitHub レート制限の問題?

# GitHub トークンを設定(匿名 60 回/時間 → 5000 回/時間)
export GITHUB_TOKEN=ghp_your_token_here

# または複数のプロファイルを設定
skill-seekers config --github

📈 パフォーマンス

タスク 時間 備考
スクレイピング(同期) 15〜45 分 初回のみ、スレッドベース
スクレイピング(非同期) 5〜15 分 --async フラグで 2〜3 倍高速
ビルド 1〜3 分 キャッシュからの高速リビルド
リビルド 1 分未満 --skip-scrape 使用時
強化LOCAL 30〜60 秒 Claude Code Max を使用
強化API 20〜40 秒 API キーが必要
パッケージング 5〜10 秒 最終 .zip の作成

📚 ドキュメント

はじめに

ガイド

統合ガイド


📝 ライセンス

MIT ライセンス - 詳細は LICENSE ファイルを参照してください


スキル構築をお楽しみください! 🚀