- Fix title: "Skill Seeker" → "Skill Seekers" - Update version badge: 3.0.0 → 3.1.0-dev - Remove all outdated "全新 - v2.x" labels (14+ occurrences) - Remove duplicate sections (multi-agent MCP, old venv instructions, etc.) - Reduce from 2081 lines to ~975 lines to match English structure - Add Enhancement Workflow Presets section (workflows CLI) - Update MCP tool count: 18 → 26 - Update test count: consistent 1,880+ Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
976 lines
35 KiB
Markdown
976 lines
35 KiB
Markdown
[](https://mseep.ai/app/yusufkaraaslan-skill-seekers)
|
||
|
||
# Skill Seekers
|
||
|
||
[English](https://github.com/yusufkaraaslan/Skill_Seekers/blob/main/README.md) | 简体中文
|
||
|
||
> ⚠️ **机器翻译声明**
|
||
>
|
||
> 本文档由 AI 自动翻译生成。虽然我们努力确保翻译质量,但可能存在不准确或不自然的表述。
|
||
>
|
||
> 欢迎通过 [GitHub Issue #260](https://github.com/yusufkaraaslan/Skill_Seekers/issues/260) 帮助改进翻译!您的反馈对我们非常宝贵。
|
||
|
||
[](https://github.com/yusufkaraaslan/Skill_Seekers/releases)
|
||
[](https://opensource.org/licenses/MIT)
|
||
[](https://www.python.org/downloads/)
|
||
[](https://modelcontextprotocol.io)
|
||
[](tests/)
|
||
[](https://github.com/users/yusufkaraaslan/projects/2)
|
||
[](https://pypi.org/project/skill-seekers/)
|
||
[](https://pypi.org/project/skill-seekers/)
|
||
[](https://pypi.org/project/skill-seekers/)
|
||
[](https://skillseekersweb.com/)
|
||
[](https://x.com/_yUSyUS_)
|
||
[](https://github.com/yusufkaraaslan/Skill_Seekers)
|
||
|
||
**🧠 AI 系统的数据层。** Skill Seekers 将任何文档、GitHub 仓库或 PDF 转换为结构化知识资产——可在几分钟内为 AI 技能(Claude、Gemini、OpenAI)、RAG 流水线(LangChain、LlamaIndex、Pinecone)和 AI 编程助手(Cursor、Windsurf、Cline)提供支持。
|
||
|
||
> 🌐 **[访问 SkillSeekersWeb.com](https://skillseekersweb.com/)** - 浏览 24+ 个预设配置,分享您的配置,访问完整文档!
|
||
|
||
> 📋 **[查看开发路线图和任务](https://github.com/users/yusufkaraaslan/projects/2)** - 10 个类别的 134 个任务,选择任意一个参与贡献!
|
||
|
||
## 🧠 AI 系统的数据层
|
||
|
||
**Skill Seekers 是通用预处理层**,位于原始文档和所有使用它的 AI 系统之间。无论您是在构建 Claude 技能、LangChain RAG 流水线,还是 Cursor `.cursorrules` 文件——数据准备工作完全相同。只需执行一次,即可导出到所有目标平台。
|
||
|
||
```bash
|
||
# 一条命令 → 结构化知识资产
|
||
skill-seekers create https://docs.react.dev/
|
||
# 或: skill-seekers create facebook/react
|
||
# 或: skill-seekers create ./my-project
|
||
|
||
# 导出到任意 AI 系统
|
||
skill-seekers package output/react --target claude # → Claude AI 技能 (ZIP)
|
||
skill-seekers package output/react --target langchain # → LangChain Documents
|
||
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
|
||
skill-seekers package output/react --target cursor # → .cursorrules
|
||
```
|
||
|
||
### 可构建的输出
|
||
|
||
| 输出 | 目标 | 应用场景 |
|
||
|------|------|---------|
|
||
| **Claude 技能** (ZIP + YAML) | `--target claude` | Claude Code、Claude API |
|
||
| **Gemini 技能** (tar.gz) | `--target gemini` | Google Gemini |
|
||
| **OpenAI / Custom GPT** (ZIP) | `--target openai` | GPT-4o、自定义助手 |
|
||
| **LangChain Documents** | `--target langchain` | QA 链、智能体、检索器 |
|
||
| **LlamaIndex TextNodes** | `--target llama-index` | 查询引擎、对话引擎 |
|
||
| **Haystack Documents** | `--target haystack` | 企业级 RAG 流水线 |
|
||
| **Pinecone 就绪** (Markdown) | `--target markdown` | 向量上传 |
|
||
| **ChromaDB / FAISS / Qdrant** | `--format chroma/faiss/qdrant` | 本地向量数据库 |
|
||
| **Cursor** `.cursorrules` | `--target claude` → 复制 | Cursor IDE AI 上下文 |
|
||
| **Windsurf / Cline / Continue** | `--target claude` → 复制 | VS Code、IntelliJ、Vim |
|
||
|
||
### 为什么选择 Skill Seekers
|
||
|
||
- ⚡ **快 99%** — 数天的手动数据准备 → 15–45 分钟
|
||
- 🎯 **AI 技能质量** — 500+ 行的 SKILL.md 文件,包含示例、模式和指南
|
||
- 📊 **RAG 就绪的分块** — 智能分块保留代码块并维护上下文
|
||
- 🔄 **多源支持** — 将文档 + GitHub + PDF 合并为一个知识资产
|
||
- 🌐 **一次准备,导出所有目标** — 无需重新抓取即可导出到 16 个平台
|
||
- ✅ **久经考验** — 1,880+ 测试,24+ 框架预设,生产就绪
|
||
|
||
## 快速开始
|
||
|
||
```bash
|
||
pip install skill-seekers
|
||
|
||
# 从任意来源构建 AI 技能
|
||
skill-seekers create https://docs.django.com/ # 文档网站
|
||
skill-seekers create django/django # GitHub 仓库
|
||
skill-seekers create ./my-codebase # 本地项目
|
||
skill-seekers create manual.pdf # PDF 文件
|
||
|
||
# 根据用途导出
|
||
skill-seekers package output/django --target claude # Claude AI 技能
|
||
skill-seekers package output/django --target langchain # LangChain RAG
|
||
skill-seekers package output/django --target cursor # Cursor IDE 上下文
|
||
```
|
||
|
||
**完整示例:**
|
||
- [Claude AI 技能](examples/claude-skill/) - 面向 Claude Code 的技能
|
||
- [LangChain RAG 流水线](examples/langchain-rag-pipeline/) - 基于 Chroma 的问答链
|
||
- [Cursor IDE 上下文](examples/cursor-react-skill/) - 框架感知 AI 编程
|
||
|
||
## 什么是 Skill Seekers?
|
||
|
||
Skill Seekers 是 **AI 系统的数据层**,将文档网站、GitHub 仓库和 PDF 文件转换为适用于所有 AI 目标的结构化知识资产:
|
||
|
||
| 使用场景 | 获得的内容 | 示例 |
|
||
|---------|-----------|------|
|
||
| **AI 技能** | 完整的 SKILL.md + 参考文件 | Claude Code、Gemini、GPT |
|
||
| **RAG 流水线** | 带丰富元数据的分块文档 | LangChain、LlamaIndex、Haystack |
|
||
| **向量数据库** | 预格式化的待上传数据 | Pinecone、Chroma、Weaviate、FAISS |
|
||
| **AI 编程助手** | IDE AI 自动读取的上下文文件 | Cursor、Windsurf、Cline、Continue.dev |
|
||
|
||
Skill Seekers 通过以下步骤代替数天的手动预处理工作:
|
||
|
||
1. **采集** — 文档、GitHub 仓库、本地代码库、PDF
|
||
2. **分析** — 深度 AST 解析、模式检测、API 提取
|
||
3. **结构化** — 带元数据的分类参考文件
|
||
4. **增强** — AI 驱动的 SKILL.md 生成(Claude、Gemini 或本地)
|
||
5. **导出** — 从一个资产导出到 16 种平台专用格式
|
||
|
||
## 为什么使用 Skill Seekers?
|
||
|
||
### 面向 AI 技能构建者(Claude、Gemini、OpenAI)
|
||
|
||
- 🎯 **生产级技能** — 500+ 行的 SKILL.md 文件,包含代码示例、模式和指南
|
||
- 🔄 **增强工作流** — 应用 `security-focus`、`architecture-comprehensive` 或自定义 YAML 预设
|
||
- 🎮 **任意领域** — 游戏引擎(Godot、Unity)、框架(React、Django)、内部工具
|
||
- 🔧 **团队协作** — 将内部文档 + 代码整合为单一事实来源
|
||
- 📚 **高质量** — AI 增强,包含示例、快速参考和导航指南
|
||
|
||
### 面向 RAG 构建者和 AI 工程师
|
||
|
||
- 🤖 **RAG 就绪数据** — 预分块的 LangChain `Documents`、LlamaIndex `TextNodes`、Haystack `Documents`
|
||
- 🚀 **快 99%** — 数天的预处理 → 15–45 分钟
|
||
- 📊 **智能元数据** — 类别、来源、类型 → 更高的检索精度
|
||
- 🔄 **多源支持** — 在一个流水线中合并文档 + GitHub + PDF
|
||
- 🌐 **平台无关** — 无需重新抓取即可导出到任意向量数据库或框架
|
||
|
||
### 面向 AI 编程助手用户
|
||
|
||
- 💻 **Cursor / Windsurf / Cline** — 自动生成 `.cursorrules` / `.windsurfrules` / `.clinerules`
|
||
- 🎯 **持久上下文** — AI "了解"您的框架,无需重复提示
|
||
- 📚 **始终最新** — 文档更新时可在几分钟内更新上下文
|
||
|
||
## 核心功能
|
||
|
||
### 🌐 文档抓取
|
||
- ✅ **llms.txt 支持** - 自动检测并使用 LLM 就绪文档文件(快 10 倍)
|
||
- ✅ **通用抓取器** - 适用于任意文档网站
|
||
- ✅ **智能分类** - 按主题自动组织内容
|
||
- ✅ **代码语言检测** - 识别 Python、JavaScript、C++、GDScript 等
|
||
- ✅ **24+ 即用预设** - Godot、React、Vue、Django、FastAPI 等
|
||
|
||
### 📄 PDF 支持
|
||
- ✅ **基础 PDF 提取** - 从 PDF 提取文本、代码和图片
|
||
- ✅ **扫描件 OCR** - 从扫描文档提取文本
|
||
- ✅ **密码保护 PDF** - 处理加密 PDF
|
||
- ✅ **表格提取** - 提取复杂表格
|
||
- ✅ **并行处理** - 大型 PDF 快 3 倍
|
||
- ✅ **智能缓存** - 重复运行快 50%
|
||
|
||
### 🐙 GitHub 仓库分析
|
||
- ✅ **深度代码分析** - 支持 Python、JavaScript、TypeScript、Java、C++、Go 的 AST 解析
|
||
- ✅ **API 提取** - 函数、类、方法及参数和类型
|
||
- ✅ **仓库元数据** - README、文件树、语言统计、星标/分支数
|
||
- ✅ **GitHub Issues 和 PR** - 获取带标签和里程碑的开放/已关闭 issues
|
||
- ✅ **CHANGELOG 和发布** - 自动提取版本历史
|
||
- ✅ **冲突检测** - 对比文档化 API 与实际代码实现
|
||
- ✅ **MCP 集成** - 自然语言:"抓取 GitHub 仓库 facebook/react"
|
||
|
||
### 🔄 统一多源抓取
|
||
- ✅ **合并多个来源** - 在一个技能中混合文档 + GitHub + PDF
|
||
- ✅ **冲突检测** - 自动发现文档与代码之间的差异
|
||
- ✅ **智能合并** - 基于规则或 AI 驱动的冲突解决
|
||
- ✅ **透明报告** - 带 ⚠️ 警告的并排对比
|
||
- ✅ **文档差距分析** - 识别过时文档和未文档化功能
|
||
- ✅ **单一事实来源** - 一个技能同时展示意图(文档)和现实(代码)
|
||
- ✅ **向后兼容** - 遗留单源配置继续有效
|
||
|
||
### 🤖 多 LLM 平台支持
|
||
- ✅ **4 个 LLM 平台** - Claude AI、Google Gemini、OpenAI ChatGPT、通用 Markdown
|
||
- ✅ **通用抓取** - 相同文档适用于所有平台
|
||
- ✅ **平台专用打包** - 针对每个 LLM 的优化格式
|
||
- ✅ **一键导出** - `--target` 标志选择平台
|
||
- ✅ **可选依赖** - 仅安装所需内容
|
||
- ✅ **100% 向后兼容** - 现有 Claude 工作流无需更改
|
||
|
||
| 平台 | 格式 | 上传 | 增强 | API Key | 自定义端点 |
|
||
|------|------|------|------|---------|-----------|
|
||
| **Claude AI** | ZIP + YAML | ✅ 自动 | ✅ 是 | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
|
||
| **Google Gemini** | tar.gz | ✅ 自动 | ✅ 是 | GOOGLE_API_KEY | - |
|
||
| **OpenAI ChatGPT** | ZIP + Vector Store | ✅ 自动 | ✅ 是 | OPENAI_API_KEY | - |
|
||
| **通用 Markdown** | ZIP | ❌ 手动 | ❌ 否 | - | - |
|
||
|
||
```bash
|
||
# Claude(默认 - 无需更改!)
|
||
skill-seekers package output/react/
|
||
skill-seekers upload react.zip
|
||
|
||
# Google Gemini
|
||
pip install skill-seekers[gemini]
|
||
skill-seekers package output/react/ --target gemini
|
||
skill-seekers upload react-gemini.tar.gz --target gemini
|
||
|
||
# OpenAI ChatGPT
|
||
pip install skill-seekers[openai]
|
||
skill-seekers package output/react/ --target openai
|
||
skill-seekers upload react-openai.zip --target openai
|
||
|
||
# 通用 Markdown(通用导出)
|
||
skill-seekers package output/react/ --target markdown
|
||
```
|
||
|
||
<details>
|
||
<summary>🔧 <strong>Claude 兼容 API 的环境变量(如 GLM-4.7)</strong></summary>
|
||
|
||
Skill Seekers 支持任意 Claude 兼容的 API 端点:
|
||
|
||
```bash
|
||
# 选项 1:官方 Anthropic API(默认)
|
||
export ANTHROPIC_API_KEY=sk-ant-...
|
||
|
||
# 选项 2:GLM-4.7 Claude 兼容 API
|
||
export ANTHROPIC_API_KEY=your-glm-47-api-key
|
||
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1
|
||
|
||
# 所有 AI 增强功能将使用配置的端点
|
||
skill-seekers enhance output/react/
|
||
skill-seekers analyze --directory . --enhance
|
||
```
|
||
|
||
**注意**:设置 `ANTHROPIC_BASE_URL` 允许您使用任意 Claude 兼容的 API 端点,例如 GLM-4.7(智谱 AI)或其他兼容服务。
|
||
|
||
</details>
|
||
|
||
**安装:**
|
||
```bash
|
||
# 安装 Gemini 支持
|
||
pip install skill-seekers[gemini]
|
||
|
||
# 安装 OpenAI 支持
|
||
pip install skill-seekers[openai]
|
||
|
||
# 安装所有 LLM 平台
|
||
pip install skill-seekers[all-llms]
|
||
```
|
||
|
||
### 🔗 RAG 框架集成
|
||
|
||
- ✅ **LangChain Documents** - 直接导出为 `Document` 格式,包含 `page_content` + 元数据
|
||
- 适用于:QA 链、检索器、向量存储、智能体
|
||
- 示例:[LangChain RAG 流水线](examples/langchain-rag-pipeline/)
|
||
- 指南:[LangChain 集成](docs/integrations/LANGCHAIN.md)
|
||
|
||
- ✅ **LlamaIndex TextNodes** - 导出为带唯一 ID + 嵌入的 `TextNode` 格式
|
||
- 适用于:查询引擎、对话引擎、存储上下文
|
||
- 示例:[LlamaIndex 查询引擎](examples/llama-index-query-engine/)
|
||
- 指南:[LlamaIndex 集成](docs/integrations/LLAMA_INDEX.md)
|
||
|
||
- ✅ **Pinecone 就绪格式** - 针对向量数据库上传进行优化
|
||
- 适用于:生产级向量搜索、语义搜索、混合搜索
|
||
- 示例:[Pinecone 上传](examples/pinecone-upsert/)
|
||
- 指南:[Pinecone 集成](docs/integrations/PINECONE.md)
|
||
|
||
**快速导出:**
|
||
```bash
|
||
# LangChain Documents(JSON)
|
||
skill-seekers package output/django --target langchain
|
||
# → output/django-langchain.json
|
||
|
||
# LlamaIndex TextNodes(JSON)
|
||
skill-seekers package output/django --target llama-index
|
||
# → output/django-llama-index.json
|
||
|
||
# Markdown(通用)
|
||
skill-seekers package output/django --target markdown
|
||
# → output/django-markdown/SKILL.md + references/
|
||
```
|
||
|
||
**完整 RAG 流水线指南:** [RAG 流水线文档](docs/integrations/RAG_PIPELINES.md)
|
||
|
||
---
|
||
|
||
### 🧠 AI 编程助手集成
|
||
|
||
将任意框架文档转换为 4+ 种 AI 助手的专家编程上下文:
|
||
|
||
- ✅ **Cursor IDE** - 为 AI 驱动的代码建议生成 `.cursorrules`
|
||
- 适用于:框架专用代码生成、一致的编码模式
|
||
- 指南:[Cursor 集成](docs/integrations/CURSOR.md)
|
||
- 示例:[Cursor React 技能](examples/cursor-react-skill/)
|
||
|
||
- ✅ **Windsurf** - 使用 `.windsurfrules` 自定义 Windsurf AI 助手上下文
|
||
- 适用于:IDE 原生 AI 辅助、流式编程
|
||
- 指南:[Windsurf 集成](docs/integrations/WINDSURF.md)
|
||
- 示例:[Windsurf FastAPI 上下文](examples/windsurf-fastapi-context/)
|
||
|
||
- ✅ **Cline(VS Code)** - VS Code 智能体的系统提示 + MCP
|
||
- 适用于:VS Code 中的智能代码生成
|
||
- 指南:[Cline 集成](docs/integrations/CLINE.md)
|
||
- 示例:[Cline Django 助手](examples/cline-django-assistant/)
|
||
|
||
- ✅ **Continue.dev** - 与 IDE 无关的 AI 上下文服务器
|
||
- 适用于:多 IDE 环境(VS Code、JetBrains、Vim),自定义 LLM 提供商
|
||
- 指南:[Continue 集成](docs/integrations/CONTINUE_DEV.md)
|
||
- 示例:[Continue 通用上下文](examples/continue-dev-universal/)
|
||
|
||
**快速导出(适用于 AI 编程工具):**
|
||
```bash
|
||
# 适用于任意 AI 编程助手(Cursor、Windsurf、Cline、Continue.dev)
|
||
skill-seekers scrape --config configs/django.json
|
||
skill-seekers package output/django --target claude
|
||
|
||
# 复制到项目(以 Cursor 为例)
|
||
cp output/django-claude/SKILL.md my-project/.cursorrules
|
||
|
||
# 或用于 Windsurf
|
||
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md
|
||
|
||
# 或用于 Cline
|
||
cp output/django-claude/SKILL.md my-project/.clinerules
|
||
```
|
||
|
||
**集成中心:** [所有 AI 系统集成](docs/integrations/INTEGRATIONS.md)
|
||
|
||
---
|
||
|
||
### 🌊 三流 GitHub 架构
|
||
- ✅ **三流分析** - 将 GitHub 仓库拆分为代码流、文档流和洞察流
|
||
- ✅ **统一代码库分析器** - 同时适用于 GitHub URL 和本地路径
|
||
- ✅ **C3.x 分析深度** - 选择"basic"(1–2 分钟)或"c3x"(20–60 分钟)分析
|
||
- ✅ **增强路由生成** - GitHub 元数据、README 快速入门、常见问题
|
||
- ✅ **Issue 集成** - 来自 GitHub Issues 的常见问题和解决方案
|
||
- ✅ **智能路由关键词** - GitHub 标签权重加倍,提升主题检测效果
|
||
|
||
**三流说明:**
|
||
- **流 1:代码** - 深度 C3.x 分析(模式、示例、指南、配置、架构)
|
||
- **流 2:文档** - 仓库文档(README、CONTRIBUTING、docs/*.md)
|
||
- **流 3:洞察** - 社区知识(Issues、标签、Stars、Forks)
|
||
|
||
```python
|
||
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer
|
||
|
||
# 使用三流分析 GitHub 仓库
|
||
analyzer = UnifiedCodebaseAnalyzer()
|
||
result = analyzer.analyze(
|
||
source="https://github.com/facebook/react",
|
||
depth="c3x", # 或 "basic" 快速分析
|
||
fetch_github_metadata=True
|
||
)
|
||
|
||
print(f"设计模式: {len(result.code_analysis['c3_1_patterns'])}")
|
||
print(f"Stars: {result.github_insights['metadata']['stars']}")
|
||
```
|
||
|
||
**完整文档**:[三流实现总结](docs/IMPLEMENTATION_SUMMARY_THREE_STREAM.md)
|
||
|
||
### 🔐 智能速率限制管理与配置
|
||
- ✅ **多 Token 配置系统** - 管理多个 GitHub 账号(个人、工作、开源)
|
||
- 安全配置存储在 `~/.config/skill-seekers/config.json`(权限 600)
|
||
- 每个配置文件的速率限制策略:`prompt`、`wait`、`switch`、`fail`
|
||
- 智能回退链:CLI 参数 → 环境变量 → 配置文件 → 提示
|
||
- ✅ **交互式配置向导** - 美观的终端 UI,轻松设置
|
||
- ✅ **智能速率限制处理器** - 不再无限等待!
|
||
- 实时倒计时,自动切换配置文件
|
||
- 四种策略:prompt(询问)、wait(倒计时)、switch(切换)、fail(中止)
|
||
- ✅ **断点续传** - 继续中断的任务
|
||
- ✅ **CI/CD 支持** - `--non-interactive` 标志用于自动化
|
||
|
||
**快速设置:**
|
||
```bash
|
||
# 一次性配置(5 分钟)
|
||
skill-seekers config --github
|
||
|
||
# 为私有仓库使用特定配置文件
|
||
skill-seekers github --repo mycompany/private-repo --profile work
|
||
|
||
# CI/CD 模式(快速失败,无提示)
|
||
skill-seekers github --repo owner/repo --non-interactive
|
||
```
|
||
|
||
### 🎯 Bootstrap 技能 - 自托管
|
||
|
||
将 skill-seekers 自身作为 Claude Code 技能生成:
|
||
|
||
```bash
|
||
./scripts/bootstrap_skill.sh
|
||
cp -r output/skill-seekers ~/.claude/skills/
|
||
```
|
||
|
||
### 🔐 私有配置仓库
|
||
- ✅ **基于 Git 的配置源** - 从私有/团队 Git 仓库获取配置
|
||
- ✅ **多源管理** - 注册无限数量的 GitHub、GitLab、Bitbucket 仓库
|
||
- ✅ **团队协作** - 在 3–5 人团队间共享自定义配置
|
||
- ✅ **企业支持** - 扩展到 500+ 开发者
|
||
- ✅ **安全认证** - 环境变量 token(GITHUB_TOKEN、GITLAB_TOKEN)
|
||
|
||
### 🤖 代码库分析(C3.x)
|
||
|
||
**C3.4:配置模式提取(含 AI 增强)**
|
||
- ✅ **9 种配置格式** - JSON、YAML、TOML、ENV、INI、Python、JavaScript、Dockerfile、Docker Compose
|
||
- ✅ **7 种模式类型** - 数据库、API、日志、缓存、邮件、认证、服务器配置
|
||
- ✅ **AI 增强** - 可选双模式 AI 分析(API + LOCAL)
|
||
- ✅ **安全分析** - 发现硬编码的密钥和暴露的凭证
|
||
|
||
**C3.3:AI 增强操作指南**
|
||
- ✅ **全面 AI 增强** - 将基础指南转换为专业教程
|
||
- ✅ **5 项自动改进** - 步骤说明、故障排除、前提条件、后续步骤、使用场景
|
||
- ✅ **双模式支持** - API 模式(Claude API)或 LOCAL 模式(Claude Code CLI)
|
||
- ✅ **LOCAL 模式零成本** - 使用您的 Claude Code Max 计划免费增强
|
||
|
||
**使用方法:**
|
||
```bash
|
||
# 快速分析(1–2 分钟,仅基础功能)
|
||
skill-seekers analyze --directory tests/ --quick
|
||
|
||
# 全面分析(含 AI,20–60 分钟)
|
||
skill-seekers analyze --directory tests/ --comprehensive
|
||
|
||
# 含 AI 增强
|
||
skill-seekers analyze --directory tests/ --enhance
|
||
```
|
||
|
||
**完整文档:** [docs/HOW_TO_GUIDES.md](docs/HOW_TO_GUIDES.md#ai-enhancement-new)
|
||
|
||
### 🔄 增强工作流预设
|
||
|
||
可重用的 YAML 定义增强流水线,控制 AI 如何将原始文档转换为精心打磨的技能。
|
||
|
||
- ✅ **5 个内置预设** — `default`、`minimal`、`security-focus`、`architecture-comprehensive`、`api-documentation`
|
||
- ✅ **用户自定义预设** — 将自定义工作流添加到 `~/.config/skill-seekers/workflows/`
|
||
- ✅ **多工作流链式** — 在一条命令中链式使用两个或更多工作流
|
||
- ✅ **完整 CLI 管理** — 列出、查看、复制、添加、删除和验证工作流
|
||
|
||
```bash
|
||
# 应用单个工作流
|
||
skill-seekers create ./my-project --enhance-workflow security-focus
|
||
|
||
# 链式多个工作流(按顺序应用)
|
||
skill-seekers create ./my-project \
|
||
--enhance-workflow security-focus \
|
||
--enhance-workflow minimal
|
||
|
||
# 管理预设
|
||
skill-seekers workflows list # 列出所有(内置 + 用户)
|
||
skill-seekers workflows show security-focus # 显示 YAML 内容
|
||
skill-seekers workflows copy security-focus # 复制到用户目录以便编辑
|
||
skill-seekers workflows add ./my-workflow.yaml # 安装自定义预设
|
||
skill-seekers workflows remove my-workflow # 删除用户预设
|
||
skill-seekers workflows validate security-focus # 验证预设结构
|
||
|
||
# 同时复制多个
|
||
skill-seekers workflows copy security-focus minimal api-documentation
|
||
|
||
# 同时添加多个文件
|
||
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml
|
||
|
||
# 同时删除多个
|
||
skill-seekers workflows remove my-wf-a my-wf-b
|
||
```
|
||
|
||
**YAML 预设格式:**
|
||
```yaml
|
||
name: security-focus
|
||
description: "安全重点审查:漏洞、认证、数据处理"
|
||
version: "1.0"
|
||
stages:
|
||
- name: vulnerabilities
|
||
type: custom
|
||
prompt: "审查 OWASP Top 10 和常见安全漏洞..."
|
||
- name: auth-review
|
||
type: custom
|
||
prompt: "检查认证和授权模式..."
|
||
uses_history: true
|
||
```
|
||
|
||
### ⚡ 性能与规模
|
||
- ✅ **异步模式** - 使用 async/await 抓取速度快 2–3 倍(使用 `--async` 标志)
|
||
- ✅ **大型文档支持** - 通过智能拆分处理 10K–40K+ 页文档
|
||
- ✅ **路由器/Hub 技能** - 智能路由到专用子技能
|
||
- ✅ **并行抓取** - 同时处理多个技能
|
||
- ✅ **检查点/续传** - 长时间抓取永不丢失进度
|
||
- ✅ **缓存系统** - 抓取一次,即时重建
|
||
|
||
### ✅ 质量保证
|
||
- ✅ **全面测试** - 1,880+ 测试,全面覆盖
|
||
|
||
---
|
||
|
||
## 📦 安装
|
||
|
||
```bash
|
||
# 基础安装(文档抓取、GitHub 分析、PDF、打包)
|
||
pip install skill-seekers
|
||
|
||
# 包含所有 LLM 平台支持
|
||
pip install skill-seekers[all-llms]
|
||
|
||
# 包含 MCP 服务器
|
||
pip install skill-seekers[mcp]
|
||
|
||
# 全部功能
|
||
pip install skill-seekers[all]
|
||
```
|
||
|
||
**需要帮助选择?** 运行设置向导:
|
||
```bash
|
||
skill-seekers-setup
|
||
```
|
||
|
||
### 安装选项
|
||
|
||
| 安装命令 | 功能 |
|
||
|---------|------|
|
||
| `pip install skill-seekers` | 抓取、GitHub 分析、PDF、所有平台 |
|
||
| `pip install skill-seekers[gemini]` | + Google Gemini 支持 |
|
||
| `pip install skill-seekers[openai]` | + OpenAI ChatGPT 支持 |
|
||
| `pip install skill-seekers[all-llms]` | + 所有 LLM 平台 |
|
||
| `pip install skill-seekers[mcp]` | + MCP 服务器 |
|
||
| `pip install skill-seekers[all]` | 全部功能 |
|
||
|
||
---
|
||
|
||
## 🚀 一键安装工作流
|
||
|
||
**从配置到上传技能的最快方式——全自动化:**
|
||
|
||
```bash
|
||
# 从官方配置安装 React 技能(自动上传到 Claude)
|
||
skill-seekers install --config react
|
||
|
||
# 从本地配置文件安装
|
||
skill-seekers install --config configs/custom.json
|
||
|
||
# 安装但不上传(仅打包)
|
||
skill-seekers install --config django --no-upload
|
||
|
||
# 预览工作流而不执行
|
||
skill-seekers install --config react --dry-run
|
||
```
|
||
|
||
**执行阶段:**
|
||
```
|
||
📥 阶段 1:获取配置(如果提供配置名称)
|
||
📖 阶段 2:抓取文档
|
||
✨ 阶段 3:AI 增强
|
||
📦 阶段 4:打包技能
|
||
☁️ 阶段 5:上传到 Claude(可选,需要 API Key)
|
||
```
|
||
|
||
---
|
||
|
||
## 📊 功能矩阵
|
||
|
||
Skill Seekers 支持 **4 个 LLM 平台**和 **5 种技能模式**,功能完全对等。
|
||
|
||
**平台:** Claude AI、Google Gemini、OpenAI ChatGPT、通用 Markdown
|
||
**技能模式:** 文档、GitHub、PDF、统一多源、本地仓库
|
||
|
||
完整信息请查看 [完整功能矩阵](docs/FEATURE_MATRIX.md)。
|
||
|
||
### 快速平台对比
|
||
|
||
| 功能 | Claude | Gemini | OpenAI | Markdown |
|
||
|------|--------|--------|--------|----------|
|
||
| 格式 | ZIP + YAML | tar.gz | ZIP + Vector | ZIP |
|
||
| 上传 | ✅ API | ✅ API | ✅ API | ❌ 手动 |
|
||
| 增强 | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ❌ 无 |
|
||
| 所有技能模式 | ✅ | ✅ | ✅ | ✅ |
|
||
|
||
---
|
||
|
||
## 使用示例
|
||
|
||
### 文档抓取
|
||
|
||
```bash
|
||
# 抓取文档网站
|
||
skill-seekers scrape --config configs/react.json
|
||
|
||
# 快速抓取(无需配置)
|
||
skill-seekers scrape --url https://react.dev --name react
|
||
|
||
# 异步模式(快 3 倍)
|
||
skill-seekers scrape --config configs/godot.json --async --workers 8
|
||
```
|
||
|
||
### PDF 提取
|
||
|
||
```bash
|
||
# 基础 PDF 提取
|
||
skill-seekers pdf --pdf docs/manual.pdf --name myskill
|
||
|
||
# 高级功能
|
||
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
|
||
--extract-tables \ # 提取表格
|
||
--parallel \ # 快速并行处理
|
||
--workers 8 # 使用 8 个 CPU 核心
|
||
|
||
# 扫描 PDF(需要: pip install pytesseract Pillow)
|
||
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr
|
||
```
|
||
|
||
### GitHub 仓库分析
|
||
|
||
```bash
|
||
# 基础仓库抓取
|
||
skill-seekers github --repo facebook/react
|
||
|
||
# 配置认证(更高速率限制)
|
||
export GITHUB_TOKEN=ghp_your_token_here
|
||
skill-seekers github --repo facebook/react
|
||
|
||
# 自定义包含内容
|
||
skill-seekers github --repo django/django \
|
||
--include-issues \ # 提取 GitHub Issues
|
||
--max-issues 100 \ # 限制 issue 数量
|
||
--include-changelog # 提取 CHANGELOG.md
|
||
```
|
||
|
||
### 统一多源抓取
|
||
|
||
**将文档 + GitHub + PDF 合并为一个带冲突检测的统一技能:**
|
||
|
||
```bash
|
||
# 使用现有统一配置
|
||
skill-seekers unified --config configs/react_unified.json
|
||
|
||
# 或创建统一配置
|
||
cat > configs/myframework_unified.json << 'EOF'
|
||
{
|
||
"name": "myframework",
|
||
"merge_mode": "rule-based",
|
||
"sources": [
|
||
{
|
||
"type": "documentation",
|
||
"base_url": "https://docs.myframework.com/",
|
||
"max_pages": 200
|
||
},
|
||
{
|
||
"type": "github",
|
||
"repo": "owner/myframework",
|
||
"code_analysis_depth": "surface"
|
||
}
|
||
]
|
||
}
|
||
EOF
|
||
|
||
skill-seekers unified --config configs/myframework_unified.json
|
||
```
|
||
|
||
**冲突检测自动发现:**
|
||
- 🔴 **代码中缺失**(高):已文档化但未实现
|
||
- 🟡 **文档中缺失**(中):已实现但未文档化
|
||
- ⚠️ **签名不匹配**:参数/类型不同
|
||
- ℹ️ **描述不匹配**:解释不同
|
||
|
||
**完整指南:** 参见 [docs/UNIFIED_SCRAPING.md](docs/UNIFIED_SCRAPING.md)。
|
||
|
||
### 私有配置仓库
|
||
|
||
**使用私有 Git 仓库在团队间共享自定义配置:**
|
||
|
||
```bash
|
||
# 使用 MCP 工具注册团队私有仓库
|
||
add_config_source(
|
||
name="team",
|
||
git_url="https://github.com/mycompany/skill-configs.git",
|
||
token_env="GITHUB_TOKEN"
|
||
)
|
||
|
||
# 从团队仓库获取配置
|
||
fetch_config(source="team", config_name="internal-api")
|
||
```
|
||
|
||
**支持的平台:**
|
||
- GitHub(`GITHUB_TOKEN`)、GitLab(`GITLAB_TOKEN`)、Gitea(`GITEA_TOKEN`)、Bitbucket(`BITBUCKET_TOKEN`)
|
||
|
||
**完整指南:** 参见 [docs/GIT_CONFIG_SOURCES.md](docs/GIT_CONFIG_SOURCES.md)。
|
||
|
||
## 工作原理
|
||
|
||
```mermaid
|
||
graph LR
|
||
A[文档网站] --> B[Skill Seekers]
|
||
B --> C[抓取器]
|
||
B --> D[AI 增强]
|
||
B --> E[打包器]
|
||
C --> F[有序参考文件]
|
||
D --> F
|
||
F --> E
|
||
E --> G[Claude 技能 .zip]
|
||
G --> H[上传到 Claude AI]
|
||
```
|
||
|
||
0. **检测 llms.txt** - 优先检查 llms-full.txt、llms.txt、llms-small.txt
|
||
1. **抓取**:提取文档中的所有页面
|
||
2. **分类**:将内容组织为主题(API、指南、教程等)
|
||
3. **增强**:AI 分析文档并创建包含示例的完整 SKILL.md
|
||
4. **打包**:将所有内容打包为 Claude 就绪的 `.zip` 文件
|
||
|
||
## 📋 前提条件
|
||
|
||
**开始前,请确保您具备:**
|
||
|
||
1. **Python 3.10 或更高版本** - [下载](https://www.python.org/downloads/) | 检查:`python3 --version`
|
||
2. **Git** - [下载](https://git-scm.com/) | 检查:`git --version`
|
||
3. **15–30 分钟**用于首次设置
|
||
|
||
**首次使用?** → **[从这里开始:防弹快速入门指南](BULLETPROOF_QUICKSTART.md)** 🎯
|
||
|
||
---
|
||
|
||
## 📤 上传技能到 Claude
|
||
|
||
技能打包完成后,需要将其上传到 Claude:
|
||
|
||
### 选项 1:自动上传(基于 API)
|
||
|
||
```bash
|
||
# 设置 API Key(一次性)
|
||
export ANTHROPIC_API_KEY=sk-ant-...
|
||
|
||
# 打包并自动上传
|
||
skill-seekers package output/react/ --upload
|
||
|
||
# 或上传已有的 .zip
|
||
skill-seekers upload output/react.zip
|
||
```
|
||
|
||
### 选项 2:手动上传(无需 API Key)
|
||
|
||
```bash
|
||
# 打包技能
|
||
skill-seekers package output/react/
|
||
# → 创建 output/react.zip
|
||
|
||
# 然后手动上传:
|
||
# - 访问 https://claude.ai/skills
|
||
# - 点击"上传技能"
|
||
# - 选择 output/react.zip
|
||
```
|
||
|
||
### 选项 3:MCP(Claude Code)
|
||
|
||
```
|
||
在 Claude Code 中,直接询问:
|
||
"打包并上传 React 技能"
|
||
```
|
||
|
||
---
|
||
|
||
## 🤖 安装到 AI 代理
|
||
|
||
Skill Seekers 可自动将技能安装到 10+ 个 AI 编程代理。
|
||
|
||
```bash
|
||
# 安装到特定代理
|
||
skill-seekers install-agent output/react/ --agent cursor
|
||
|
||
# 一次性安装到所有代理
|
||
skill-seekers install-agent output/react/ --agent all
|
||
|
||
# 预览而不安装
|
||
skill-seekers install-agent output/react/ --agent cursor --dry-run
|
||
```
|
||
|
||
### 支持的代理
|
||
|
||
| 代理 | 路径 | 类型 |
|
||
|------|------|------|
|
||
| **Claude Code** | `~/.claude/skills/` | 全局 |
|
||
| **Cursor** | `.cursor/skills/` | 项目 |
|
||
| **VS Code / Copilot** | `.github/skills/` | 项目 |
|
||
| **Amp** | `~/.amp/skills/` | 全局 |
|
||
| **Goose** | `~/.config/goose/skills/` | 全局 |
|
||
| **OpenCode** | `~/.opencode/skills/` | 全局 |
|
||
| **Windsurf** | `~/.windsurf/skills/` | 全局 |
|
||
|
||
---
|
||
|
||
## 🔌 MCP 集成(26 个工具)
|
||
|
||
Skill Seekers 提供 MCP 服务器,可在 Claude Code、Cursor、Windsurf、VS Code + Cline 或 IntelliJ IDEA 中使用。
|
||
|
||
```bash
|
||
# stdio 模式(Claude Code、VS Code + Cline)
|
||
python -m skill_seekers.mcp.server_fastmcp
|
||
|
||
# HTTP 模式(Cursor、Windsurf、IntelliJ)
|
||
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
|
||
|
||
# 一次性自动配置所有代理
|
||
./setup_mcp.sh
|
||
```
|
||
|
||
**所有 26 个工具:**
|
||
- **核心(9 个):** `list_configs`、`generate_config`、`validate_config`、`estimate_pages`、`scrape_docs`、`package_skill`、`upload_skill`、`enhance_skill`、`install_skill`
|
||
- **扩展(10 个):** `scrape_github`、`scrape_pdf`、`unified_scrape`、`merge_sources`、`detect_conflicts`、`add_config_source`、`fetch_config`、`list_config_sources`、`remove_config_source`、`split_config`
|
||
- **向量数据库(4 个):** `export_to_chroma`、`export_to_weaviate`、`export_to_faiss`、`export_to_qdrant`
|
||
- **云存储(3 个):** `cloud_upload`、`cloud_download`、`cloud_list`
|
||
|
||
**完整指南:** [docs/MCP_SETUP.md](docs/MCP_SETUP.md)
|
||
|
||
---
|
||
|
||
## ⚙️ 配置
|
||
|
||
### 可用预设(24+)
|
||
|
||
```bash
|
||
# 列出所有预设
|
||
skill-seekers list-configs
|
||
```
|
||
|
||
| 类别 | 预设 |
|
||
|------|------|
|
||
| **Web 框架** | `react`、`vue`、`angular`、`svelte`、`nextjs` |
|
||
| **Python** | `django`、`flask`、`fastapi`、`sqlalchemy`、`pytest` |
|
||
| **游戏开发** | `godot`、`pygame`、`unity` |
|
||
| **工具与 DevOps** | `docker`、`kubernetes`、`terraform`、`ansible` |
|
||
| **统一(文档 + GitHub)** | `react-unified`、`vue-unified`、`nextjs-unified` 等 |
|
||
|
||
### 创建您自己的配置
|
||
|
||
```bash
|
||
# 选项 1:交互式
|
||
skill-seekers scrape --interactive
|
||
|
||
# 选项 2:复制并编辑预设
|
||
cp configs/react.json configs/myframework.json
|
||
nano configs/myframework.json
|
||
skill-seekers scrape --config configs/myframework.json
|
||
```
|
||
|
||
### 配置文件结构
|
||
|
||
```json
|
||
{
|
||
"name": "myframework",
|
||
"description": "何时使用此技能",
|
||
"base_url": "https://docs.myframework.com/",
|
||
"selectors": {
|
||
"main_content": "article",
|
||
"title": "h1",
|
||
"code_blocks": "pre code"
|
||
},
|
||
"url_patterns": {
|
||
"include": ["/docs", "/guide"],
|
||
"exclude": ["/blog", "/about"]
|
||
},
|
||
"categories": {
|
||
"getting_started": ["intro", "quickstart"],
|
||
"api": ["api", "reference"]
|
||
},
|
||
"rate_limit": 0.5,
|
||
"max_pages": 500
|
||
}
|
||
```
|
||
|
||
### 配置存储位置
|
||
|
||
工具按以下顺序搜索:
|
||
1. 提供的确切路径
|
||
2. `./configs/`(当前目录)
|
||
3. `~/.config/skill-seekers/configs/`(用户配置目录)
|
||
4. SkillSeekersWeb.com API(预设配置)
|
||
|
||
---
|
||
|
||
## 📊 创建的内容
|
||
|
||
```
|
||
output/
|
||
├── godot_data/ # 抓取的原始数据
|
||
│ ├── pages/ # JSON 文件(每页一个)
|
||
│ └── summary.json # 概览
|
||
│
|
||
└── godot/ # 技能文件
|
||
├── SKILL.md # 含真实示例的增强版
|
||
├── references/ # 分类文档
|
||
│ ├── index.md
|
||
│ ├── getting_started.md
|
||
│ ├── scripting.md
|
||
│ └── ...
|
||
├── scripts/ # 空(可添加自己的脚本)
|
||
└── assets/ # 空(可添加自己的资源)
|
||
```
|
||
|
||
---
|
||
|
||
## 🐛 故障排除
|
||
|
||
### 未提取到内容?
|
||
- 检查您的 `main_content` 选择器
|
||
- 尝试:`article`、`main`、`div[role="main"]`
|
||
|
||
### 数据存在但不使用?
|
||
```bash
|
||
# 强制重新抓取
|
||
rm -rf output/myframework_data/
|
||
skill-seekers scrape --config configs/myframework.json
|
||
```
|
||
|
||
### 分类不理想?
|
||
编辑配置中的 `categories` 部分,使用更好的关键词。
|
||
|
||
### 想要更新文档?
|
||
```bash
|
||
# 删除旧数据并重新抓取
|
||
rm -rf output/godot_data/
|
||
skill-seekers scrape --config configs/godot.json
|
||
```
|
||
|
||
### 增强不工作?
|
||
```bash
|
||
# 检查 API Key 是否设置
|
||
echo $ANTHROPIC_API_KEY
|
||
|
||
# 尝试 LOCAL 模式(使用 Claude Code Max,无需 API Key)
|
||
skill-seekers enhance output/react/ --mode LOCAL
|
||
|
||
# 监控后台增强状态
|
||
skill-seekers enhance-status output/react/ --watch
|
||
```
|
||
|
||
### GitHub 速率限制问题?
|
||
```bash
|
||
# 设置 GitHub Token(5000 次/小时 vs 匿名 60 次/小时)
|
||
export GITHUB_TOKEN=ghp_your_token_here
|
||
|
||
# 或配置多个配置文件
|
||
skill-seekers config --github
|
||
```
|
||
|
||
---
|
||
|
||
## 📈 性能
|
||
|
||
| 任务 | 时间 | 备注 |
|
||
|------|------|------|
|
||
| 抓取(同步)| 15–45 分钟 | 仅首次,基于线程 |
|
||
| 抓取(异步)| 5–15 分钟 | `--async` 标志快 2–3 倍 |
|
||
| 构建 | 1–3 分钟 | 从缓存快速重建 |
|
||
| 重建 | <1 分钟 | 使用 `--skip-scrape` |
|
||
| 增强(LOCAL)| 30–60 秒 | 使用 Claude Code Max |
|
||
| 增强(API)| 20–40 秒 | 需要 API Key |
|
||
| 打包 | 5–10 秒 | 最终 .zip 创建 |
|
||
|
||
---
|
||
|
||
## 📚 文档
|
||
|
||
### 入门指南
|
||
- **[BULLETPROOF_QUICKSTART.md](BULLETPROOF_QUICKSTART.md)** - 🎯 **新用户从这里开始!**
|
||
- **[QUICKSTART.md](QUICKSTART.md)** - 有经验用户的快速入门
|
||
- **[TROUBLESHOOTING.md](TROUBLESHOOTING.md)** - 常见问题和解决方案
|
||
- **[docs/QUICK_REFERENCE.md](docs/QUICK_REFERENCE.md)** - 单页速查表
|
||
|
||
### 指南
|
||
- **[docs/LARGE_DOCUMENTATION.md](docs/LARGE_DOCUMENTATION.md)** - 处理 10K–40K+ 页文档
|
||
- **[ASYNC_SUPPORT.md](ASYNC_SUPPORT.md)** - 异步模式指南(快 2–3 倍)
|
||
- **[docs/ENHANCEMENT_MODES.md](docs/ENHANCEMENT_MODES.md)** - AI 增强模式指南
|
||
- **[docs/MCP_SETUP.md](docs/MCP_SETUP.md)** - MCP 集成设置
|
||
- **[docs/UNIFIED_SCRAPING.md](docs/UNIFIED_SCRAPING.md)** - 多源抓取
|
||
|
||
### 集成指南
|
||
- **[docs/integrations/LANGCHAIN.md](docs/integrations/LANGCHAIN.md)** - LangChain RAG
|
||
- **[docs/integrations/CURSOR.md](docs/integrations/CURSOR.md)** - Cursor IDE
|
||
- **[docs/integrations/WINDSURF.md](docs/integrations/WINDSURF.md)** - Windsurf IDE
|
||
- **[docs/integrations/CLINE.md](docs/integrations/CLINE.md)** - Cline(VS Code)
|
||
- **[docs/integrations/RAG_PIPELINES.md](docs/integrations/RAG_PIPELINES.md)** - 所有 RAG 流水线
|
||
|
||
---
|
||
|
||
## 📝 许可证
|
||
|
||
MIT 许可证 - 详见 [LICENSE](LICENSE) 文件
|
||
|
||
---
|
||
|
||
祝您构建技能愉快! 🚀
|