Add machine-translated README files for Japanese, Korean, Spanish,
French, German, Portuguese (BR), Turkish, Arabic, Hindi, and Russian.
Update language selector in English and Chinese READMEs to link all 12
versions.
New files: README.{ja,ko,es,fr,de,pt-BR,tr,ar,hi,ru}.md
Modified: README.md, README.zh-CN.md (language selector bar)
43 KiB
Skill Seekers
English | 简体中文 | 日本語 | 한국어 | Español | Français | Deutsch | Português | Türkçe | العربية | हिन्दी | Русский
⚠️ 기계 번역 안내
이 문서는 AI에 의해 자동 번역되었습니다. 번역 품질 향상을 위해 노력하고 있으나 부정확한 표현이 포함될 수 있습니다.
번역 개선에 도움을 주시려면 GitHub Issue #260에 참여해 주세요! 여러분의 피드백은 매우 소중합니다.
🧠 AI 시스템을 위한 데이터 레이어. Skill Seekers는 문서 사이트, GitHub 저장소, PDF, 동영상, Jupyter 노트북, 위키 등 17가지 이상의 소스 유형을 구조화된 지식 자산으로 변환합니다. 몇 분 만에 AI 스킬(Claude, Gemini, OpenAI), RAG 파이프라인(LangChain, LlamaIndex, Pinecone), AI 코딩 어시스턴트(Cursor, Windsurf, Cline)에 활용할 수 있습니다.
🌐 SkillSeekersWeb.com 방문하기 - 24개 이상의 프리셋 설정을 둘러보고, 설정을 공유하고, 전체 문서에 접근하세요!
📋 개발 로드맵 및 작업 보기 - 10개 카테고리에 걸친 134개 작업, 원하는 것을 선택하여 기여하세요!
🧠 AI 시스템을 위한 데이터 레이어
Skill Seekers는 범용 전처리 레이어로, 원시 문서와 이를 활용하는 모든 AI 시스템 사이에 위치합니다. Claude 스킬을 구축하든, LangChain RAG 파이프라인을 만들든, Cursor .cursorrules 파일을 작성하든 — 데이터 준비 작업은 동일합니다. 한 번만 수행하면 모든 대상 플랫폼으로 내보낼 수 있습니다.
# 한 줄 명령 → 구조화된 지식 자산
skill-seekers create https://docs.react.dev/
# 또는: skill-seekers create facebook/react
# 또는: skill-seekers create ./my-project
# 모든 AI 시스템으로 내보내기
skill-seekers package output/react --target claude # → Claude AI 스킬 (ZIP)
skill-seekers package output/react --target langchain # → LangChain Documents
skill-seekers package output/react --target llama-index # → LlamaIndex TextNodes
skill-seekers package output/react --target cursor # → .cursorrules
생성되는 출력물
| 출력 | 대상 | 활용 분야 |
|---|---|---|
| Claude 스킬 (ZIP + YAML) | --target claude |
Claude Code, Claude API |
| Gemini 스킬 (tar.gz) | --target gemini |
Google Gemini |
| OpenAI / Custom GPT (ZIP) | --target openai |
GPT-4o, 커스텀 어시스턴트 |
| LangChain Documents | --target langchain |
QA 체인, 에이전트, 리트리버 |
| LlamaIndex TextNodes | --target llama-index |
쿼리 엔진, 대화 엔진 |
| Haystack Documents | --target haystack |
엔터프라이즈 RAG 파이프라인 |
| Pinecone 준비 완료 (Markdown) | --target markdown |
벡터 업서트 |
| ChromaDB / FAISS / Qdrant | --format chroma/faiss/qdrant |
로컬 벡터 데이터베이스 |
Cursor .cursorrules |
--target claude → 복사 |
Cursor IDE AI 컨텍스트 |
| Windsurf / Cline / Continue | --target claude → 복사 |
VS Code, IntelliJ, Vim |
Skill Seekers를 선택해야 하는 이유
- ⚡ 99% 더 빠름 — 수일 간의 수동 데이터 준비 → 15–45분
- 🎯 AI 스킬 품질 — 예제, 패턴, 가이드를 포함한 500줄 이상의 SKILL.md 파일
- 📊 RAG 준비 완료 청킹 — 코드 블록을 보존하고 컨텍스트를 유지하는 스마트 청킹
- 🎬 동영상 — YouTube 및 로컬 동영상에서 코드, 자막, 구조화된 지식 추출
- 🔄 17가지 소스 유형 — 문서 + GitHub + PDF + 동영상 + 노트북 + 위키 등을 하나의 지식 자산으로 결합
- 🌐 한 번 준비, 모든 대상으로 내보내기 — 재스크래핑 없이 16개 플랫폼으로 내보내기
- ✅ 실전 검증 완료 — 2,540+ 테스트, 24+ 프레임워크 프리셋, 프로덕션 준비 완료
빠른 시작
pip install skill-seekers
# 모든 소스에서 AI 스킬 생성
skill-seekers create https://docs.django.com/ # 문서 사이트
skill-seekers create django/django # GitHub 저장소
skill-seekers create ./my-codebase # 로컬 프로젝트
skill-seekers create manual.pdf # PDF 파일
skill-seekers create manual.docx # Word 문서
skill-seekers create book.epub # EPUB 전자책
skill-seekers create notebook.ipynb # Jupyter 노트북
skill-seekers create page.html # 로컬 HTML
skill-seekers create api-spec.yaml # OpenAPI/Swagger 스펙
skill-seekers create guide.adoc # AsciiDoc 문서
skill-seekers create slides.pptx # PowerPoint 프레젠테이션
# 동영상 (YouTube, Vimeo 또는 로컬 파일 — skill-seekers[video] 필요)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial
# 처음 사용하시나요? GPU 인식 시각 종속성 자동 설치:
skill-seekers video --setup
# 용도별 내보내기
skill-seekers package output/django --target claude # Claude AI 스킬
skill-seekers package output/django --target langchain # LangChain RAG
skill-seekers package output/django --target cursor # Cursor IDE 컨텍스트
전체 예제:
- Claude AI 스킬 - Claude Code용 스킬
- LangChain RAG 파이프라인 - Chroma 기반 QA 체인
- Cursor IDE 컨텍스트 - 프레임워크 인식 AI 코딩
Skill Seekers란?
Skill Seekers는 AI 시스템을 위한 데이터 레이어로, 17가지 소스 유형 — 문서 사이트, GitHub 저장소, PDF, 동영상, Jupyter 노트북, Word/EPUB/AsciiDoc 문서, OpenAPI/Swagger 스펙, PowerPoint 프레젠테이션, RSS/Atom 피드, Man 페이지, Confluence 위키, Notion 페이지, Slack/Discord 내보내기 등 — 을 모든 AI 대상에 적합한 구조화된 지식 자산으로 변환합니다:
| 사용 사례 | 얻을 수 있는 것 | 예시 |
|---|---|---|
| AI 스킬 | 완전한 SKILL.md + 참조 파일 | Claude Code, Gemini, GPT |
| RAG 파이프라인 | 풍부한 메타데이터를 포함한 청크 문서 | LangChain, LlamaIndex, Haystack |
| 벡터 데이터베이스 | 업서트 준비 완료된 사전 포맷 데이터 | Pinecone, Chroma, Weaviate, FAISS |
| AI 코딩 어시스턴트 | IDE AI가 자동으로 읽는 컨텍스트 파일 | Cursor, Windsurf, Cline, Continue.dev |
Skill Seekers는 수일간의 수동 전처리 작업을 대체합니다:
- 수집 — 문서, GitHub 저장소, 로컬 코드베이스, PDF, 동영상, Jupyter 노트북, 위키 등 17가지 이상의 소스 유형
- 분석 — 심층 AST 파싱, 패턴 감지, API 추출
- 구조화 — 메타데이터가 포함된 분류된 참조 파일
- 강화 — AI 기반 SKILL.md 생성 (Claude, Gemini 또는 로컬)
- 내보내기 — 하나의 자산에서 16개 플랫폼 전용 형식으로 내보내기
왜 Skill Seekers를 사용해야 하나요?
AI 스킬 빌더를 위해 (Claude, Gemini, OpenAI)
- 🎯 프로덕션급 스킬 — 코드 예제, 패턴, 가이드를 포함한 500줄 이상의 SKILL.md 파일
- 🔄 강화 워크플로 —
security-focus,architecture-comprehensive또는 커스텀 YAML 프리셋 적용 - 🎮 모든 도메인 — 게임 엔진(Godot, Unity), 프레임워크(React, Django), 내부 도구
- 🔧 팀 협업 — 내부 문서 + 코드를 단일 진실 공급원으로 통합
- 📚 고품질 — 예제, 빠른 참조, 내비게이션 가이드를 포함한 AI 강화
RAG 빌더 및 AI 엔지니어를 위해
- 🤖 RAG 준비 완료 데이터 — 사전 청킹된 LangChain
Documents, LlamaIndexTextNodes, HaystackDocuments - 🚀 99% 더 빠름 — 수일간의 전처리 → 15–45분
- 📊 스마트 메타데이터 — 카테고리, 소스, 유형 → 더 높은 검색 정확도
- 🔄 다중 소스 — 하나의 파이프라인에서 문서 + GitHub + PDF 결합
- 🌐 플랫폼 독립적 — 재스크래핑 없이 모든 벡터 DB나 프레임워크로 내보내기
AI 코딩 어시스턴트 사용자를 위해
- 💻 Cursor / Windsurf / Cline —
.cursorrules/.windsurfrules/.clinerules자동 생성 - 🎯 영구적 컨텍스트 — 반복 프롬프팅 없이 AI가 프레임워크를 "이해"
- 📚 항상 최신 — 문서 변경 시 몇 분 만에 컨텍스트 업데이트
핵심 기능
🌐 문서 스크래핑
- ✅ llms.txt 지원 - LLM 준비 완료 문서 파일 자동 감지 및 사용 (10배 빠름)
- ✅ 범용 스크래퍼 - 모든 문서 사이트에서 작동
- ✅ 스마트 분류 - 주제별 자동 콘텐츠 정리
- ✅ 코드 언어 감지 - Python, JavaScript, C++, GDScript 등 인식
- ✅ 24+ 즉시 사용 가능 프리셋 - Godot, React, Vue, Django, FastAPI 등
📄 PDF 지원
- ✅ 기본 PDF 추출 - PDF에서 텍스트, 코드, 이미지 추출
- ✅ 스캔 PDF OCR - 스캔 문서에서 텍스트 추출
- ✅ 비밀번호 보호 PDF - 암호화된 PDF 처리
- ✅ 표 추출 - 복잡한 표 추출
- ✅ 병렬 처리 - 대용량 PDF 3배 빠른 처리
- ✅ 지능형 캐싱 - 재실행 시 50% 빠름
🎬 동영상 추출
- ✅ YouTube 및 로컬 동영상 - 동영상에서 자막, 코드, 구조화된 지식 추출
- ✅ 시각 프레임 분석 - 코드 편집기, 터미널, 슬라이드의 화면 OCR 추출
- ✅ GPU 자동 감지 - 올바른 PyTorch 빌드 자동 설치 (CUDA/ROCm/MPS/CPU)
- ✅ AI 강화 - 2단계: OCR 정리 + 완성도 높은 SKILL.md 생성
- ✅ 시간 클리핑 -
--start-time과--end-time으로 특정 구간 추출 - ✅ 재생 목록 지원 - YouTube 재생 목록의 모든 동영상 일괄 처리
🐙 GitHub 저장소 분석
- ✅ 심층 코드 분석 - Python, JavaScript, TypeScript, Java, C++, Go AST 파싱
- ✅ API 추출 - 함수, 클래스, 메서드의 매개변수 및 타입
- ✅ 저장소 메타데이터 - README, 파일 트리, 언어 통계, 스타/포크 수
- ✅ GitHub Issues 및 PR - 라벨과 마일스톤이 포함된 이슈 가져오기
- ✅ CHANGELOG 및 릴리스 - 버전 히스토리 자동 추출
- ✅ 충돌 감지 - 문서화된 API와 실제 코드 구현 비교
- ✅ MCP 통합 - 자연어: "GitHub 저장소 facebook/react 스크래핑"
🔄 통합 다중 소스 스크래핑
- ✅ 다중 소스 결합 - 하나의 스킬에서 문서 + GitHub + PDF 혼합
- ✅ 충돌 감지 - 문서와 코드 간의 불일치 자동 발견
- ✅ 지능형 병합 - 규칙 기반 또는 AI 기반 충돌 해결
- ✅ 투명한 보고 - ⚠️ 경고가 포함된 나란히 비교
- ✅ 문서 갭 분석 - 오래된 문서와 미문서화 기능 식별
- ✅ 단일 진실 공급원 - 의도(문서)와 현실(코드)을 동시에 보여주는 하나의 스킬
- ✅ 하위 호환 - 레거시 단일 소스 설정 계속 작동
🤖 다중 LLM 플랫폼 지원
- ✅ 4개 LLM 플랫폼 - Claude AI, Google Gemini, OpenAI ChatGPT, 범용 Markdown
- ✅ 범용 스크래핑 - 동일한 문서가 모든 플랫폼에 적용
- ✅ 플랫폼별 패키징 - 각 LLM에 최적화된 형식
- ✅ 원커맨드 내보내기 -
--target플래그로 플랫폼 선택 - ✅ 선택적 종속성 - 필요한 것만 설치
- ✅ 100% 하위 호환 - 기존 Claude 워크플로 변경 불필요
| 플랫폼 | 형식 | 업로드 | 강화 | API Key | 커스텀 엔드포인트 |
|---|---|---|---|---|---|
| Claude AI | ZIP + YAML | ✅ 자동 | ✅ 예 | ANTHROPIC_API_KEY | ANTHROPIC_BASE_URL |
| Google Gemini | tar.gz | ✅ 자동 | ✅ 예 | GOOGLE_API_KEY | - |
| OpenAI ChatGPT | ZIP + Vector Store | ✅ 자동 | ✅ 예 | OPENAI_API_KEY | - |
| 범용 Markdown | ZIP | ❌ 수동 | ❌ 아니오 | - | - |
# Claude (기본값 - 변경 불필요!)
skill-seekers package output/react/
skill-seekers upload react.zip
# Google Gemini
pip install skill-seekers[gemini]
skill-seekers package output/react/ --target gemini
skill-seekers upload react-gemini.tar.gz --target gemini
# OpenAI ChatGPT
pip install skill-seekers[openai]
skill-seekers package output/react/ --target openai
skill-seekers upload react-openai.zip --target openai
# 범용 Markdown (범용 내보내기)
skill-seekers package output/react/ --target markdown
🔧 Claude 호환 API 환경 변수 (예: GLM-4.7)
Skill Seekers는 모든 Claude 호환 API 엔드포인트를 지원합니다:
# 옵션 1: 공식 Anthropic API (기본값)
export ANTHROPIC_API_KEY=sk-ant-...
# 옵션 2: GLM-4.7 Claude 호환 API
export ANTHROPIC_API_KEY=your-glm-47-api-key
export ANTHROPIC_BASE_URL=https://glm-4-7-endpoint.com/v1
# 모든 AI 강화 기능이 설정된 엔드포인트를 사용합니다
skill-seekers enhance output/react/
skill-seekers analyze --directory . --enhance
참고: ANTHROPIC_BASE_URL을 설정하면 GLM-4.7(智谱 AI) 또는 기타 호환 서비스와 같은 모든 Claude 호환 API 엔드포인트를 사용할 수 있습니다.
설치:
# Gemini 지원 설치
pip install skill-seekers[gemini]
# OpenAI 지원 설치
pip install skill-seekers[openai]
# 모든 LLM 플랫폼 설치
pip install skill-seekers[all-llms]
🔗 RAG 프레임워크 통합
-
✅ LangChain Documents -
page_content+ 메타데이터가 포함된Document형식으로 직접 내보내기- 적합: QA 체인, 리트리버, 벡터 스토어, 에이전트
- 예제: LangChain RAG 파이프라인
- 가이드: LangChain 통합
-
✅ LlamaIndex TextNodes - 고유 ID + 임베딩이 포함된
TextNode형식으로 내보내기- 적합: 쿼리 엔진, 대화 엔진, 스토리지 컨텍스트
- 예제: LlamaIndex 쿼리 엔진
- 가이드: LlamaIndex 통합
-
✅ Pinecone 준비 완료 형식 - 벡터 데이터베이스 업서트에 최적화
- 적합: 프로덕션 벡터 검색, 시맨틱 검색, 하이브리드 검색
- 예제: Pinecone 업서트
- 가이드: Pinecone 통합
빠른 내보내기:
# LangChain Documents (JSON)
skill-seekers package output/django --target langchain
# → output/django-langchain.json
# LlamaIndex TextNodes (JSON)
skill-seekers package output/django --target llama-index
# → output/django-llama-index.json
# Markdown (범용)
skill-seekers package output/django --target markdown
# → output/django-markdown/SKILL.md + references/
전체 RAG 파이프라인 가이드: RAG 파이프라인 문서
🧠 AI 코딩 어시스턴트 통합
모든 프레임워크 문서를 4개 이상의 AI 어시스턴트를 위한 전문 코딩 컨텍스트로 변환합니다:
-
✅ Cursor IDE - AI 기반 코드 제안을 위한
.cursorrules생성- 적합: 프레임워크별 코드 생성, 일관된 코딩 패턴
- 가이드: Cursor 통합
- 예제: Cursor React 스킬
-
✅ Windsurf -
.windsurfrules로 Windsurf AI 어시스턴트 컨텍스트 커스터마이징- 적합: IDE 네이티브 AI 지원, 플로우 기반 코딩
- 가이드: Windsurf 통합
- 예제: Windsurf FastAPI 컨텍스트
-
✅ Cline (VS Code) - VS Code 에이전트를 위한 시스템 프롬프트 + MCP
- 적합: VS Code에서의 에이전틱 코드 생성
- 가이드: Cline 통합
- 예제: Cline Django 어시스턴트
-
✅ Continue.dev - IDE에 구애받지 않는 AI 컨텍스트 서버
- 적합: 멀티 IDE 환경(VS Code, JetBrains, Vim), 커스텀 LLM 제공자
- 가이드: Continue 통합
- 예제: Continue 범용 컨텍스트
AI 코딩 도구를 위한 빠른 내보내기:
# 모든 AI 코딩 어시스턴트에 적용 (Cursor, Windsurf, Cline, Continue.dev)
skill-seekers scrape --config configs/django.json
skill-seekers package output/django --target claude
# 프로젝트에 복사 (Cursor 예시)
cp output/django-claude/SKILL.md my-project/.cursorrules
# 또는 Windsurf용
cp output/django-claude/SKILL.md my-project/.windsurf/rules/django.md
# 또는 Cline용
cp output/django-claude/SKILL.md my-project/.clinerules
통합 허브: 모든 AI 시스템 통합
🌊 3-스트림 GitHub 아키텍처
- ✅ 3-스트림 분석 - GitHub 저장소를 코드, 문서, 인사이트 스트림으로 분할
- ✅ 통합 코드베이스 분석기 - GitHub URL과 로컬 경로 모두 지원
- ✅ C3.x 분석 깊이 - 'basic' (1–2분) 또는 'c3x' (20–60분) 분석 선택
- ✅ 향상된 라우터 생성 - GitHub 메타데이터, README 빠른 시작, 자주 발생하는 문제
- ✅ Issue 통합 - GitHub Issues의 주요 문제 및 해결책
- ✅ 스마트 라우팅 키워드 - GitHub 라벨 가중치 2배로 주제 감지 향상
3-스트림 설명:
- 스트림 1: 코드 - 심층 C3.x 분석 (패턴, 예제, 가이드, 설정, 아키텍처)
- 스트림 2: 문서 - 저장소 문서 (README, CONTRIBUTING, docs/*.md)
- 스트림 3: 인사이트 - 커뮤니티 지식 (Issues, 라벨, Stars, Forks)
from skill_seekers.cli.unified_codebase_analyzer import UnifiedCodebaseAnalyzer
# 3-스트림으로 GitHub 저장소 분석
analyzer = UnifiedCodebaseAnalyzer()
result = analyzer.analyze(
source="https://github.com/facebook/react",
depth="c3x", # 또는 "basic"으로 빠른 분석
fetch_github_metadata=True
)
print(f"디자인 패턴: {len(result.code_analysis['c3_1_patterns'])}")
print(f"Stars: {result.github_insights['metadata']['stars']}")
전체 문서: 3-스트림 구현 요약
🔐 스마트 속도 제한 관리 및 설정
- ✅ 다중 토큰 설정 시스템 - 여러 GitHub 계정 관리 (개인, 업무, 오픈소스)
~/.config/skill-seekers/config.json에 보안 설정 저장 (권한 600)- 프로필별 속도 제한 전략:
prompt,wait,switch,fail - 스마트 폴백 체인: CLI 인자 → 환경 변수 → 설정 파일 → 프롬프트
- ✅ 대화형 설정 마법사 - 아름다운 터미널 UI로 쉬운 설정
- ✅ 지능형 속도 제한 핸들러 - 더 이상 무한 대기 없음!
- 실시간 카운트다운, 자동 프로필 전환
- 4가지 전략: prompt (질문), wait (카운트다운), switch (전환), fail (중단)
- ✅ 중단점 재개 - 중단된 작업 계속하기
- ✅ CI/CD 지원 - 자동화를 위한
--non-interactive플래그
빠른 설정:
# 일회성 설정 (5분)
skill-seekers config --github
# 프라이빗 저장소에 특정 프로필 사용
skill-seekers github --repo mycompany/private-repo --profile work
# CI/CD 모드 (즉시 실패, 프롬프트 없음)
skill-seekers github --repo owner/repo --non-interactive
🎯 부트스트랩 스킬 - 셀프 호스팅
skill-seekers 자체를 Claude Code 스킬로 생성합니다:
./scripts/bootstrap_skill.sh
cp -r output/skill-seekers ~/.claude/skills/
🔐 프라이빗 설정 저장소
- ✅ Git 기반 설정 소스 - 프라이빗/팀 Git 저장소에서 설정 가져오기
- ✅ 다중 소스 관리 - 무제한 GitHub, GitLab, Bitbucket 저장소 등록
- ✅ 팀 협업 - 3–5인 팀 간 커스텀 설정 공유
- ✅ 엔터프라이즈 지원 - 500명 이상의 개발자까지 확장
- ✅ 보안 인증 - 환경 변수 토큰 (GITHUB_TOKEN, GITLAB_TOKEN)
🤖 코드베이스 분석 (C3.x)
C3.4: 설정 패턴 추출 (AI 강화 포함)
- ✅ 9가지 설정 형식 - JSON, YAML, TOML, ENV, INI, Python, JavaScript, Dockerfile, Docker Compose
- ✅ 7가지 패턴 유형 - 데이터베이스, API, 로깅, 캐시, 이메일, 인증, 서버 설정
- ✅ AI 강화 - 선택적 듀얼 모드 AI 분석 (API + LOCAL)
- ✅ 보안 분석 - 하드코딩된 시크릿과 노출된 자격 증명 탐지
C3.3: AI 강화 사용 가이드
- ✅ 종합 AI 강화 - 기본 가이드를 전문 튜토리얼로 변환
- ✅ 5가지 자동 개선 - 단계 설명, 문제 해결, 전제 조건, 다음 단계, 사용 사례
- ✅ 듀얼 모드 지원 - API 모드 (Claude API) 또는 LOCAL 모드 (Claude Code CLI)
- ✅ LOCAL 모드 무료 - Claude Code Max 플랜으로 무료 강화
사용법:
# 빠른 분석 (1–2분, 기본 기능만)
skill-seekers analyze --directory tests/ --quick
# 종합 분석 (AI 포함, 20–60분)
skill-seekers analyze --directory tests/ --comprehensive
# AI 강화 포함
skill-seekers analyze --directory tests/ --enhance
전체 문서: docs/HOW_TO_GUIDES.md
🔄 강화 워크플로 프리셋
AI가 원시 문서를 세련된 스킬로 변환하는 방법을 제어하는 재사용 가능한 YAML 정의 강화 파이프라인입니다.
- ✅ 5개 내장 프리셋 —
default,minimal,security-focus,architecture-comprehensive,api-documentation - ✅ 사용자 정의 프리셋 —
~/.config/skill-seekers/workflows/에 커스텀 워크플로 추가 - ✅ 다중 워크플로 체이닝 — 하나의 명령에서 두 개 이상의 워크플로 체이닝
- ✅ 완전한 CLI 관리 — 목록, 조회, 복사, 추가, 삭제, 유효성 검사
# 단일 워크플로 적용
skill-seekers create ./my-project --enhance-workflow security-focus
# 다중 워크플로 체이닝 (순서대로 적용)
skill-seekers create ./my-project \
--enhance-workflow security-focus \
--enhance-workflow minimal
# 프리셋 관리
skill-seekers workflows list # 모든 항목 나열 (내장 + 사용자)
skill-seekers workflows show security-focus # YAML 내용 출력
skill-seekers workflows copy security-focus # 편집을 위해 사용자 디렉터리에 복사
skill-seekers workflows add ./my-workflow.yaml # 커스텀 프리셋 설치
skill-seekers workflows remove my-workflow # 사용자 프리셋 삭제
skill-seekers workflows validate security-focus # 프리셋 구조 유효성 검사
# 여러 개 동시 복사
skill-seekers workflows copy security-focus minimal api-documentation
# 여러 파일 동시 추가
skill-seekers workflows add ./wf-a.yaml ./wf-b.yaml
# 여러 개 동시 삭제
skill-seekers workflows remove my-wf-a my-wf-b
YAML 프리셋 형식:
name: security-focus
description: "보안 중심 검토: 취약점, 인증, 데이터 처리"
version: "1.0"
stages:
- name: vulnerabilities
type: custom
prompt: "OWASP Top 10 및 일반적인 보안 취약점 검토..."
- name: auth-review
type: custom
prompt: "인증 및 권한 부여 패턴 검사..."
uses_history: true
⚡ 성능 및 확장성
- ✅ 비동기 모드 - async/await로 2–3배 빠른 스크래핑 (
--async플래그 사용) - ✅ 대규모 문서 지원 - 지능형 분할로 10K–40K+ 페이지 문서 처리
- ✅ 라우터/허브 스킬 - 전문 서브 스킬로의 지능형 라우팅
- ✅ 병렬 스크래핑 - 여러 스킬 동시 처리
- ✅ 체크포인트/재개 - 장시간 스크래핑에서 진행 상황 손실 방지
- ✅ 캐싱 시스템 - 한 번 스크래핑, 즉시 재구축
✅ 품질 보증
- ✅ 완전한 테스트 - 2,540+ 테스트, 포괄적 커버리지
📦 설치
# 기본 설치 (문서 스크래핑, GitHub 분석, PDF, 패키징)
pip install skill-seekers
# 모든 LLM 플랫폼 지원 포함
pip install skill-seekers[all-llms]
# MCP 서버 포함
pip install skill-seekers[mcp]
# 전체 기능
pip install skill-seekers[all]
선택에 도움이 필요하신가요? 설정 마법사를 실행하세요:
skill-seekers-setup
설치 옵션
| 설치 명령 | 기능 |
|---|---|
pip install skill-seekers |
스크래핑, GitHub 분석, PDF, 모든 플랫폼 |
pip install skill-seekers[gemini] |
+ Google Gemini 지원 |
pip install skill-seekers[openai] |
+ OpenAI ChatGPT 지원 |
pip install skill-seekers[all-llms] |
+ 모든 LLM 플랫폼 |
pip install skill-seekers[mcp] |
+ MCP 서버 |
pip install skill-seekers[video] |
+ YouTube/Vimeo 자막 및 메타데이터 추출 |
pip install skill-seekers[video-full] |
+ Whisper 전사 및 시각 프레임 추출 |
pip install skill-seekers[jupyter] |
+ Jupyter 노트북 지원 |
pip install skill-seekers[pptx] |
+ PowerPoint 지원 |
pip install skill-seekers[confluence] |
+ Confluence 위키 지원 |
pip install skill-seekers[notion] |
+ Notion 페이지 지원 |
pip install skill-seekers[rss] |
+ RSS/Atom 피드 지원 |
pip install skill-seekers[chat] |
+ Slack/Discord 채팅 내보내기 지원 |
pip install skill-seekers[asciidoc] |
+ AsciiDoc 문서 지원 |
pip install skill-seekers[all] |
모든 기능 활성화 |
동영상 시각 종속성 (GPU 인식):
skill-seekers[video-full]설치 후,skill-seekers video --setup을 실행하여 GPU를 자동 감지하고 올바른 PyTorch 빌드 + easyocr을 설치하세요. 이것이 시각 추출 종속성 설치의 권장 방법입니다.
🚀 원커맨드 설치 워크플로
설정에서 업로드된 스킬까지 가장 빠른 방법 — 완전 자동화:
# 공식 설정에서 React 스킬 설치 (Claude에 자동 업로드)
skill-seekers install --config react
# 로컬 설정 파일에서 설치
skill-seekers install --config configs/custom.json
# 업로드 없이 설치 (패키징만)
skill-seekers install --config django --no-upload
# 실행 없이 워크플로 미리보기
skill-seekers install --config react --dry-run
실행 단계:
📥 단계 1: 설정 가져오기 (설정 이름이 제공된 경우)
📖 단계 2: 문서 스크래핑
✨ 단계 3: AI 강화
📦 단계 4: 스킬 패키징
☁️ 단계 5: Claude에 업로드 (선택사항, API Key 필요)
📊 기능 매트릭스
Skill Seekers는 4개 LLM 플랫폼, 17가지 소스 유형을 지원하며 모든 대상에서 완전한 기능 동등성을 제공합니다.
플랫폼: Claude AI, Google Gemini, OpenAI ChatGPT, 범용 Markdown 소스 유형: 문서 사이트, GitHub 저장소, PDF, Word (.docx), EPUB, 동영상, 로컬 코드베이스, Jupyter 노트북, 로컬 HTML, OpenAPI/Swagger, AsciiDoc, PowerPoint (.pptx), RSS/Atom 피드, Man 페이지, Confluence 위키, Notion 페이지, Slack/Discord 채팅 내보내기
전체 내용은 전체 기능 매트릭스를 참조하세요.
빠른 플랫폼 비교
| 기능 | Claude | Gemini | OpenAI | Markdown |
|---|---|---|---|---|
| 형식 | ZIP + YAML | tar.gz | ZIP + Vector | ZIP |
| 업로드 | ✅ API | ✅ API | ✅ API | ❌ 수동 |
| 강화 | ✅ Sonnet 4 | ✅ 2.0 Flash | ✅ GPT-4o | ❌ 없음 |
| 모든 스킬 모드 | ✅ | ✅ | ✅ | ✅ |
사용 예제
문서 스크래핑
# 문서 사이트 스크래핑
skill-seekers scrape --config configs/react.json
# 설정 없이 빠른 스크래핑
skill-seekers scrape --url https://react.dev --name react
# 비동기 모드 (3배 빠름)
skill-seekers scrape --config configs/godot.json --async --workers 8
PDF 추출
# 기본 PDF 추출
skill-seekers pdf --pdf docs/manual.pdf --name myskill
# 고급 기능
skill-seekers pdf --pdf docs/manual.pdf --name myskill \
--extract-tables \ # 표 추출
--parallel \ # 빠른 병렬 처리
--workers 8 # 8개 CPU 코어 사용
# 스캔 PDF (필요: pip install pytesseract Pillow)
skill-seekers pdf --pdf docs/scanned.pdf --name myskill --ocr
동영상 추출
# 동영상 지원 설치
pip install skill-seekers[video] # 자막 + 메타데이터
pip install skill-seekers[video-full] # + Whisper 전사 + 시각 프레임 추출
# GPU 자동 감지 및 시각 종속성 설치 (PyTorch + easyocr)
skill-seekers video --setup
# YouTube 동영상에서 추출
skill-seekers video --url https://www.youtube.com/watch?v=dQw4w9WgXcQ --name mytutorial
# YouTube 재생 목록에서 추출
skill-seekers video --playlist https://www.youtube.com/playlist?list=... --name myplaylist
# 로컬 동영상 파일에서 추출
skill-seekers video --video-file recording.mp4 --name myrecording
# 시각 프레임 분석으로 추출 (video-full 종속성 필요)
skill-seekers video --url https://www.youtube.com/watch?v=... --name mytutorial --visual
# AI 강화 적용 (OCR 정리 + 완성도 높은 SKILL.md 생성)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --enhance-level 2
# 동영상의 특정 구간 클리핑 (초, MM:SS, HH:MM:SS 형식 지원)
skill-seekers video --url https://www.youtube.com/watch?v=... --start-time 1:30 --end-time 5:00
# 낮은 신뢰도 OCR 프레임에 Vision API 사용 (ANTHROPIC_API_KEY 필요)
skill-seekers video --url https://www.youtube.com/watch?v=... --visual --vision-ocr
# 이전에 추출된 데이터에서 스킬 재구축 (다운로드 건너뛰기)
skill-seekers video --from-json output/mytutorial/video_data/extracted_data.json --name mytutorial
전체 가이드: docs/VIDEO_GUIDE.md에서 전체 CLI 레퍼런스, 시각 파이프라인 상세 정보, AI 강화 옵션, 문제 해결을 확인하세요.
GitHub 저장소 분석
# 기본 저장소 스크래핑
skill-seekers github --repo facebook/react
# 인증 설정 (더 높은 속도 제한)
export GITHUB_TOKEN=ghp_your_token_here
skill-seekers github --repo facebook/react
# 포함 내용 커스터마이징
skill-seekers github --repo django/django \
--include-issues \ # GitHub Issues 추출
--max-issues 100 \ # Issue 수 제한
--include-changelog # CHANGELOG.md 추출
통합 다중 소스 스크래핑
문서 + GitHub + PDF를 충돌 감지가 포함된 하나의 통합 스킬로 결합:
# 기존 통합 설정 사용
skill-seekers unified --config configs/react_unified.json
# 또는 통합 설정 생성
cat > configs/myframework_unified.json << 'EOF'
{
"name": "myframework",
"merge_mode": "rule-based",
"sources": [
{
"type": "documentation",
"base_url": "https://docs.myframework.com/",
"max_pages": 200
},
{
"type": "github",
"repo": "owner/myframework",
"code_analysis_depth": "surface"
}
]
}
EOF
skill-seekers unified --config configs/myframework_unified.json
충돌 감지가 자동으로 발견하는 항목:
- 🔴 코드에 누락 (높음): 문서화되었으나 미구현
- 🟡 문서에 누락 (중간): 구현되었으나 미문서화
- ⚠️ 시그니처 불일치: 매개변수/타입 차이
- ℹ️ 설명 불일치: 설명 차이
전체 가이드: docs/UNIFIED_SCRAPING.md 참조.
프라이빗 설정 저장소
프라이빗 Git 저장소를 사용하여 팀 간 커스텀 설정 공유:
# MCP 도구로 팀 프라이빗 저장소 등록
add_config_source(
name="team",
git_url="https://github.com/mycompany/skill-configs.git",
token_env="GITHUB_TOKEN"
)
# 팀 저장소에서 설정 가져오기
fetch_config(source="team", config_name="internal-api")
지원 플랫폼:
- GitHub (
GITHUB_TOKEN), GitLab (GITLAB_TOKEN), Gitea (GITEA_TOKEN), Bitbucket (BITBUCKET_TOKEN)
전체 가이드: docs/GIT_CONFIG_SOURCES.md 참조.
작동 원리
graph LR
A[문서 사이트] --> B[Skill Seekers]
B --> C[스크래퍼]
B --> D[AI 강화]
B --> E[패키저]
C --> F[정리된 참조 파일]
D --> F
F --> E
E --> G[Claude 스킬 .zip]
G --> H[Claude AI에 업로드]
- llms.txt 감지 - llms-full.txt, llms.txt, llms-small.txt를 우선 확인
- 스크래핑: 문서의 모든 페이지 추출
- 분류: 콘텐츠를 주제별로 정리 (API, 가이드, 튜토리얼 등)
- 강화: AI가 문서를 분석하고 예제가 포함된 종합적인 SKILL.md 생성
- 패키징: 모든 내용을 Claude 준비 완료된
.zip파일로 번들링
📋 사전 요구 사항
시작하기 전에 다음 사항을 확인하세요:
처음 사용하시나요? → 여기에서 시작: 확실한 빠른 시작 가이드 🎯
📤 Claude에 스킬 업로드
스킬이 패키징된 후, Claude에 업로드해야 합니다:
옵션 1: 자동 업로드 (API 기반)
# API Key 설정 (일회성)
export ANTHROPIC_API_KEY=sk-ant-...
# 패키징 후 자동 업로드
skill-seekers package output/react/ --upload
# 또는 기존 .zip 업로드
skill-seekers upload output/react.zip
옵션 2: 수동 업로드 (API Key 불필요)
# 스킬 패키징
skill-seekers package output/react/
# → output/react.zip 생성
# 그런 다음 수동으로 업로드:
# - https://claude.ai/skills 방문
# - "스킬 업로드" 클릭
# - output/react.zip 선택
옵션 3: MCP (Claude Code)
Claude Code에서 직접 요청:
"React 스킬을 패키징하고 업로드해 줘"
🤖 AI 에이전트에 설치
Skill Seekers는 10개 이상의 AI 코딩 에이전트에 스킬을 자동으로 설치할 수 있습니다.
# 특정 에이전트에 설치
skill-seekers install-agent output/react/ --agent cursor
# 모든 에이전트에 한 번에 설치
skill-seekers install-agent output/react/ --agent all
# 설치 없이 미리보기
skill-seekers install-agent output/react/ --agent cursor --dry-run
지원되는 에이전트
| 에이전트 | 경로 | 유형 |
|---|---|---|
| Claude Code | ~/.claude/skills/ |
전역 |
| Cursor | .cursor/skills/ |
프로젝트 |
| VS Code / Copilot | .github/skills/ |
프로젝트 |
| Amp | ~/.amp/skills/ |
전역 |
| Goose | ~/.config/goose/skills/ |
전역 |
| OpenCode | ~/.opencode/skills/ |
전역 |
| Windsurf | ~/.windsurf/skills/ |
전역 |
🔌 MCP 통합 (26개 도구)
Skill Seekers는 Claude Code, Cursor, Windsurf, VS Code + Cline 또는 IntelliJ IDEA에서 사용할 수 있는 MCP 서버를 제공합니다.
# stdio 모드 (Claude Code, VS Code + Cline)
python -m skill_seekers.mcp.server_fastmcp
# HTTP 모드 (Cursor, Windsurf, IntelliJ)
python -m skill_seekers.mcp.server_fastmcp --transport http --port 8765
# 모든 에이전트 일괄 자동 설정
./setup_mcp.sh
전체 26개 도구:
- 핵심 (9개):
list_configs,generate_config,validate_config,estimate_pages,scrape_docs,package_skill,upload_skill,enhance_skill,install_skill - 확장 (10개):
scrape_github,scrape_pdf,unified_scrape,merge_sources,detect_conflicts,add_config_source,fetch_config,list_config_sources,remove_config_source,split_config - 벡터 DB (4개):
export_to_chroma,export_to_weaviate,export_to_faiss,export_to_qdrant - 클라우드 (3개):
cloud_upload,cloud_download,cloud_list
전체 가이드: docs/MCP_SETUP.md
⚙️ 설정
사용 가능한 프리셋 (24+)
# 모든 프리셋 나열
skill-seekers list-configs
| 카테고리 | 프리셋 |
|---|---|
| 웹 프레임워크 | react, vue, angular, svelte, nextjs |
| Python | django, flask, fastapi, sqlalchemy, pytest |
| 게임 개발 | godot, pygame, unity |
| 도구 및 DevOps | docker, kubernetes, terraform, ansible |
| 통합 (문서 + GitHub) | react-unified, vue-unified, nextjs-unified 등 |
나만의 설정 만들기
# 옵션 1: 대화형
skill-seekers scrape --interactive
# 옵션 2: 프리셋 복사 후 편집
cp configs/react.json configs/myframework.json
nano configs/myframework.json
skill-seekers scrape --config configs/myframework.json
설정 파일 구조
{
"name": "myframework",
"description": "이 스킬을 사용할 시점",
"base_url": "https://docs.myframework.com/",
"selectors": {
"main_content": "article",
"title": "h1",
"code_blocks": "pre code"
},
"url_patterns": {
"include": ["/docs", "/guide"],
"exclude": ["/blog", "/about"]
},
"categories": {
"getting_started": ["intro", "quickstart"],
"api": ["api", "reference"]
},
"rate_limit": 0.5,
"max_pages": 500
}
설정 저장 위치
도구는 다음 순서로 검색합니다:
- 제공된 정확한 경로
./configs/(현재 디렉터리)~/.config/skill-seekers/configs/(사용자 설정 디렉터리)- SkillSeekersWeb.com API (프리셋 설정)
📊 생성되는 내용
output/
├── godot_data/ # 스크래핑된 원시 데이터
│ ├── pages/ # JSON 파일 (페이지당 하나)
│ └── summary.json # 개요
│
└── godot/ # 스킬 파일
├── SKILL.md # 실제 예제가 포함된 강화 버전
├── references/ # 분류된 문서
│ ├── index.md
│ ├── getting_started.md
│ ├── scripting.md
│ └── ...
├── scripts/ # 비어 있음 (직접 추가 가능)
└── assets/ # 비어 있음 (직접 추가 가능)
🐛 문제 해결
콘텐츠가 추출되지 않나요?
main_content선택자를 확인하세요- 시도해 보세요:
article,main,div[role="main"]
데이터가 있는데 사용되지 않나요?
# 강제 재스크래핑
rm -rf output/myframework_data/
skill-seekers scrape --config configs/myframework.json
분류가 적절하지 않나요?
설정의 categories 섹션을 더 적합한 키워드로 편집하세요.
문서를 업데이트하고 싶으신가요?
# 이전 데이터 삭제 후 재스크래핑
rm -rf output/godot_data/
skill-seekers scrape --config configs/godot.json
강화가 작동하지 않나요?
# API Key가 설정되어 있는지 확인
echo $ANTHROPIC_API_KEY
# LOCAL 모드 시도 (Claude Code Max 사용, API Key 불필요)
skill-seekers enhance output/react/ --mode LOCAL
# 백그라운드 강화 상태 모니터링
skill-seekers enhance-status output/react/ --watch
GitHub 속도 제한 문제?
# GitHub 토큰 설정 (시간당 5000회 vs 익명 60회)
export GITHUB_TOKEN=ghp_your_token_here
# 또는 여러 프로필 설정
skill-seekers config --github
📈 성능
| 작업 | 시간 | 참고 |
|---|---|---|
| 스크래핑 (동기) | 15–45분 | 최초 실행만, 스레드 기반 |
| 스크래핑 (비동기) | 5–15분 | --async 플래그로 2–3배 빠름 |
| 빌드 | 1–3분 | 캐시에서 빠른 재구축 |
| 재구축 | <1분 | --skip-scrape 사용 |
| 강화 (LOCAL) | 30–60초 | Claude Code Max 사용 |
| 강화 (API) | 20–40초 | API Key 필요 |
| 동영상 (자막) | 1–3분 | YouTube/로컬, 자막만 |
| 동영상 (시각) | 5–15분 | + OCR 프레임 추출 |
| 패키징 | 5–10초 | 최종 .zip 생성 |
📚 문서
시작 가이드
- BULLETPROOF_QUICKSTART.md - 🎯 신규 사용자는 여기에서 시작!
- QUICKSTART.md - 경험 있는 사용자를 위한 빠른 시작
- TROUBLESHOOTING.md - 일반적인 문제와 해결 방법
- docs/QUICK_REFERENCE.md - 한 페이지 치트 시트
가이드
- docs/LARGE_DOCUMENTATION.md - 10K–40K+ 페이지 문서 처리
- ASYNC_SUPPORT.md - 비동기 모드 가이드 (2–3배 빠른 스크래핑)
- docs/ENHANCEMENT_MODES.md - AI 강화 모드 가이드
- docs/MCP_SETUP.md - MCP 통합 설정
- docs/UNIFIED_SCRAPING.md - 다중 소스 스크래핑
- docs/VIDEO_GUIDE.md - 동영상 추출 전체 가이드
통합 가이드
- docs/integrations/LANGCHAIN.md - LangChain RAG
- docs/integrations/CURSOR.md - Cursor IDE
- docs/integrations/WINDSURF.md - Windsurf IDE
- docs/integrations/CLINE.md - Cline (VS Code)
- docs/integrations/RAG_PIPELINES.md - 모든 RAG 파이프라인
📝 라이선스
MIT 라이선스 - 자세한 내용은 LICENSE 파일을 참조하세요
즐거운 스킬 빌딩 되세요! 🚀

