style: Fix 411 ruff lint issues (Kimi's issue #4)

Auto-fixed lint issues with ruff --fix and --unsafe-fixes: Issue #4: Ruff Lint Issues - Before: 447 errors (originally reported as ~5,500) - After: 55 errors remaining - Fixed: 411 errors (92% reduction) Auto-fixes applied: - 156 UP006: List/Dict → list/dict (PEP 585) - 63 UP045: Optional[X] → X | None (PEP 604) - 52 F401: Removed unused imports - 52 UP035: Fixed deprecated imports - 34 E712: True/False comparisons → not/bool() - 17 F841: Removed unused variables - Plus 37 other auto-fixable issues Remaining 55 errors (non-critical): - 39 B904: Exception chaining (best practice) - 5 F401: Unused imports (edge cases) - 3 SIM105: Could use contextlib.suppress - 8 other minor style issues These remaining issues are code quality improvements, not critical bugs. Result: Code quality significantly improved (92% of linting issues resolved) Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2026-02-08 12:46:38 +03:00
parent 0573ef24f9
commit 51787e57bc
56 changed files with 277 additions and 360 deletions
--- a/src/skill_seekers/cli/adaptors/base.py
+++ b/src/skill_seekers/cli/adaptors/base.py
@@ -9,7 +9,7 @@ This enables Skill Seekers to generate skills for multiple LLM platforms (Claude
 from abc import ABC, abstractmethod
 from dataclasses import dataclass, field
 from pathlib import Path
-from typing import Any, List, Tuple
+from typing import Any


@dataclass
@@ -283,7 +283,7 @@ class SkillAdaptor(ABC):
        chunk_max_tokens: int = 512,
        preserve_code_blocks: bool = True,
        source_file: str = None
-    ) -> List[Tuple[str, dict]]:
+    ) -> list[tuple[str, dict]]:
        """
        Optionally chunk content for RAG platforms.

--- a/src/skill_seekers/cli/adaptors/chroma.py
+++ b/src/skill_seekers/cli/adaptors/chroma.py
@@ -256,10 +256,9 @@ class ChromaAdaptor(SkillAdaptor):
                # Parse URL
                if '://' in chroma_url:
                    parts = chroma_url.split('://')
-                    protocol = parts[0]
+                    parts[0]
                    host_port = parts[1]
                else:
-                    protocol = 'http'
                    host_port = chroma_url

                if ':' in host_port:
--- a/src/skill_seekers/cli/adaptors/faiss_helpers.py
+++ b/src/skill_seekers/cli/adaptors/faiss_helpers.py
@@ -236,7 +236,7 @@ class FAISSHelpers(SkillAdaptor):
        Returns:
            Result with usage instructions
        """
-        example_code = """
+        example_code = f"""
 # Example: Create FAISS index with JSON metadata (safe & portable)

 import faiss
@@ -246,7 +246,7 @@ from openai import OpenAI
 from pathlib import Path

 # Load data
-with open("{path}") as f:
+with open("{package_path.name}") as f:
    data = json.load(f)

 # Generate embeddings (using OpenAI)
@@ -387,9 +387,7 @@ print(f"\\nIndex stats:")
 print(f"  Total vectors: {{index.ntotal}}")
 print(f"  Dimension: {{dimension}}")
 print(f"  Type: {{type(index).__name__}}")
-""".format(
-            path=package_path.name
-        )
+"""

        return {
            "success": False,
--- a/src/skill_seekers/cli/adaptors/haystack.py
+++ b/src/skill_seekers/cli/adaptors/haystack.py
@@ -225,7 +225,7 @@ class HaystackAdaptor(SkillAdaptor):
        Returns:
            Result indicating no upload capability
        """
-        example_code = """
+        example_code = f"""
 # Example: Load into Haystack 2.x

 from haystack import Document
@@ -234,7 +234,7 @@ from haystack.components.retrievers.in_memory import InMemoryBM25Retriever
 import json

 # Load documents
-with open("{path}") as f:
+with open("{package_path.name}") as f:
    docs_data = json.load(f)

 # Convert to Haystack Documents
@@ -254,9 +254,7 @@ retriever = InMemoryBM25Retriever(document_store=document_store)
 results = retriever.run(query="your question here")
 for doc in results["documents"]:
    print(doc.content)
-""".format(
-            path=package_path.name
-        )
+"""

        return {
            "success": False,
--- a/src/skill_seekers/cli/adaptors/langchain.py
+++ b/src/skill_seekers/cli/adaptors/langchain.py
@@ -222,14 +222,14 @@ class LangChainAdaptor(SkillAdaptor):
        Returns:
            Result indicating no upload capability
        """
-        example_code = """
+        example_code = f"""
 # Example: Load into LangChain

 from langchain.schema import Document
 import json

 # Load documents
-with open("{path}") as f:
+with open("{package_path.name}") as f:
    docs_data = json.load(f)

 # Convert to LangChain Documents
@@ -247,9 +247,7 @@ retriever = vectorstore.as_retriever()

 # Query
 results = retriever.get_relevant_documents("your query here")
-""".format(
-            path=package_path.name
-        )
+"""

        return {
            "success": False,
--- a/src/skill_seekers/cli/adaptors/llama_index.py
+++ b/src/skill_seekers/cli/adaptors/llama_index.py
@@ -245,7 +245,7 @@ class LlamaIndexAdaptor(SkillAdaptor):
        Returns:
            Result indicating no upload capability
        """
-        example_code = """
+        example_code = f"""
 # Example: Load into LlamaIndex

 from llama_index.core.schema import TextNode
@@ -253,7 +253,7 @@ from llama_index.core import VectorStoreIndex
 import json

 # Load nodes
-with open("{path}") as f:
+with open("{package_path.name}") as f:
    nodes_data = json.load(f)

 # Convert to LlamaIndex Nodes
@@ -275,9 +275,7 @@ query_engine = index.as_query_engine()
 # Query
 response = query_engine.query("your question here")
 print(response)
-""".format(
-            path=package_path.name
-        )
+"""

        return {
            "success": False,
--- a/src/skill_seekers/cli/adaptors/qdrant.py
+++ b/src/skill_seekers/cli/adaptors/qdrant.py
@@ -261,7 +261,7 @@ class QdrantAdaptor(SkillAdaptor):
        Returns:
            Result with usage instructions
        """
-        example_code = """
+        example_code = f"""
 # Example: Create Qdrant collection and upload points

 from qdrant_client import QdrantClient
@@ -271,7 +271,7 @@ from pathlib import Path
 from openai import OpenAI

 # Load data
-with open("{path}") as f:
+with open("{package_path.name}") as f:
    data = json.load(f)

 # Connect to Qdrant (local or cloud)
@@ -438,7 +438,7 @@ similar = client.recommend(
    negative=["point-id-2"],  # But not this
    limit=5
 )
-""".format(path=package_path.name)
+"""

        return {
            "success": False,
--- a/src/skill_seekers/cli/adaptors/streaming_adaptor.py
+++ b/src/skill_seekers/cli/adaptors/streaming_adaptor.py
@@ -8,7 +8,7 @@ Enables memory-efficient processing of large documentation sets.

 import json
 from pathlib import Path
-from typing import Any, Iterator, Optional
+from typing import Any
 import sys

 # Add parent directory to path for imports
@@ -36,7 +36,7 @@ class StreamingAdaptorMixin:
        chunk_size: int = 4000,
        chunk_overlap: int = 200,
        batch_size: int = 100,
-        progress_callback: Optional[callable] = None
+        progress_callback: callable | None = None
    ) -> Path:
        """
        Package skill using streaming ingestion.
@@ -179,7 +179,7 @@ class StreamingAdaptorMixin:
            Estimation statistics
        """
        skill_dir = Path(skill_dir)
-        ingester = StreamingIngester(
+        StreamingIngester(
            chunk_size=chunk_size,
            chunk_overlap=chunk_overlap
        )
--- a/src/skill_seekers/cli/benchmark_cli.py
+++ b/src/skill_seekers/cli/benchmark_cli.py
@@ -42,17 +42,15 @@ def run_scraping_benchmark(runner, config):
        scrape_config_path = config.get("scrape_config")

        # Time scraping
-        with bench.timer("scrape_docs"):
-            with bench.memory("scrape_docs"):
-                pages = scrape_all(scrape_config_path)
+        with bench.timer("scrape_docs"), bench.memory("scrape_docs"):
+            pages = scrape_all(scrape_config_path)

        # Track metrics
        bench.metric("pages_scraped", len(pages), "pages")

        # Time building
-        with bench.timer("build_skill"):
-            with bench.memory("build_skill"):
-                build_skill(scrape_config_path, pages)
+        with bench.timer("build_skill"), bench.memory("build_skill"):
+            build_skill(scrape_config_path, pages)

    name = config.get("name", "scraping-benchmark")
    report = runner.run(name, benchmark_func)
@@ -76,9 +74,8 @@ def run_embedding_benchmark(runner, config):

        # Batch embedding
        if len(texts) > 1:
-            with bench.timer("batch_embedding"):
-                with bench.memory("batch_embedding"):
-                    embeddings = generator.generate_batch(texts, model=model)
+            with bench.timer("batch_embedding"), bench.memory("batch_embedding"):
+                embeddings = generator.generate_batch(texts, model=model)

            bench.metric("embeddings_per_sec", len(embeddings) / bench.result.timings[-1].duration, "emb/sec")

--- a/src/skill_seekers/cli/cloud_storage_cli.py
+++ b/src/skill_seekers/cli/cloud_storage_cli.py
@@ -8,7 +8,6 @@ Upload, download, and manage skills in cloud storage (S3, GCS, Azure).
 import sys
 import argparse
 from pathlib import Path
-from typing import Optional

 from .storage import get_storage_adaptor

@@ -155,7 +154,7 @@ def format_size(size_bytes: int) -> str:
    return f"{size_bytes:.1f}PB"


-def parse_extra_args(extra: Optional[list]) -> dict:
+def parse_extra_args(extra: list | None) -> dict:
    """Parse extra arguments into dictionary."""
    if not extra:
        return {}
--- a/src/skill_seekers/cli/embedding_pipeline.py
+++ b/src/skill_seekers/cli/embedding_pipeline.py
@@ -10,7 +10,7 @@ import hashlib
 import json
 import time
 from pathlib import Path
-from typing import List, Optional, Dict, Any, Tuple
+from typing import Any
 from dataclasses import dataclass, field
 from abc import ABC, abstractmethod
 import numpy as np
@@ -23,7 +23,7 @@ class EmbeddingConfig:
    model: str
    dimension: int
    batch_size: int = 100
-    cache_dir: Optional[Path] = None
+    cache_dir: Path | None = None
    max_retries: int = 3
    retry_delay: float = 1.0

@@ -31,8 +31,8 @@ class EmbeddingConfig:
@dataclass
 class EmbeddingResult:
    """Result of embedding generation."""
-    embeddings: List[List[float]]
-    metadata: Dict[str, Any] = field(default_factory=dict)
+    embeddings: list[list[float]]
+    metadata: dict[str, Any] = field(default_factory=dict)
    cached_count: int = 0
    generated_count: int = 0
    total_time: float = 0.0
@@ -59,7 +59,7 @@ class CostTracker:
        else:
            self.cache_misses += 1

-    def get_stats(self) -> Dict[str, Any]:
+    def get_stats(self) -> dict[str, Any]:
        """Get statistics."""
        cache_rate = (self.cache_hits / self.total_requests * 100) if self.total_requests > 0 else 0

@@ -77,7 +77,7 @@ class EmbeddingProvider(ABC):
    """Abstract base class for embedding providers."""

    @abstractmethod
-    def generate_embeddings(self, texts: List[str]) -> List[List[float]]:
+    def generate_embeddings(self, texts: list[str]) -> list[list[float]]:
        """Generate embeddings for texts."""
        pass

@@ -108,7 +108,7 @@ class OpenAIEmbeddingProvider(EmbeddingProvider):
        'text-embedding-3-large': 3072,
    }

-    def __init__(self, model: str = 'text-embedding-ada-002', api_key: Optional[str] = None):
+    def __init__(self, model: str = 'text-embedding-ada-002', api_key: str | None = None):
        """Initialize OpenAI provider."""
        self.model = model
        self.api_key = api_key
@@ -124,7 +124,7 @@ class OpenAIEmbeddingProvider(EmbeddingProvider):
                raise ImportError("OpenAI package not installed. Install with: pip install openai")
        return self._client

-    def generate_embeddings(self, texts: List[str]) -> List[List[float]]:
+    def generate_embeddings(self, texts: list[str]) -> list[list[float]]:
        """Generate embeddings using OpenAI."""
        client = self._get_client()

@@ -155,7 +155,7 @@ class LocalEmbeddingProvider(EmbeddingProvider):
        """Initialize local provider."""
        self.dimension = dimension

-    def generate_embeddings(self, texts: List[str]) -> List[List[float]]:
+    def generate_embeddings(self, texts: list[str]) -> list[list[float]]:
        """Generate embeddings using local model (simulated)."""
        # In production, would use sentence-transformers or similar
        embeddings = []
@@ -180,10 +180,10 @@ class LocalEmbeddingProvider(EmbeddingProvider):
 class EmbeddingCache:
    """Cache for embeddings to avoid recomputation."""

-    def __init__(self, cache_dir: Optional[Path] = None):
+    def __init__(self, cache_dir: Path | None = None):
        """Initialize cache."""
        self.cache_dir = Path(cache_dir) if cache_dir else None
-        self._memory_cache: Dict[str, List[float]] = {}
+        self._memory_cache: dict[str, list[float]] = {}

        if self.cache_dir:
            self.cache_dir.mkdir(parents=True, exist_ok=True)
@@ -193,7 +193,7 @@ class EmbeddingCache:
        key = f"{model}:{text}"
        return hashlib.sha256(key.encode()).hexdigest()

-    def get(self, text: str, model: str) -> Optional[List[float]]:
+    def get(self, text: str, model: str) -> list[float] | None:
        """Get embedding from cache."""
        cache_key = self._compute_hash(text, model)

@@ -215,7 +215,7 @@ class EmbeddingCache:

        return None

-    def set(self, text: str, model: str, embedding: List[float]) -> None:
+    def set(self, text: str, model: str, embedding: list[float]) -> None:
        """Store embedding in cache."""
        cache_key = self._compute_hash(text, model)

@@ -266,7 +266,7 @@ class EmbeddingPipeline:

    def generate_batch(
        self,
-        texts: List[str],
+        texts: list[str],
        show_progress: bool = True
    ) -> EmbeddingResult:
        """
@@ -313,7 +313,7 @@ class EmbeddingPipeline:
                new_embeddings = self.provider.generate_embeddings(to_generate)

                # Store in cache
-                for text, embedding in zip(to_generate, new_embeddings):
+                for text, embedding in zip(to_generate, new_embeddings, strict=False):
                    self.cache.set(text, self.config.model, embedding)

                # Track cost
@@ -322,7 +322,7 @@ class EmbeddingPipeline:
                self.cost_tracker.add_request(total_tokens, cost, from_cache=False)

                # Merge with cached
-                for idx, embedding in zip(to_generate_indices, new_embeddings):
+                for idx, embedding in zip(to_generate_indices, new_embeddings, strict=False):
                    batch_embeddings.insert(idx, embedding)

                generated_count += len(to_generate)
@@ -359,7 +359,7 @@ class EmbeddingPipeline:
            cost_estimate=self.cost_tracker.estimated_cost
        )

-    def validate_dimensions(self, embeddings: List[List[float]]) -> bool:
+    def validate_dimensions(self, embeddings: list[list[float]]) -> bool:
        """
        Validate embedding dimensions.

@@ -379,7 +379,7 @@ class EmbeddingPipeline:

        return True

-    def get_cost_stats(self) -> Dict[str, Any]:
+    def get_cost_stats(self) -> dict[str, Any]:
        """Get cost tracking statistics."""
        return self.cost_tracker.get_stats()

--- a/src/skill_seekers/cli/incremental_updater.py
+++ b/src/skill_seekers/cli/incremental_updater.py
@@ -9,10 +9,8 @@ Tracks document versions and generates delta packages.
 import json
 import hashlib
 from pathlib import Path
-from typing import Optional, Dict, List, Set
 from dataclasses import dataclass, asdict
 from datetime import datetime
-import difflib


@dataclass
@@ -28,10 +26,10 @@ class DocumentVersion:
@dataclass
 class ChangeSet:
    """Set of changes detected."""
-    added: List[DocumentVersion]
-    modified: List[DocumentVersion]
-    deleted: List[str]
-    unchanged: List[DocumentVersion]
+    added: list[DocumentVersion]
+    modified: list[DocumentVersion]
+    deleted: list[str]
+    unchanged: list[DocumentVersion]

    @property
    def has_changes(self) -> bool:
@@ -50,7 +48,7 @@ class UpdateMetadata:
    timestamp: str
    previous_version: str
    new_version: str
-    change_summary: Dict[str, int]
+    change_summary: dict[str, int]
    total_documents: int


@@ -72,8 +70,8 @@ class IncrementalUpdater:
        """
        self.skill_dir = Path(skill_dir)
        self.version_file = self.skill_dir / version_file
-        self.current_versions: Dict[str, DocumentVersion] = {}
-        self.previous_versions: Dict[str, DocumentVersion] = {}
+        self.current_versions: dict[str, DocumentVersion] = {}
+        self.previous_versions: dict[str, DocumentVersion] = {}

    def _compute_file_hash(self, file_path: Path) -> str:
        """
@@ -96,7 +94,7 @@ class IncrementalUpdater:
            print(f"⚠️  Warning: Failed to hash {file_path}: {e}")
            return ""

-    def _scan_documents(self) -> Dict[str, DocumentVersion]:
+    def _scan_documents(self) -> dict[str, DocumentVersion]:
        """
        Scan skill directory and build version map.

@@ -356,7 +354,7 @@ class IncrementalUpdater:

                    # Read current content
                    current_path = self.skill_dir / doc.file_path
-                    current_content = current_path.read_text(encoding="utf-8").splitlines()
+                    current_path.read_text(encoding="utf-8").splitlines()

                    # Generate diff (simplified)
                    lines.append(f"   Size: {prev.size_bytes:,} → {doc.size_bytes:,} bytes")
--- a/src/skill_seekers/cli/multilang_support.py
+++ b/src/skill_seekers/cli/multilang_support.py
@@ -8,9 +8,7 @@ and translation-ready format generation.

 import re
 from pathlib import Path
-from typing import Dict, List, Optional, Set
 from dataclasses import dataclass
-from collections import Counter
 import json


@@ -20,16 +18,16 @@ class LanguageInfo:
    code: str  # ISO 639-1 code (e.g., 'en', 'es', 'zh')
    name: str  # Full name (e.g., 'English', 'Spanish', 'Chinese')
    confidence: float  # Detection confidence (0.0-1.0)
-    script: Optional[str] = None  # Script type (e.g., 'Latin', 'Cyrillic')
+    script: str | None = None  # Script type (e.g., 'Latin', 'Cyrillic')


@dataclass
 class TranslationStatus:
    """Translation status for a document."""
    source_language: str
-    target_languages: List[str]
-    translated_languages: Set[str]
-    missing_languages: Set[str]
+    target_languages: list[str]
+    translated_languages: set[str]
+    missing_languages: set[str]
    completeness: float  # Percentage (0.0-1.0)


@@ -155,7 +153,7 @@ class LanguageDetector:
            script=self.SCRIPTS.get(best_lang)
        )

-    def detect_from_filename(self, filename: str) -> Optional[str]:
+    def detect_from_filename(self, filename: str) -> str | None:
        """
        Detect language from filename pattern.

@@ -194,15 +192,15 @@ class MultiLanguageManager:
    def __init__(self):
        """Initialize multi-language manager."""
        self.detector = LanguageDetector()
-        self.documents: Dict[str, List[Dict]] = {}  # lang_code -> [docs]
-        self.primary_language: Optional[str] = None
+        self.documents: dict[str, list[dict]] = {}  # lang_code -> [docs]
+        self.primary_language: str | None = None

    def add_document(
        self,
        file_path: str,
        content: str,
-        metadata: Optional[Dict] = None,
-        force_language: Optional[str] = None
+        metadata: dict | None = None,
+        force_language: str | None = None
    ) -> None:
        """
        Add document with language detection.
@@ -258,11 +256,11 @@ class MultiLanguageManager:

        self.documents[lang_code].append(doc)

-    def get_languages(self) -> List[str]:
+    def get_languages(self) -> list[str]:
        """Get list of detected languages."""
        return sorted(self.documents.keys())

-    def get_document_count(self, language: Optional[str] = None) -> int:
+    def get_document_count(self, language: str | None = None) -> int:
        """
        Get document count for a language.

@@ -276,7 +274,7 @@ class MultiLanguageManager:
            return len(self.documents.get(language, []))
        return sum(len(docs) for docs in self.documents.values())

-    def get_translation_status(self, base_language: Optional[str] = None) -> TranslationStatus:
+    def get_translation_status(self, base_language: str | None = None) -> TranslationStatus:
        """
        Get translation status.

@@ -320,7 +318,7 @@ class MultiLanguageManager:
            completeness=min(completeness, 1.0)
        )

-    def export_by_language(self, output_dir: Path) -> Dict[str, Path]:
+    def export_by_language(self, output_dir: Path) -> dict[str, Path]:
        """
        Export documents organized by language.

--- a/src/skill_seekers/cli/presets.py
+++ b/src/skill_seekers/cli/presets.py
@@ -4,7 +4,6 @@ Provides predefined analysis configurations with clear trade-offs
 between speed and comprehensiveness.
 """
 from dataclasses import dataclass
-from typing import Dict, Optional


@dataclass
@@ -17,7 +16,7 @@ class AnalysisPreset:
    name: str
    description: str
    depth: str  # surface, deep, full
-    features: Dict[str, bool]  # Feature flags (api_reference, patterns, etc.)
+    features: dict[str, bool]  # Feature flags (api_reference, patterns, etc.)
    enhance_level: int  # 0=none, 1=SKILL.md, 2=+Arch+Config, 3=full
    estimated_time: str
    icon: str
@@ -85,7 +84,7 @@ class PresetManager:
    """Manages analysis presets and applies them to CLI arguments."""

    @staticmethod
-    def get_preset(name: str) -> Optional[AnalysisPreset]:
+    def get_preset(name: str) -> AnalysisPreset | None:
        """Get preset by name.

        Args:
--- a/src/skill_seekers/cli/quality_metrics.py
+++ b/src/skill_seekers/cli/quality_metrics.py
@@ -8,7 +8,7 @@ Tracks completeness, accuracy, coverage, and health metrics.

 import json
 from pathlib import Path
-from typing import Dict, List, Optional, Any
+from typing import Any
 from dataclasses import dataclass, field, asdict
 from datetime import datetime
 from enum import Enum
@@ -29,7 +29,7 @@ class QualityMetric:
    value: float  # 0.0-1.0 (or 0-100 percentage)
    level: MetricLevel
    description: str
-    suggestions: List[str] = field(default_factory=list)
+    suggestions: list[str] = field(default_factory=list)


@dataclass
@@ -49,10 +49,10 @@ class QualityReport:
    timestamp: str
    skill_name: str
    overall_score: QualityScore
-    metrics: List[QualityMetric]
-    statistics: Dict[str, Any]
-    recommendations: List[str]
-    history: List[Dict[str, Any]] = field(default_factory=list)
+    metrics: list[QualityMetric]
+    statistics: dict[str, Any]
+    recommendations: list[str]
+    history: list[dict[str, Any]] = field(default_factory=list)


 class QualityAnalyzer:
@@ -73,8 +73,8 @@ class QualityAnalyzer:
    def __init__(self, skill_dir: Path):
        """Initialize quality analyzer."""
        self.skill_dir = Path(skill_dir)
-        self.metrics: List[QualityMetric] = []
-        self.statistics: Dict[str, Any] = {}
+        self.metrics: list[QualityMetric] = []
+        self.statistics: dict[str, Any] = {}

    def analyze_completeness(self) -> float:
        """
@@ -192,9 +192,8 @@ class QualityAnalyzer:

        level = MetricLevel.INFO if accuracy >= 80 else MetricLevel.WARNING
        suggestions = []
-        if accuracy < 100:
-            if issues:
-                suggestions.extend(issues[:3])  # Top 3 issues
+        if accuracy < 100 and issues:
+            suggestions.extend(issues[:3])  # Top 3 issues

        self.metrics.append(QualityMetric(
            name="Accuracy",
@@ -319,7 +318,7 @@ class QualityAnalyzer:

        return health

-    def calculate_statistics(self) -> Dict[str, Any]:
+    def calculate_statistics(self) -> dict[str, Any]:
        """Calculate skill statistics."""
        stats = {
            'total_files': 0,
@@ -392,7 +391,7 @@ class QualityAnalyzer:
            grade=grade
        )

-    def generate_recommendations(self, score: QualityScore) -> List[str]:
+    def generate_recommendations(self, score: QualityScore) -> list[str]:
        """Generate improvement recommendations."""
        recommendations = []

@@ -545,10 +544,7 @@ def main():
        print(formatted)

    # Save report
-    if args.output:
-        report_path = Path(args.output)
-    else:
-        report_path = skill_dir / "quality_report.json"
+    report_path = Path(args.output) if args.output else skill_dir / "quality_report.json"

    report_path.write_text(json.dumps(asdict(report), indent=2, default=str))
    print(f"\n✅ Report saved: {report_path}")
--- a/src/skill_seekers/cli/rag_chunker.py
+++ b/src/skill_seekers/cli/rag_chunker.py
@@ -16,7 +16,6 @@ Usage:

 import re
 from pathlib import Path
-from typing import List, Dict, Tuple, Optional
 import json
 import logging

@@ -78,9 +77,9 @@ class RAGChunker:
    def chunk_document(
        self,
        text: str,
-        metadata: Dict,
-        source_file: Optional[str] = None
-    ) -> List[Dict]:
+        metadata: dict,
+        source_file: str | None = None
+    ) -> list[dict]:
        """
        Chunk single document into RAG-ready chunks.

@@ -139,7 +138,7 @@ class RAGChunker:

        return result

-    def chunk_skill(self, skill_dir: Path) -> List[Dict]:
+    def chunk_skill(self, skill_dir: Path) -> list[dict]:
        """
        Chunk entire skill directory.

@@ -154,7 +153,7 @@ class RAGChunker:
        # Chunk main SKILL.md
        skill_md = skill_dir / "SKILL.md"
        if skill_md.exists():
-            with open(skill_md, 'r', encoding='utf-8') as f:
+            with open(skill_md, encoding='utf-8') as f:
                content = f.read()

            metadata = {
@@ -170,7 +169,7 @@ class RAGChunker:
        references_dir = skill_dir / "references"
        if references_dir.exists():
            for ref_file in references_dir.glob("*.md"):
-                with open(ref_file, 'r', encoding='utf-8') as f:
+                with open(ref_file, encoding='utf-8') as f:
                    content = f.read()

                metadata = {
@@ -193,7 +192,7 @@ class RAGChunker:

        return all_chunks

-    def _extract_code_blocks(self, text: str) -> Tuple[str, List[Dict]]:
+    def _extract_code_blocks(self, text: str) -> tuple[str, list[dict]]:
        """
        Extract code blocks and replace with placeholders.

@@ -231,9 +230,9 @@ class RAGChunker:

    def _reinsert_code_blocks(
        self,
-        chunks: List[str],
-        code_blocks: List[Dict]
-    ) -> List[str]:
+        chunks: list[str],
+        code_blocks: list[dict]
+    ) -> list[str]:
        """
        Re-insert code blocks into chunks.

@@ -255,7 +254,7 @@ class RAGChunker:

        return result

-    def _find_semantic_boundaries(self, text: str) -> List[int]:
+    def _find_semantic_boundaries(self, text: str) -> list[int]:
        """
        Find paragraph and section boundaries.

@@ -303,7 +302,7 @@ class RAGChunker:

        return boundaries

-    def _split_with_overlap(self, text: str, boundaries: List[int]) -> List[str]:
+    def _split_with_overlap(self, text: str, boundaries: list[int]) -> list[str]:
        """
        Split text at semantic boundaries with overlap.

@@ -375,7 +374,7 @@ class RAGChunker:

        return chunks

-    def save_chunks(self, chunks: List[Dict], output_path: Path) -> None:
+    def save_chunks(self, chunks: list[dict], output_path: Path) -> None:
        """
        Save chunks to JSON file.

--- a/src/skill_seekers/cli/storage/azure_storage.py
+++ b/src/skill_seekers/cli/storage/azure_storage.py
@@ -4,7 +4,6 @@ Azure Blob Storage adaptor implementation.

 import os
 from pathlib import Path
-from typing import List, Dict, Optional
 from datetime import datetime, timedelta

 try:
@@ -118,7 +117,7 @@ class AzureStorageAdaptor(BaseStorageAdaptor):
        )

    def upload_file(
-        self, local_path: str, remote_path: str, metadata: Optional[Dict[str, str]] = None
+        self, local_path: str, remote_path: str, metadata: dict[str, str] | None = None
    ) -> str:
        """Upload file to Azure Blob Storage."""
        local_file = Path(local_path)
@@ -167,7 +166,7 @@ class AzureStorageAdaptor(BaseStorageAdaptor):

    def list_files(
        self, prefix: str = "", max_results: int = 1000
-    ) -> List[StorageObject]:
+    ) -> list[StorageObject]:
        """List files in Azure container."""
        try:
            blobs = self.container_client.list_blobs(
--- a/src/skill_seekers/cli/storage/base_storage.py
+++ b/src/skill_seekers/cli/storage/base_storage.py
@@ -4,7 +4,6 @@ Base storage adaptor interface for cloud storage providers.

 from abc import ABC, abstractmethod
 from pathlib import Path
-from typing import List, Dict, Optional
 from dataclasses import dataclass


@@ -23,9 +22,9 @@ class StorageObject:

    key: str
    size: int
-    last_modified: Optional[str] = None
-    etag: Optional[str] = None
-    metadata: Optional[Dict[str, str]] = None
+    last_modified: str | None = None
+    etag: str | None = None
+    metadata: dict[str, str] | None = None


 class BaseStorageAdaptor(ABC):
@@ -47,7 +46,7 @@ class BaseStorageAdaptor(ABC):

    @abstractmethod
    def upload_file(
-        self, local_path: str, remote_path: str, metadata: Optional[Dict[str, str]] = None
+        self, local_path: str, remote_path: str, metadata: dict[str, str] | None = None
    ) -> str:
        """
        Upload file to cloud storage.
@@ -98,7 +97,7 @@ class BaseStorageAdaptor(ABC):
    @abstractmethod
    def list_files(
        self, prefix: str = "", max_results: int = 1000
-    ) -> List[StorageObject]:
+    ) -> list[StorageObject]:
        """
        List files in cloud storage.

@@ -146,8 +145,8 @@ class BaseStorageAdaptor(ABC):
        pass

    def upload_directory(
-        self, local_dir: str, remote_prefix: str = "", exclude_patterns: Optional[List[str]] = None
-    ) -> List[str]:
+        self, local_dir: str, remote_prefix: str = "", exclude_patterns: list[str] | None = None
+    ) -> list[str]:
        """
        Upload entire directory to cloud storage.

@@ -194,7 +193,7 @@ class BaseStorageAdaptor(ABC):

    def download_directory(
        self, remote_prefix: str, local_dir: str
-    ) -> List[str]:
+    ) -> list[str]:
        """
        Download directory from cloud storage.

--- a/src/skill_seekers/cli/storage/gcs_storage.py
+++ b/src/skill_seekers/cli/storage/gcs_storage.py
@@ -4,7 +4,6 @@ Google Cloud Storage (GCS) adaptor implementation.

 import os
 from pathlib import Path
-from typing import List, Dict, Optional
 from datetime import timedelta

 try:
@@ -82,7 +81,7 @@ class GCSStorageAdaptor(BaseStorageAdaptor):
        self.bucket = self.storage_client.bucket(self.bucket_name)

    def upload_file(
-        self, local_path: str, remote_path: str, metadata: Optional[Dict[str, str]] = None
+        self, local_path: str, remote_path: str, metadata: dict[str, str] | None = None
    ) -> str:
        """Upload file to GCS."""
        local_file = Path(local_path)
@@ -125,7 +124,7 @@ class GCSStorageAdaptor(BaseStorageAdaptor):

    def list_files(
        self, prefix: str = "", max_results: int = 1000
-    ) -> List[StorageObject]:
+    ) -> list[StorageObject]:
        """List files in GCS bucket."""
        try:
            blobs = self.storage_client.list_blobs(
--- a/src/skill_seekers/cli/storage/s3_storage.py
+++ b/src/skill_seekers/cli/storage/s3_storage.py
@@ -4,7 +4,6 @@ AWS S3 storage adaptor implementation.

 import os
 from pathlib import Path
-from typing import List, Dict, Optional

 try:
    import boto3
@@ -93,7 +92,7 @@ class S3StorageAdaptor(BaseStorageAdaptor):
        self.s3_resource = boto3.resource('s3', **client_kwargs)

    def upload_file(
-        self, local_path: str, remote_path: str, metadata: Optional[Dict[str, str]] = None
+        self, local_path: str, remote_path: str, metadata: dict[str, str] | None = None
    ) -> str:
        """Upload file to S3."""
        local_file = Path(local_path)
@@ -143,7 +142,7 @@ class S3StorageAdaptor(BaseStorageAdaptor):

    def list_files(
        self, prefix: str = "", max_results: int = 1000
-    ) -> List[StorageObject]:
+    ) -> list[StorageObject]:
        """List files in S3 bucket."""
        try:
            paginator = self.s3_client.get_paginator('list_objects_v2')
--- a/src/skill_seekers/cli/streaming_ingest.py
+++ b/src/skill_seekers/cli/streaming_ingest.py
@@ -9,7 +9,7 @@ skill documentation. Handles chunking, progress tracking, and resume functionali
 import json
 import hashlib
 from pathlib import Path
-from typing import Any, Iterator, Optional
+from collections.abc import Iterator
 from dataclasses import dataclass
 import time

@@ -102,8 +102,8 @@ class StreamingIngester:
        self,
        content: str,
        metadata: dict,
-        chunk_size: Optional[int] = None,
-        chunk_overlap: Optional[int] = None
+        chunk_size: int | None = None,
+        chunk_overlap: int | None = None
    ) -> Iterator[tuple[str, ChunkMetadata]]:
        """
        Split document into overlapping chunks.
@@ -180,7 +180,7 @@ class StreamingIngester:
    def stream_skill_directory(
        self,
        skill_dir: Path,
-        callback: Optional[callable] = None
+        callback: callable | None = None
    ) -> Iterator[tuple[str, dict]]:
        """
        Stream all documents from skill directory.
@@ -276,7 +276,7 @@ class StreamingIngester:
    def batch_iterator(
        self,
        chunks: Iterator[tuple[str, dict]],
-        batch_size: Optional[int] = None
+        batch_size: int | None = None
    ) -> Iterator[list[tuple[str, dict]]]:
        """
        Group chunks into batches for efficient processing.
@@ -328,7 +328,7 @@ class StreamingIngester:

        checkpoint_path.write_text(json.dumps(checkpoint_data, indent=2))

-    def load_checkpoint(self, checkpoint_path: Path) -> Optional[dict]:
+    def load_checkpoint(self, checkpoint_path: Path) -> dict | None:
        """
        Load ingestion checkpoint for resume.