Vector Clustering

Discover document groups using HDBSCAN and other algorithms on embedding vectors

Large document collections have hidden structure. Without clustering, you can't discover natural groupings.

AI enables automatic pattern discovery. Manual categorization misses emergent themes.

8 clustering algorithms (HDBSCAN, K-Means, DBSCAN, etc.) with LLM-powered cluster labeling and dimensionality reduction.

How It Works

Vector clustering discovers document groups using embedding similarity.

Optional t-SNE or UMAP for visualization

Apply selected algorithm (HDBSCAN, K-Means, etc.)

LLM generates descriptive cluster labels

Assign cluster IDs to documents

HDBSCAN handles variable density clusters. LLM labeling provides human-readable cluster names.

cluster = client.clusters.create(algorithm="hdbscan", min_cluster_size=5)

Discover taxonomy from clusters

Requires document embeddings