Using Cross-Encoders as Reranker in Multistage Vector Search

Laura Ham (Weaviate) explains the bi-encoder / cross-encoder tradeoff and how to combine them in a two-stage pipeline.

Bi-Encoders

Encode query and documents independently into dense vectors
Similarity = cosine/dot product between pre-computed vectors
Fast (ANN lookup at query time, embeddings pre-computed at index time)
Less accurate — query context doesn’t inform document encoding

Cross-Encoders

Take (query, document) pair as input; output a relevance score 0-1
Full attention over both texts together — much more accurate
Cannot be pre-computed — must run at query time for every candidate
Slow — impractical to run against millions of documents

Two-Stage Pipeline (The Fisherman Analogy)

All documents
    → Bi-encoder ANN → top-k candidates (fast, high recall)
        → Cross-encoder reranker → top-n results (slow, high precision)

Step 1 trades some precision for speed. Step 2 recovers precision on the small candidate set.

Pre-trained Models

Available on HuggingFace under cross-encoder/ namespace. MS MARCO-trained models work well for general natural language search. Fine-tune for out-of-domain data.

Key Takeaway

Bi-encoders are the right choice for large-scale retrieval; cross-encoders are the right choice for precision reranking of a small candidate set. Combining them gets both at scale.

Cross-Encoder · Bi-Encoder · Dense Vector Retrieval · Retrieval Pipeline

Awesome Search KG

Explorer

Using Cross-Encoders as Reranker in Multistage Vector Search

Using Cross-Encoders as Reranker in Multistage Vector Search

Bi-Encoders

Cross-Encoders

Two-Stage Pipeline (The Fisherman Analogy)

Pre-trained Models

Key Takeaway

Graph View

Table of Contents

Backlinks

Awesome Search KG

Explorer

Using Cross-Encoders as Reranker in Multistage Vector Search

Using Cross-Encoders as Reranker in Multistage Vector Search

Bi-Encoders

Cross-Encoders

Two-Stage Pipeline (The Fisherman Analogy)

Pre-trained Models

Key Takeaway

Related Concepts

Graph View

Table of Contents

Backlinks