Skip to content

AutoRAG-Research

Text Datasets

NomaDamas/AutoRAG-Research

AutoRAG-Research

NomaDamas/AutoRAG-Research

Home
Learn
Learn
Tutorial
Tutorial
Datasets
Datasets
- Datasets
- Text
  Text
  - Text Datasets Text Datasets
    Table of contents
    
    Available Datasets
  - BEIR
  - MTEB
  - RAGBench
  - MrTyDi
  - BRIGHT
- Multimodal
  Multimodal
Pipelines
Pipelines
- Pipelines
- Retrieval
  Retrieval
- Generation
  Generation
  - Generation Pipelines
  - BasicRAG
Embeddings
Embeddings
- Embeddings
- Infinity
Rerankers
Rerankers
- Rerankers
- Cohere
- Jina
- VoyageAI
- MixedbreadAI
- RankGPT
- UPR
Metrics
Metrics
- Metrics
- Retrieval
  Retrieval
  - Retrieval Metrics
  - Recall
  - Full Recall
  - Precision
  - F1
  - NDCG
  - MRR
  - MAP
- Generation
  Generation
  - Generation Metrics
  - BLEU
  - METEOR
  - ROUGE
  - BERTScore
  - SemScore
  - Response Relevancy
Plugins
Plugins
Agent Skill
CLI Reference
API Reference
Contributing
Contributing
- Contributing
- Development Setup

Text Datasets¶

Text-based benchmarks for retrieval and RAG evaluation.

Available Datasets¶

Dataset	Description	Generation GT
BEIR	Heterogeneous information retrieval	No
MTEB	Massive Text Embedding Benchmark	No
RAGBench	RAG evaluation benchmark	Yes
MrTyDi	Multilingual retrieval	No
BRIGHT	Reasoning-intensive retrieval	No