Datasets
updated
Viewer
• Updated • 183k • 651
• 295
Viewer
• Updated • 2.94M • 16.4k
• 1.51k
Viewer
• Updated • 1.33k • 1.02k
• 455
Viewer
• Updated • 1M • 16.6k
• 803
databricks/databricks-dolly-15k
Viewer
• Updated • 15k • 23.8k
• 936
togethercomputer/RedPajama-Data-1T
Viewer
• Updated • 1.73M • 2.28k
• 1.14k
Viewer
• Updated • 201k • 113
• 32
Viewer
• Updated • 6.29k • 1.6k
• 6
Viewer
• Updated • 64.3k • 1.51k
• 10
Viewer
• Updated • 9.35M • 744
• 9
Viewer
• Updated • 2.68M • 564
• 4
Viewer
• Updated • 6.87k • 16.1k
• 3
Viewer
• Updated • 4.64M • 265
• 17
Viewer
• Updated • 5.54M • 214
• 3
Viewer
• Updated • 5.33M • 500
• 14
Viewer
• Updated • 538k • 260
• 3
mteb/arxiv-clustering-s2s
Viewer
• Updated • 31 • 3.78k
• 1
Viewer
• Updated • 68.1k • 80
• 10
Viewer
• Updated • 21.4k • 40
• 1
mteb/amazon_reviews_multi
Viewer
• Updated • 2.52M • 1.88k
• 25
Viewer
• Updated • 19.9k • 2.93k
• 17
Updated • 749
• 2
mteb/toxic_conversations_50k
Viewer
• Updated • 100k • 3.22k
• 19
mteb/tweet_sentiment_extraction
Viewer
• Updated • 30.2k • 4.77k
• 37
Viewer
• Updated • 5.34k • 62.4k
• 8
mteb/sts22-crosslingual-sts
Viewer
• Updated • 17.2k • 519k
• 10
Viewer
• Updated • 7.96k • 4.95k
• 2
mteb/stackoverflowdupquestions-reranking
Viewer
• Updated • 22.8k • 706
• 3
reach-vb/jenny_tts_dataset
Viewer
• Updated • 21k • 187
• 33
ai4privacy/pii-masking-200k
Viewer
• Updated • 209k • 3.39k
• 119
ai4privacy/pii-masking-300k
Viewer
• Updated • 225k • 2.63k
• 76
bigcode/bigcode-pii-dataset-training
Viewer
• Updated • 11.9k • 37
• 11
TypicaAI/pii-masking-60k_fr
Viewer
• Updated • 61.9k • 84
• 2
davanstrien/code-prompt-similarity-model
Sentence Similarity
• 0.1B • Updated • 7
• 6
Viewer
• Updated • 2.34M • 840
• 160
Preview
• Updated • 383
• 49
Image-Text-to-Text
• 9B • Updated • 4.87k
• 187