AI 数据集
探索和使用各种高质量的AI数据集
热门数据集
浏览所有数据集
筛选
找到 10 个数据集
中文新闻文本分类数据集
包含100万条中文新闻,分为20个类别
NLP
CC BY-NC
中文
JSON
1,000,000 样本5,000 下载
人脸识别数据集
10万张高清人脸图片,带有年龄、性别等标注
计算机视觉
CC BY
多语言
图像文件
100,000 样本3,000 下载
中英文平行语料库
500万对中英文平行句子,适用于机器翻译
NLP
CC BY-SA
中文/英语
CSV
5,000,000 样本2,000 下载
语音命令识别数据集
包含10种常见语音命令的音频片段
语音识别
MIT
中文
音频文件
50,000 样本1,500 下载
电商用户行为数据
匿名化的用户浏览、点击、购买行为数据
表格数据
CC BY-NC
多语言
Parquet
10,000,000 样本1,000 下载