#datasets

2021-5-12 13:15
几年前,正如美国人口普查局开始为2020年的算法准备,那就面临了存在的问题。 一位越来越多的学术研究提供了证据,即机器学习系统与大型商业数据集的可用性相结合的是关于美国人的大型商业数据集,可以亲自识别来自机密数据集的信息的人们就像人口普查一样。 涉嫌美国人在保证下依靠美国人致力于分享他们的私人信息,他们将不会亲自......
2020-5-31 22:44
我们Lionbridge已经编制了一个包含14个电影数据集的列表。从统计学习的角度来看,电影数据集可能很有用,因为您可以使用它们来掌握基本的机器学习概念,而不是依赖于枯燥、深奥的数据集。 此列表上的许多数据集都包含数据点,如演员和剧组成员、脚本、运行时间和评论。您可以将这些电影数据集用于自然语言处理、情感分析等机器学......
2020-5-16 1:42
🤗自然语言处理是一个轻量级且可扩展的库,可以方便地共享和访问自然语言处理的数据集和评估指标。 致力于大数据集:NLP自然将用户从RAM内存限制中解放出来,默认情况下,所有数据集都是在驱动器上进行内存映射的。 NLP目前提供对约100个NLP数据集和约10个评估指标的访问,旨在让社区轻松添加和共享新的数据集和评估指标。......