20 Newsgroups数据

网友投稿 1268 2022-10-09

20 Newsgroups数据集

20 Newsgroups数据集

原文:

The 20 Newsgroups data set is a collection of approximately 20,000 newsgroup documents, partitioned (nearly) evenly across 20 different newsgroups. To the best of my knowledge, it was originally collected by Ken Lang, probably for his Newsweeder: Learning to filter netnews paper, though he does not explicitly mention this collection. The 20 newsgroups collection has become a popular data set for experiments in text applications of machine learning techniques, such as text classification and text clustering.

译:

20个新闻组数据集是大约20000个新闻组文档的集合,几乎均匀地分布在20个不同的新闻组中。据我所知,它最初是由Ken Lang收集的,可能是为了他的Newsweeder:Learning To filter netnews paper,尽管他没有明确提到这一系列。20个新闻组集合已经成为机器学习技术(如文本分类和文本聚类)文本应用实验的流行数据集。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:微信小程序-移动端商城(微信商城是微信小程序吗)
下一篇:在微信小程序中使用 CHCharts(在微信小程序中使用了更加安全的https协议)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~