数据集(二)|10个领域70+数据集分享,赶紧收藏!原创
金蝶云社区-数据万花筒身份
数据万花筒
8人赞赏了该文章 1,717次浏览 未经作者许可,禁止转载编辑于2022年03月31日 14:09:14
summary-icon摘要由AI智能服务提供

学习数据分析需要实操,但找数据集难。小编整理了商业、消费、住房、体育、植物、天文、推荐系统、预测、文化娱乐及其他等10领域70+数据集,包含在线教育投融、中国工商企业注册、互联网公司数据、出行产品销量预测等,适合各类练习,速收藏。

学习数据分析需要持续进行实操,但很多读者找不到合适的数据集来练手,小编整理了10个领域70+数据集,总有一个是适合你练手的数据集!赶紧收藏点赞吧!



01、商业类数据集


1.在线教育投融数据集(2015-2020年)(513.8KB)

https://www.heywhale.com/mw/dataset/5ec87fddb2aca3003746e28a


2.中国工商企业注册信息数据集(559.4MB)

https://www.heywhale.com/mw/dataset/5cf88a45e727f8002c1e1285


3.8W家中国互联网公司数据(11.3MB)

https://www.heywhale.com/mw/dataset/5ef99d35ff25a1002c1c2641


4.2019年全球七百多万个公司的数据(275.1MB)

https://www.heywhale.com/mw/dataset/5d26a0ea688d36002c589e1d



02、消费类数据集


1.出行产品未来14个月销量预测数据集(61.2MB)


https://www.heywhale.com/mw/dataset/58bf9bb671db03332e1b85f3


2.口红数据集(1006.6KB)

https://www.heywhale.com/mw/dataset/5c8b2204b4536a002bcd18ae


3.黑五购物数据集(23.8MB)

https://www.heywhale.com/mw/dataset/5c6b6ece336a0d002c18b49c


4.去哪儿网—旅游产品机酒数据(1.5MB)

https://www.heywhale.com/mw/dataset/5cbd31e58c90d7002c816f5d/file


5.全球米其林餐厅信息(100KB+)

https://www.heywhale.com/mw/dataset/5d8080158499bc002c0e2790


6.适合顾客尺码推荐的服装适合数据集(150MB)

https://www.heywhale.com/mw/dataset/5d5faeae8499bc002c0650f5


7.淘宝App用户行为(507.3MB)

https://www.heywhale.com/mw/dataset/5d629b988499bc002c07182e/file


8.淘宝用户行为数据集(164.6MB)

https://www.heywhale.com/mw/dataset/5ef7024363975d002c9235d3/file


9.废旧汽车价格预测数据集(611.6KB)

https://www.heywhale.com/mw/dataset/5d4007c3cf76a600362473ea


10.天猫双十一女性美妆的数据集(3.3MB)

https://www.heywhale.com/mw/dataset/5ce889bed10470002b3394c2


11.淘宝云主题点击数据集(1.6GB)

https://www.heywhale.com/mw/dataset/5da83092c83fb400420c3629


12.广告实时竞价数据(455.5MB)

https://www.heywhale.com/mw/dataset/5de09492ca27f8002c4b03bd


13.9万条上海餐饮数据(6.5MB)

https://www.heywhale.com/mw/dataset/5eb6d24d366f4d002d77f8c3/file


14.天猫订单成交【真实】数据(1.8MB)

https://www.heywhale.com/mw/dataset/5eb60cab366f4d002d779163



03、住房类数据集


1.链家二手房数据集(5.1MB)

https://www.heywhale.com/mw/dataset/58acf5acd2445916845b402c


2.携程房型产品用户行为数据集(506.1MB)

https://www.heywhale.com/mw/dataset/58d4e28c84a25f34b1d94906


3.房价预测(103.3KB)

https://www.heywhale.com/mw/dataset/5d809a228499bc002c0e381c/file


4.阿姆斯特丹airbnb数据集(400MB+)

https://www.heywhale.com/mw/dataset/5d8b0b13e3ffb2002c456df3/file


5.纽约Airbnb开放数据(6.8MB)

https://www.heywhale.com/mw/dataset/5d66333b8499bc002c08619a


6.房价预测(103.3KB)

https://www.heywhale.com/mw/dataset/5d809a228499bc002c0e381c/file




04、体育类数据集


1.NBA数据集(62.3+MB)

https://www.heywhale.com/mw/dataset/599a6e66c8d2787da4d1e21d


2.欧洲足球联赛数据集(172.8MB)

https://www.heywhale.com/mw/dataset/5a5d78701badff1e49553679


3.2015-2018MLB棒球常规赛数据集(322.7MB)

https://www.heywhale.com/mw/dataset/5d521a3ac143cf002b21ec27


4.120年奥运历史数据集:运动员和成绩(39.6MB)

https://www.heywhale.com/mw/dataset/5b62ca77a711e60010ab1154


5.科比生涯数据集(5.8MB)

https://www.heywhale.com/mw/dataset/5e3a2a34b8c462002d66a81d


6.NFL大数据可视化(100.8KB)

https://www.heywhale.com/mw/dataset/5ffbecb43441fd00153973e5



05、植物类数据集


1.蘑菇分类数据集(UCIMachine Learning)(365.2KB)

https://www.heywhale.com/mw/dataset/5a4c87653616537d65c7cdcc


2.iris鸢尾花数据集(4.1KB)

https://www.heywhale.com/mw/dataset/58a942bc7159a710d916af11


3.土壤湿度的高光谱基准数据集(1.6MB)

https://www.heywhale.com/mw/dataset/5cd927fe0ee9cd002ccadc53



4.小麦种子数据集(9.1KB)

https://www.heywhale.com/mw/dataset/5d79f0d68499bc002c0cffaa


5.100种植物种类数据集(35.1MB)

https://www.heywhale.com/mw/dataset/5d5a35f7c143cf002b23fbe7



06、天文类数据集


1.不明飞行物世纪报告(14.6MB)

https://www.heywhale.com/mw/dataset/5c385c06a105ec002c9bf6fc


2.开普勒望远镜所标注的时间序列数据集(27.6MB)

https://www.heywhale.com/mw/dataset/5a72c5eccec86121fb01aff9



07、推荐系统数据集

1.资讯内容用户行为数据集(153.3MB)


https://www.heywhale.com/mw/dataset/590a9b28812ede32b73ee412


2.Book Crossing 推荐系统数据(24.9MB)

https://www.heywhale.com/mw/dataset/5dd78542f41512002ceb25f3


3.Jester 推荐系统数据(4MB)

https://www.heywhale.com/mw/dataset/5dd79aedf41512002ceb3a4d



08、预测类数据集


1.人力资源分析数据集(121.5KB)

https://www.heywhale.com/mw/dataset/5a1fa61ed0178b641c3fa93c


2.申请大学的成功率预测数据集(12.6KB)

https://www.heywhale.com/mw/dataset/5d46929ac143cf002be5b579


3.用户点击预测数据集(516.8MB)

https://www.heywhale.com/mw/dataset/5dddf2a3ca27f8002c4a6483


4.Netflix Price 竞赛数据集(665.7MB)

https://www.heywhale.com/mw/dataset/5dd7837ff41512002ceb24ab



09、文化娱乐类数据集


1.170K+首Spotify歌曲数据集(30+MB)

https://www.heywhale.com/mw/dataset/5ffd443e3441fd00153b17b9


2.TMDB 5000部电影数据集(40MB+)

https://www.heywhale.com/mw/dataset/5daea88575df5c002b212240


3.Disney华特迪士尼电影数据集(181.2KB)

https://www.heywhale.com/mw/dataset/600150ca7ed5ab0015ed911d



10、其他数据集


1.2017年-2018年关于申根签证的数据集

https://www.heywhale.com/mw/dataset/5d663fb38499bc002c086af9


2.垃圾分类数据(49.3KB)

https://www.heywhale.com/mw/dataset/5d2be1cd688d36002c5a8519


3.二战空袭数据集(27.2MB)

https://www.heywhale.com/mw/dataset/5cbe8f628c90d7002c8217c3


4.拉勾网上海数据分析师职位数据(497.4KB)

https://www.heywhale.com/mw/dataset/5d6b64648499bc002c09942c/file


5.濒危语言统计(736.7KB)

https://www.heywhale.com/mw/dataset/5d273aef688d36002c5932ee


6.CNNVD中国信息安全漏洞数据库

https://www.heywhale.com/mw/dataset/5d81a3088499bc002c0e7642


7.个人睡眠数据(66.1KB)

https://www.heywhale.com/mw/dataset/5d77512e8499bc002c0c55f5


8.2019年世界幸福报告(6.7KB)

https://www.heywhale.com/mw/dataset/5d91aa61037db3002d3b5d53


9.鲍鱼数据集(187.5KB)

https://www.heywhale.com/mw/dataset/5d10447138dc33002bcc050d


10.鱼类毒性数据集(30.5KB)

https://www.heywhale.com/mw/dataset/5da990b9c83fb400420fcf3e


11.人口普查收入数据集(UCI)(3.4MB)

https://www.heywhale.com/mw/dataset/5a336819da263370ab5f29f3


12.足球运动员数据集(3.7MB)

https://www.heywhale.com/mw/dataset/5e79c46b98d4a8002d2cb73c


13.全球各国人口数据数据集(1.9MB)

https://www.heywhale.com/mw/dataset/5eef1709caa99b002d6e3c06






延伸阅读:

【1】数据分析师如何构建数据指标体系?理解以下四个模型就够了!

https://vip.kingdee.com/article/296943831369590016


【2】数据分析师如何正确的提建议?

https://vip.kingdee.com/article/296937594120846336


【3】数据集|7个领域70+数据集分享,赶紧收藏!

https://vip.kingdee.com/article/297370766855467520


【4】数据集(三)|人工智能领域100+数据集分享,赶紧收藏!

https://vip.kingdee.com/article/297367760646876416




来源:微信公众号【数据万花筒】

发布于 数据智能 社群

图标赞 8
8人点赞
还没有人点赞,快来当第一个点赞的人吧!
图标打赏
0人打赏
还没有人打赏,快来当第一个打赏的人吧!