除了Kaggle,这里还有一些高质量的数据科学竞赛平台-程序员宅基地

技术标签: 算法  python  机器学习  编程语言  大数据  

选自 towardsdatascience

者: Parul Pande

机器之心编译

参与:李诗萌、王淑婷

除了大名鼎鼎的 kaggle,数据科学家可以参加的数据竞赛平台其实还蛮多的。有些比赛平台不仅提供比赛,还让你有机会自己创办比赛。有些比赛由公司赞助,有些由政府机构赞助。参加这些比赛不仅能让你的能力获得认可,还可以获得一些不菲的奖金呢~

在听了上百节慕课(MOOC)、看了上千本书和笔记、聆听了上百万人对数据科学的看法后,你会做什么呢?你要开始应用这些概念啦。应用机器学习概念的唯一方法就是亲自动手。你可以在感兴趣的领域选一些现实问题,也可以参加编程马拉松(Hackathon)和机器学习竞赛。

数据科学比赛不仅是算法的应用。从本质上讲算法是一种工具,任何人都可以写几行代码来使用它。参加这些比赛的主要原因是它们能提供很好的学习机会。当然,竞赛中的问题和现实问题不一定一样,但这些平台可以让你将学到的知识付诸实践,还能让你了解自己和他人的差距。

参加数据科学比赛的好处

参加这些比赛可以说是有百利而无一害。它里里外外的好处有很多,比如:

  • 这是一个学习的好机会;

  • 可以接触当前最佳的方法和数据集;

  • 可以和志同道合的人交往,团队合作很棒的地方在于可以从不同角度思考问题;

  • 可以向世界展现你的才华,从而获得更好的就职机会;

  • 参与并了解自己在排行榜上的表现也很好玩;

  • 还有奖品作为额外福利,但不应把它作为唯一的标准。

2009 年 9 月 18 日,BellKor Pragmatic Chaos 团队在决赛中获胜,正式赢得 NetFlix 的比赛。

Kaggle 是很有名的数据科学竞赛平台。这个在线社区有 10 万多注册用户,这些用户有新手也有专家。但除了 Kaggle,还有一些其它值得了解和研究的数据挖掘竞赛平台。

Driven Data

Driven Data 举办数据科学竞赛的目的是要建设更美好的世界,用最先进的预测模型来解决世界上最棘手的问题。Driven Data 在国际发展、医疗、教育、研究和保护以及公共服务等领域举办数据科学竞赛,以谋求社会利益。你既可以参加平台上的竞赛,也可以通过该平台举办自己的竞赛。

该网站有专门的示例项目部分,这部分以案例研究的形式展示了一些成功的项目。Driven Data 列出的数据集都与一些非营利组织相关,数据从野生动物保护到公共卫生都有。因此,如果你想将自己的技能应用于实际问题,那这个平台简直就是为你而建的。

  • Driven Data:https://www.drivendata.org/

  • 参加比赛:https://www.drivendata.org/competitions/

  • 组织比赛:https://www.drivendata.org/partners/

  • 示例项目:http://drivendata.co/projects.html

CrowdANALYTIX

CrowdANALYTIX 是一个众包分析平台,该平台将商业上的挑战和问题转换成竞赛题目。CroudANALYTIX 社区通过合作与竞争的方式来构建和优化 AI、ML、NLP 和 深度学习算法。该平台还有社区博客,其中有包括访谈和参考资料在内的大量资源。

  • CrowdANALYTIX:https://www.crowdanalytix.com/community

  • Community Blog:https://www.crowdanalytix.com/jq/communityBlog/listBlog.html

Innocentive

InnoCentive 的重点在生命科学上,但也有其它有趣的竞赛主题。参赛者可以参与解决一些世界上最紧迫的问题——从促进家用净水供应到旨在吸引和杀死携带疟疾的蚊子的被动式太阳能装置。挑战是真正的问题,它需要持续集中注意力、批判性思维、研究、创造力以及综合性知识。开发出解决方案就是最大的奖励,在这个过程中还可以进行无与伦比的脑力锻炼。

InnoCentive:https://www.innocentive.com/our-solvers/

TunedIT

TuneIT 最初是华沙大学(University of Warsaw)的一个理科博士项目,其目的是帮助数据挖掘科学家进行可重复的实验并轻松评估数据驱动算法。后来出于教育、科研以及商业目的,补充了用于举办数据竞赛的 TunedIT Challenges 平台。

  • TunedIT:http://tunedit.org/

  • TunedIT Challenges:http://tunedit.org/challenges

Codalab

Codalab 是一个基于 web 端的开源平台,平台上的研究人员、开发人员以及数据科学家互相合作,以推进使用机器学习和高级计算的研究领域的发展。CodaLab 通过其在线社区解决数据导向研究领域的很多常见问题,人们可以在该社区共享 worksheets 并参与竞赛。你既可以参加现有竞赛,也可以举办新的竞赛。

CodaLab:https://competitions.codalab.org/

Analytics Vidhya

Analytics Vidhya 除了为分析和数据科学专业人士提供了基于社区的知识门户,还提供了大量数据科学的学习资源。该平台还会举办编程马拉松,通过竞赛形式解决真实的行业问题。你既可以参加竞赛,也可以赞助编程马拉松。大多数在 Analytics Vidhya 上组织编程马拉松的公司,都会给表现优异的参赛者提供很好的工作机会。

Analytics Vidhya:https://datahack.analyticsvidhya.com/?utm_source=main-logo

CrowdAI

数据科学挑战平台 crowdAI 每年都会举办很多开放的数据科学挑战赛。这些比赛覆盖了图像分类、文本识别、强化学习、对抗攻击、图像分割、资源配置优化等多个领域。2017 年亚马逊和英伟达赞助的竞赛叫做「Learning to Run」,奖金高达 10 万多美元。

  • crowdAI:https://www.crowdai.org/challenges

  • Learning to Run:https://www.crowdai.org/challenges/nips-2017-learning-to-run

Numerai

Numerai 是由众多数据科学家建立的、AI 运营的众包对冲基金平台。该平台每周都会举办数据科学竞赛以支持真正的对冲基金。Numerai 每周给参赛者提供加密数据,然后参赛者们提交其预测值。之后 Numerai 会根据所有提交结果构建元模型,并进行投资。

数据科学家们提交自己的预测值来换取一些 Numeraire,这是一种以太坊区块链上的加密货币。

Numerai:https://numer.ai/rounds

天池

天池是阿里云创建的数据竞赛平台,它和 Kaggle 很像。该社区中有成千上万互相合作的数据科学家,他们还可以在该平台中联系全球的企业和政府,以解决各行业中最棘手的问题。

天池:https://tianchi.aliyun.com/competition/gameList/activeList

DataScienceChallenge

Data Science Challenges 是由国防科学技术实验室(Dstl)以及包括政府科学办公室(Government Office for Science)、SIS 和 MI5 在内的许多英国政府部门共同赞助举办的,旨在鼓励数据科学领域的优秀人才解决现实问题。该平台提供的两个挑战赛现在已经结束了,但很快就会出现新的问题,这些比赛将鼓励你找出现实问题的非正统答案。

Data Science Challenges:https://www.datasciencechallenge.org/

此外还有一些每年仅举办一次的比赛。

KDD CUP

KDD Cup 是 ACM 的数据挖掘及知识发现专委会(SIGKDD)组织的数据挖掘与知识发现竞赛,该竞赛一年举办一次,是数据挖掘人才的顶级专业盛会。KDD-2019 将于 2019 年 8 月 4 日至 8 月 8 日在美国阿拉斯加州的安克雷奇举行。

KDD-2019:https://www.kdd.org/kdd2019/kdd-cup

VizDoom AI competition(VDAIC)

ViZDoom 是基于 Doom 的 AI 研究平台,通过原始视觉信息进行强化学习。Visual Doom AI 竞赛的参赛者要提交可以玩 Doom 的控制器(C++、Python 或 Java 均可)。

ViZDoom:https://www.crowdai.org/challenges/visual-doom-ai-competition-2018-singleplayer-track-1/leaderboards

结论

尽管这个名单会随着时间推移而有所改变,但你最终会找到自己最感兴趣的比赛。那么,加油吧!

原文链接:https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c

------- End -------

点右下角「在看」与转发

是对我们最大的支持

特别推荐下公众号「价值前瞻」,分享读书、成长和投资思考,欢迎来串门。

回复「书单」 可获取精选书单一份,包括《如何阅读 一本书》、《巴菲特之道》、《金字塔原理》、高瓴张磊的《价值》、《投资最重要的事》、《戴维斯王朝》等书籍的笔记内容或思维导图

价 值 前 瞻

做一个有远见的人

扫码关注,查看更多内容

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/lemonbit/article/details/114109180

智能推荐

分布式光纤传感器的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告_预计2026年中国分布式传感器市场规模有多大-程序员宅基地

文章浏览阅读3.2k次。本文研究全球与中国市场分布式光纤传感器的发展现状及未来发展趋势,分别从生产和消费的角度分析分布式光纤传感器的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不同规格产品的价格、产量、产值及全球和中国市场主要生产商的市场份额。主要生产商包括:FISO TechnologiesBrugg KabelSensor HighwayOmnisensAFL GlobalQinetiQ GroupLockheed MartinOSENSA Innovati_预计2026年中国分布式传感器市场规模有多大

07_08 常用组合逻辑电路结构——为IC设计的延时估计铺垫_基4布斯算法代码-程序员宅基地

文章浏览阅读1.1k次,点赞2次,收藏12次。常用组合逻辑电路结构——为IC设计的延时估计铺垫学习目的:估计模块间的delay,确保写的代码的timing 综合能给到多少HZ,以满足需求!_基4布斯算法代码

OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版-程序员宅基地

文章浏览阅读3.3k次,点赞3次,收藏5次。OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版

关于美国计算机奥赛USACO,你想知道的都在这_usaco可以多次提交吗-程序员宅基地

文章浏览阅读2.2k次。USACO自1992年举办,到目前为止已经举办了27届,目的是为了帮助美国信息学国家队选拔IOI的队员,目前逐渐发展为全球热门的线上赛事,成为美国大学申请条件下,含金量相当高的官方竞赛。USACO的比赛成绩可以助力计算机专业留学,越来越多的学生进入了康奈尔,麻省理工,普林斯顿,哈佛和耶鲁等大学,这些同学的共同点是他们都参加了美国计算机科学竞赛(USACO),并且取得过非常好的成绩。适合参赛人群USACO适合国内在读学生有意向申请美国大学的或者想锻炼自己编程能力的同学,高三学生也可以参加12月的第_usaco可以多次提交吗

MySQL存储过程和自定义函数_mysql自定义函数和存储过程-程序员宅基地

文章浏览阅读394次。1.1 存储程序1.2 创建存储过程1.3 创建自定义函数1.3.1 示例1.4 自定义函数和存储过程的区别1.5 变量的使用1.6 定义条件和处理程序1.6.1 定义条件1.6.1.1 示例1.6.2 定义处理程序1.6.2.1 示例1.7 光标的使用1.7.1 声明光标1.7.2 打开光标1.7.3 使用光标1.7.4 关闭光标1.8 流程控制的使用1.8.1 IF语句1.8.2 CASE语句1.8.3 LOOP语句1.8.4 LEAVE语句1.8.5 ITERATE语句1.8.6 REPEAT语句。_mysql自定义函数和存储过程

半导体基础知识与PN结_本征半导体电流为0-程序员宅基地

文章浏览阅读188次。半导体二极管——集成电路最小组成单元。_本征半导体电流为0

随便推点

【Unity3d Shader】水面和岩浆效果_unity 岩浆shader-程序员宅基地

文章浏览阅读2.8k次,点赞3次,收藏18次。游戏水面特效实现方式太多。咱们这边介绍的是一最简单的UV动画(无顶点位移),整个mesh由4个顶点构成。实现了水面效果(左图),不动代码稍微修改下参数和贴图可以实现岩浆效果(右图)。有要思路是1,uv按时间去做正弦波移动2,在1的基础上加个凹凸图混合uv3,在1、2的基础上加个水流方向4,加上对雾效的支持,如没必要请自行删除雾效代码(把包含fog的几行代码删除)S..._unity 岩浆shader

广义线性模型——Logistic回归模型(1)_广义线性回归模型-程序员宅基地

文章浏览阅读5k次。广义线性模型是线性模型的扩展,它通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。广义线性模型拟合的形式为:其中g(μY)是条件均值的函数(称为连接函数)。另外,你可放松Y为正态分布的假设,改为Y 服从指数分布族中的一种分布即可。设定好连接函数和概率分布后,便可以通过最大似然估计的多次迭代推导出各参数值。在大部分情况下,线性模型就可以通过一系列连续型或类别型预测变量来预测正态分布的响应变量的工作。但是,有时候我们要进行非正态因变量的分析,例如:(1)类别型.._广义线性回归模型

HTML+CSS大作业 环境网页设计与实现(垃圾分类) web前端开发技术 web课程设计 网页规划与设计_垃圾分类网页设计目标怎么写-程序员宅基地

文章浏览阅读69次。环境保护、 保护地球、 校园环保、垃圾分类、绿色家园、等网站的设计与制作。 总结了一些学生网页制作的经验:一般的网页需要融入以下知识点:div+css布局、浮动、定位、高级css、表格、表单及验证、js轮播图、音频 视频 Flash的应用、ul li、下拉导航栏、鼠标划过效果等知识点,网页的风格主题也很全面:如爱好、风景、校园、美食、动漫、游戏、咖啡、音乐、家乡、电影、名人、商城以及个人主页等主题,学生、新手可参考下方页面的布局和设计和HTML源码(有用点赞△) 一套A+的网_垃圾分类网页设计目标怎么写

C# .Net 发布后,把dll全部放在一个文件夹中,让软件目录更整洁_.net dll 全局目录-程序员宅基地

文章浏览阅读614次,点赞7次,收藏11次。之前找到一个修改 exe 中 DLL地址 的方法, 不太好使,虽然能正确启动, 但无法改变 exe 的工作目录,这就影响了.Net 中很多获取 exe 执行目录来拼接的地址 ( 相对路径 ),比如 wwwroot 和 代码中相对目录还有一些复制到目录的普通文件 等等,它们的地址都会指向原来 exe 的目录, 而不是自定义的 “lib” 目录,根本原因就是没有修改 exe 的工作目录这次来搞一个启动程序,把 .net 的所有东西都放在一个文件夹,在文件夹同级的目录制作一个 exe._.net dll 全局目录

BRIEF特征点描述算法_breif description calculation 特征点-程序员宅基地

文章浏览阅读1.5k次。本文为转载,原博客地址:http://blog.csdn.net/hujingshuang/article/details/46910259简介 BRIEF是2010年的一篇名为《BRIEF:Binary Robust Independent Elementary Features》的文章中提出,BRIEF是对已检测到的特征点进行描述,它是一种二进制编码的描述子,摈弃了利用区域灰度..._breif description calculation 特征点

房屋租赁管理系统的设计和实现,SpringBoot计算机毕业设计论文_基于spring boot的房屋租赁系统论文-程序员宅基地

文章浏览阅读4.1k次,点赞21次,收藏79次。本文是《基于SpringBoot的房屋租赁管理系统》的配套原创说明文档,可以给应届毕业生提供格式撰写参考,也可以给开发类似系统的朋友们提供功能业务设计思路。_基于spring boot的房屋租赁系统论文