YoungBlog
  • 首页
  • 归档

对数据科学实验的思考

发表于 2020-10-22   |   分类于 2020   |   阅读次数 74

从本周的一位同学的分享开始

他分享的是一系列特征有关的实验,末尾是QA环节,实验质量(实验方式,实验结果的分析)被多个角度质疑,显而易见,他的实验结果大家很难认可了。无论是他个人的时间花费,还是这次分享的质量,都有些苍白。

最近某项目小组,在一个调优目标上,多位同学参与,短时间内也做......

阅读全文 »

kaggle | quickdraw-doodle-recognition top 6%

发表于 2018-12-07   |   分类于 2018   |   阅读次数 1340

前言

这次是google举办的一个“你画我猜”的题目,题目链接:kaggle - quickdraw-doodle-recognition。给的数据是游戏玩家在屏幕上画画的每一笔的坐标起始位置,然后让训练模型来猜出这幅画是画的什么,4900万张画,340个category。我记得微信上有个小游戏就......

阅读全文 »

kaggle | Machine Learning for Insights Challenge

发表于 2018-09-25   |   分类于 2018   |   阅读次数 5423

前言

最近比较忙,这次不是比赛分享了,是来分享一个“挑战”,kaggle上用词说是Challenge,在我理解这个是某专家管理员建立了一个简短的course,介绍了某主题的玩法,然后让大家做做简单的练习,一起讨论交流一下。

这次学习的是一个关于模型洞察力的主题,原文链接https://ww......

阅读全文 »

kaggle | avito-demand-prediction top 10%

发表于 2018-06-29   |   分类于 2018   |   阅读次数 1115

题目链接:kaggle, avito是一家俄罗斯公司,从网站上来看是一个线上购物平台,这一次题目的目标,就是预测某一个商品在某一天被售出的概率,给定的数据有一段时间内的商品的销售情况(数量,价格,地区,品类,商品的全面俄文描述,商品的图片)等信息。

我的kaggle账号:https://ww......

阅读全文 »

kaggle | talkingdata-adtracking-fraud-detection top 4%

发表于 2018-05-09   |   分类于 2018   |   阅读次数 1451

题目链接:kaggle, talkingdata是一家中国公司,我将其理解成一个第三方的移动数据平台,移动端的广告分发是其一个重要业务,其中会出现一些恶意的点击,这个比赛的意义在于:他们想要通过机器学习的方式抓出其中的欺诈类型的点击。

我的kaggle账号:https://www.kaggl......

阅读全文 »

记近两天调优图像训练的过程

发表于 2018-03-30   |   分类于 2018   |   阅读次数 1154

起因

拿来小伙伴的代码,数据预处理阶段程序就跪了,找了找原因,内存用完了。要来他的top命令截图一看,呵呵,0.2t,小伙伴用的学校实验室的最好的机器,256GB的内存,玩起来当然没所谓,我用的公司的机器就略微寒酸了,内存32GB。我这个要玩的话,只能分批次读入图片,处理。

what i......

阅读全文 »

kaggle | sp-society-camera-model-identification 看图认相机

发表于 2018-02-24   |   分类于 2018   |   阅读次数 735

此题目标为根据照片来判断牌照相机的型号

这件事情的原理是:每一家设备都有自己的数字图像处理算法,总会有属于自己的图像特征

这件事情的意义在于:警察破案,图片是否有被软件修改等等

我的kaggle账号:https://www.kaggle.com/yyqing/competit......

阅读全文 »

kaggle | Expert成就达成 社区top1000成就达成

发表于 2018-02-10   |   分类于 2018   |   阅读次数 724

Congrats!

我的kaggle ID: https://www.kaggle.com/yyqing

半年之前转到机器学习方向时,给自己订的目标是在kaggle比赛获得两枚铜牌,就可以kaggle expert称号了。彼时kaggle上的grand master + master......

阅读全文 »

kaggle | statoil-iceberg-classifier-challenge 捡到铜牌一个

发表于 2018-01-25   |   分类于 2018   |   阅读次数 782

此题目标为识别图像中是否有冰山,数据图像均为卫星拍摄海面获得

我的kaggle账号:https://www.kaggle.com/yyqing/competitions

0 自评

第一次开始尝试图像的题目,和普通回归类的题目还真是不一样,除了修改一些别人的模型看得懂别人模型之外,自己还......

阅读全文 »

kaggle | favorita-grocery-sales-forecasting

发表于 2018-01-17   |   分类于 2018   |   阅读次数 962

我的kaggle账号:https://www.kaggle.com/yyqing/competitions

输入数据为某连锁商店的各个店铺各个商品的销量,预测接下来16天的个店铺的各个商品的销量

在Public LB做到了3%,等privateLB出来之后,掉到了6%,发现提交历史记......

阅读全文 »
1 2 3 >
103 日志
8 分类
173 标签
RSS
Zhihu Twitter Facebook Github
©2021
Powered By - Bitcron
Theme - NexT