ICode9

精准搜索请尝试: 精确搜索
  • Kaggle竞赛入门:决策树算法的Python实现2020-04-03 18:56:06

    本文翻译自kaggle learn,也就是kaggle官方最快入门kaggle竞赛的教程,强调python编程实践和数学思想(而没有涉及数学细节),笔者在不影响算法和程序理解的基础上删除了一些不必要的废话,毕竟英文有的时候比较啰嗦。 一.决策树算法基本原理 背景:假设你的哥哥是一个投资房地产的大佬,投资地产

  • pytorch实战 猫狗大战Kaggle 迁移学习ResNet50模型微调2020-03-04 23:55:45

    pytorch实战 猫狗大战Kaggle 迁移学习ResNet50模型微调 猫狗大战数据集 这是kaggle上一个非常经典的二分类图像数据集,训练集包括25000张猫和狗的图片及其标签,测试集则是12500张未标签图片,数据下载地址https://www.kaggle.com/c/dogs-vs-cats/data。不过这个网址比较远古,无法提交

  • 数据分析之KAGGLE-泰坦尼克号人员生存预测问题2020-03-03 18:02:14

    本文参考 handsye https://blog.csdn.net/handsye/article/details/83999641 对部分内容进行了修正和整理 数据分析之KAGGLE-泰坦尼克号人员生存预测问题 分析目的 完成对什么样的人可能生存的分析。 # 导入相关数据包 import numpy as np import pandas as pd import seaborn as

  • kaggle上传数据集遇到Default slug detected, please change values before uploading2020-02-27 21:36:31

    解决方法: If you created a default config file like this:kaggle datasets init -p mydataset then you need to edit the file mydataset/dataset-metadata.json. In Linux this could be done as follows:nano mydataset/dataset-metadata.json Change the id and the tit

  • kaggle——TMDB 电影票房收入预测2020-02-25 11:57:01

    介绍 看电影是目前人们休闲娱乐,消遣时光的选择之一。我们都知道,有些电影的票房很高,有的电影票房却很低,那么决定票房的因素是什么呢?本次将介绍,如何根据电影上映前的一些信息来预测出该电影的票房。 知识点 数据预处理 建立预测模型 电影票房预测介绍 电影产业在 2018 年估计达到

  • 比赛教程-如何参加Kaggle数据科学比赛(上)2020-02-07 09:52:03

    引言:上篇Kagging金大叔的数据科学之路(一)提到我加入Kaggle3个月又27天,拿下两枚银牌成为Expert,全球排名Top2.5%。今天来撸一撸如何Kaggle比赛。(为什么要参加Kaggle比赛,再作探讨#TODO#) 万物皆数据,数据科学正在改变世界。说到数据科学就绕不开Kaggle-Google旗下全球最大的数据科学

  • kaggle竞赛-Instacart Market Basket Analysis(推荐)-特征工程2020-01-31 18:35:53

    紧接上次的分析初探,进行进一步特征工程的详细分析。 1.数据准备 1.1导入工具包 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import lightgbm as lgb import gc %matplotlib inline 1.2导入数据 path = '/home/WLY/lea

  • 我的第一个 Kaggle 比赛学习 - Titanic2020-01-25 13:56:00

    背景 Titanic: Machine Learning from Disaster - Kaggle 2 年前就被推荐照着这个比赛做一下,结果我打开这个页面便蒙了,完全不知道该如何下手。 两年后,再次打开这个页面,看到清清楚楚的Titanic Tutorial - Kaggle,完全傻瓜式的照着做就能做下来。当年是什么蒙蔽了我的眼睛~ Target us

  • kaggle初探之titanic2020-01-21 11:50:50

    环境部署 环境部署需要安装python,这里已经配置好,略过 首先登陆kaggle 下载titanic数据 https://www.kaggle.com/c/titanic/data 点击Download ALL 查看数据 gender test.csv train.csv 开始建模 import pandas as pdimport osfrom sklearn.feature_extraction import D

  • 跟Kaggle做泰坦尼克乘客生存分析2020-01-15 12:37:27

      参照kaggle来学习Python数据分析的思路和方法:https://www.kaggle.com/startupsci/titanic-data-science-solutions 中间夹杂了一些微专业视频中的图表,完全跟做下来,其实对如何认识数据、清洗数据有了初步的认识。虽然看的时候感觉不难,但照着敲代码还是有很多细微的错误,主要还

  • kaggle notebook中免密码进行push2019-10-27 19:07:02

    下面的都是都是kaggle notebook中运行的。 运行下面的代码: !rm -r /kaggle/working/RSNA_MODEL !git clone https://github.com/appleyuchi/RSNA_MODEL !git config --global user.email appleyuchi@163.com !git config --global user.name appleyuchi !git config --global

  • ARIMA例子以及代码实现2019-10-15 21:52:40

    摘自kaggle一道题目。Web traffic。链接: https://www.kaggle.com/mohitguptaomg/simple-forecast-with-ar-ma-arima 一、背景 维基百科的每一个主题每一天都有一个浏览量。给定了每一个主题历史的浏览数目,让你预测一下未来这个主题浏览数目。     二、 步骤 检查数据平稳性 使

  • 中文自动转SQL刷新纪录,Kaggle大师带队拿下NL2SQL挑战赛冠军2019-10-14 22:01:19

    郭一璞 发自 南大仙林 量子位 报道 | 公众号 QbitAI 在追一科技主办的首届中文NL2SQL挑战赛上,又一项超越国外水平的NLP研究成果诞生了。 在NL2SQL这项任务上,比赛中的最佳成绩达到了92.19%的准确率,超过英文NL2SQL数据集WikiSQL目前完全匹配精度86.0%,执行匹配精度91.8%的最高成绩。

  • Kaggle: House Prices: Advanced Regression Techniques2019-09-22 11:01:18

    Kaggle: House Prices: Advanced Regression Techniques notebook来自https://www.kaggle.com/neviadomski/how-to-get-to-top-25-with-simple-model-sklearn 思路流程: 1.导入数据,查看数据结构和缺失值情况重点在于查看缺失值情况的写法:NAs = pd.concat([train.isnull().sum()

  • kaggle 猫狗数据集二分类 系列(2)采用数据增强再次训练2019-09-16 21:39:52

    系列(1)构建模型进行二分类,保存模型,画出走势图 系列(2)采用数据增强再次训练 系列(3)采用预训练网络再次训练 系列(4)使用神经网络可视化 去看网络中间层提取的特征是什么样子

  • kaggle 猫狗数据集二分类 系列(3)采用预训练网络再次训练2019-09-16 21:37:35

    系列(1)构建模型进行二分类,保存模型,画出走势图 系列(2)采用数据增强再次训练 系列(3)采用预训练网络再次训练 系列(4)使用神经网络可视化 去看网络中间层提取的特征是什么样子

  • kaggle 猫狗数据集二分类 系列(4)使用神经网络可视化 去看网络中间层提取的特征是什么样子2019-09-16 21:37:09

    系列(1)构建模型进行二分类,保存模型,画出走势图 系列(2)采用数据增强再次训练 系列(3)采用预训练网络再次训练 系列(4)使用神经网络可视化 去看网络中间层提取的特征是什么样子

  • 【python练习】在kaggle上的首个公开notebook(由mask生成bbox)2019-09-16 20:04:23

    前言: {     知道要更新但没想好写什么,我就干脆在kaggle上写了一篇公开的notebook[1](我记得原来好像叫kernel),内容很简单,就是根据segmentation标签生成bbox。 }   正文: {     主要内容在[1]。我做这个是因为我搞错了。我本想试试之前我博客[2]提到的HRNet,而恰好mmdetection

  • kaggle 房价预测比赛项目(一):数据处理,特征选择2019-09-12 17:42:46

    房价预测是 kaggle 上的入门比赛,总的来说就是给你 79 个关于房价的特征,然后根据特征预测房价。房价预测的评价指标是均方根误差(RMSE),即: 1. 数据探索性分析 首先使用 pandas 模块读取数据 import pandas as pd train = pd.read_csv("train.csv") test = pd.read_csv("t

  • kaggle 房价预测比赛项目(二):使用集成学习方法提高排名2019-09-12 17:42:18

    集成学习 使用单个模型进行预测还不能达到最好的效果,因此考虑使用集成学习的方法来进一步减小误差。 集成学习就是不同模型的堆叠与集成,并且选择最优参数 以下集成学习中会用到 13 个模型,首先导入需要用到的包: from sklearn.model_selection import cross_val_score, GridS

  • kaggle之Digit Recognizer2019-09-11 10:00:52

    文章目录model的建立数据的预处理以及数据增强训练完后模型的评测总结     没有数据的预先处理,也没有没有数据增强,直接上神经网络训练然后测试,虽然准确率大致为0.97,但是排名为两千多名。之后在评论区找到一个评价较好且预测准确率较高的笔记参考下,还是有很多不足。一是

  • Python深度学习之搭建小型卷积神经网络(Kaggle网站Dogs-vs-Cats数据集)2019-09-01 21:03:32

    完全来源与《Python深度学习》中的例子,仅供学习只用。 Cats vs. Dogs(猫狗大战)是Kaggle大数据竞赛的数据集,数据集由训练数据和测试数据组成,训练数据包含猫和狗各12500张图片,测试数据包含12500张猫和狗的图片。 我们取Cats vs. Dogs数据集中的2000个测试,1000验证,1000个测试,其中

  • kaggle华人grandmaster列表(转)2019-08-20 14:39:54

    原文链接:https://www.kaggle.com/h4211819/grandmaster/data name url_profile highest rank current rank gold count city bestfitting https://www.kaggle.com/bestfitting 1 1 20 Changsha Guanshuo Xu https://www.kaggle.com/wowfattie 7 9 8 Kear

  • Kaggle比赛(一)Titanic: Machine Learning from Disaster2019-08-19 22:03:01

    泰坦尼克号幸存预测是本小白接触的第一个Kaggle入门比赛,主要参考了以下两篇教程: https://www.cnblogs.com/star-zhao/p/9801196.html https://zhuanlan.zhihu.com/p/30538352 本模型在Leaderboard上的最高得分为0.79904,排名前13%。 由于这个比赛做得比较早了,当时很多分析的细节

  • 【实战】kaggle猫狗大战-卷积神经网络实现猫狗识别2019-08-12 16:42:43

    卷积神经网络:猫狗识别 目录 第一步:导入数据集 第二步:数据预处理 第三步:迁移学习 第四步:模型保存 第五步:模型融合 第一步:导入数据集 kaggle猫狗大战数据集地址:kaggle # 将kaggle的数据集直接下载到codelab中 !pip install -U -q kaggle !mkdir -p ~/.kaggle !echo '{"us

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有