ICode9

精准搜索请尝试: 精确搜索
  • Matplotlib cheatsheet2020-04-25 09:08:47

    很多同学做数学建模都用过matlab,相信都用过matlab的强大可视化功能,非常方便。其实如果采用python语言实现也能实现和matlab一样的可视化效果,而且是免费使用。其中一个有名的可视化库叫Matplotlib(当然还有很多可视化库), 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案

  • Python爬取天气情况2020-04-24 22:55:34

    一.设计方案 爬虫名称:爬取天气情况并进行可视化 爬虫内容:爬取2020年3月份莆田市天气情况 爬虫设计:目标url,获取网页源代码,数据提取,数据保存   二.页面的结构特征分析(网址:http://www.tianqihoubao.com/lishi/putian/month/202003.html)   结构特质分析:源文件为html结构      

  • 2020年当下软件园软件下载总排行榜2020-04-24 19:04:31

    一、主题式网络爬虫设计设计方案 1.爬虫名称:2020年当下软件园软件下载总排行榜。 2.爬取内容:排名、软件类型、软件名称、用户评分、内存大小、评级。 3.爬虫设计方案概述:       (1)思路:找到要爬取的网页,按F12查看网页代码,找到所要爬取的数据及分析标签,导入相应库,然后开始对数据进

  • Seaborn实现回归分析2020-04-24 11:55:00

    import numpy as np import pandas as pd from scipy import stats,integrate import matplotlib.pyplot as plt import seaborn as sns # iris = pd.read_csv("iris.csv") # # 对角线上是单个数据的情况,旁边的图都是关系分布的情况 # sns.pairplot(iris) # plt.show() tips =

  • 爬取哔哩哔哩影视榜单2020-04-23 22:59:39

    博客园 首页 新随笔 联系 订阅 管理 随笔 - 4  文章 - 0  评论 - 0 哔哩哔哩影视榜单   一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:爬取哔哩哔哩影视榜单 2.爬取内容:影片排名,影片标题,影片综合得分 3.网络爬虫设计方案概述:网页内容的选取  对所选取网页进行h

  • 爬取百度热搜榜及数据分析与可视化处理2020-04-23 22:06:56

    一.主题式网络爬虫设计方案 1.主题式 网络爬虫名称:爬取百度热搜排行榜及数据分析与可视化处理 2.主题式网络爬虫爬取的内容:爬取百度热搜排名,标题,热度值 3.方案设计:访问分析百度热搜网页,得到网页源代码,写出查找所需标签的代码,对数据进行相应的分析。提取标签保存到csv文件中,读取文

  • 爬取微博热搜Top25的数据2020-04-23 20:57:13

    一、主题式网络爬虫设计方案1.主题式网络爬虫名称:爬取微博热搜Top25的数据2.爬取微博热搜Top25的内容及其热度3.主题式网络爬虫设计方案概述 先分析网页源代码,设置url地址,利用requests库和lxml来获取网页代码,由此来爬取微博热搜数据并采集;然后对数据进行清洗和处理并可视化 技术难

  • 5.线性回归算法2020-04-22 20:02:37

    1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 (1)有监督:训练数据集必须是有标记,然后通过给定的训练数据和特定的算法去构造一个模型。 无监督:训练数据集没有标记,去寻找训练数据中隐藏的模式或者是对数据进行分组。 (2)线性回归的定义:通过一个或多个自变量

  • python进阶教程:PyTorch快速搭建神经网络及其保存提取方法详解2020-04-22 17:05:51

    @本文来源于公众号:csdn2299,喜欢可以关注公众号 程序员学府 有时候我们训练了一个模型, 希望保存它下次直接使用,不需要下次再花时间去训练 ,本节我们来讲解一下PyTorch快速搭建神经网络及其保存提取方法详解 一、PyTorch快速搭建神经网络方法 先看实验代码: import torch imp

  • 爬取360影视排行榜-总榜2020-04-22 15:53:19

    一、主题式网络爬虫设计方案 1.主题式网络爬虫名称:360影视排行榜-总榜爬取2.主题式网络爬虫爬取的内容:爬取360影视排行榜-总榜的排名、作品名称和昨日指数(前十五)3.主题式网络爬虫设计方案概述: 先确定想要爬取的网页以及内容,用requests库访问页面用get方法获取页面资源,后登陆网页,通

  • python 使用sklearn绘制roc曲线选取合适的分类阈值2020-04-22 15:38:22

    https://zhuanlan.zhihu.com/p/26293316 比如, 我已经初步训练好了一个模型,现在我想用这个模型从海量的无标记数据集挖掘出某一类数据A,并且想要尽量不包含其他所有类B 但我挖掘出的结果必然包含错误的,我拿出的A越多,同时附带的分类错数据B也就越多, 一般,拿出的A占总体比例越大

  • 5.线性回归算法2020-04-22 14:03:56

    1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 这个知识点非常重要,复习了矩阵的相关知识。线性回归都基于矩阵的基础。 损失函数是确定正确的线性方程的重要依据 重点递归下降,是优化方程的最佳途径。 2.思考线性回归算法可以用来做什么?(大家尽量不要

  • 第二讲 神经网络优化--SGD2020-04-21 23:52:04

    #利用鸢尾花数据,实现前向传播、反向传播,可视化loss曲线 #导入所需模块 import tensorflow as tf from sklearn import datasets import matplotlib.pyplot as plt import numpy as np import time #导入数据,分别为输入特征和标签 x_data = datasets.load_iris().data y_data =

  • 广义线性模型--1.1.普通最小二乘法2020-04-21 16:02:49

    1.最小二乘法数学表达式:   使经验函数风险最小化 = 损失函数(平方损失) 2.示例 1 from sklearn import linear_model 2 reg = linear_model.LinearRegression() 3 reg.fit ([[0, 0], [1, 1], [2, 2]], [0, 1, 2]) 4 LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1,

  • bilibili弹幕网视频日排行榜数据分析2020-04-21 14:52:18

    网络爬虫名称:bilibili弹幕网视频日排行榜数据分析 网络爬虫爬取的内容:bilibili弹幕网视频日排行榜 设计方案概述: 实现思路:爬取网站html源代码,通过页面分析得到想要的数据位置,提取数据,之后数据可视化等操作 技术难点: html源码过于杂乱,难以提取数据   首先进行页面分析    通过

  • 5.线性回归算法2020-04-21 11:00:35

    1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)   第一题 ①机器学习分类     ②了解回归算法       ③回归和分类的区别  

  • 机器学习(KNN二)——案例:鸢尾花数据分类2020-04-21 10:02:34

    常见API 这里有我们上篇博客提到的DKTree,还有最基本的KNeighborsClassifier(用于分类) 和 KNeighborsRegressor(用于回归),这里列出常见的参数: 参数 KNeighborsClassifier / KNeighborsRegressor weights 样本权重,可选参数: uniform(等权重)、distance(权重和距离

  • 5.线性回归算法2020-04-21 09:57:27

    1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 回归属于机器学习的监督学习,而回归主要包括线性回归、Logistic回归和回归的评估    回归和分类的区别: 分类和回归的区别在于输出变量的类型(预测的目标函数是否连续)。 定量输出成为回归,或者说是连续变

  • 5.线性回归算法 4/202020-04-20 23:05:38

    1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性  · 我们先了解回归算法:         · 课上老师举了线性回归的应用:①房价预测;②销售额预测;③贷款额度预测;    我们可以发现做线性回归,需要的数据都应该为连续型,最终要预测的因素成为目标值,把

  • 5.线性回归算法2020-04-20 16:52:02

    1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 一.回归算法属于监督学习,线性回归就属于其中一个知识点。 二.线性回归就是多个自变量和因变量组合形成的线性关系。 三.统计学习中用到线性回归算法,它通过误差的评分合/最小二乘法。同时如果要将误差变最

  • Python实现为语音文件创建声谱图(包括窄带声谱和宽带声谱)2020-04-20 16:05:48

    选题自(数字语音处理理论及应用) Python实现画语音文件的声谱图代码部分结果以及分析 参数选用: 窗函数:汉明窗 宽带声谱窗长:5ms 宽带声谱FFT长度:1024 窄带声谱窗长:50ms 窄带声谱FFT长度:1024 使用对数幅度 声谱图为彩色 代码部分 import matplotlib.pyplot as plt #画图用 imp

  • scrapy爬虫框架和selenium的使用:对优惠券推荐网站数据LDA文本挖掘2020-04-20 13:55:22

    原文链接:http://tecdat.cn/?p=12203 介绍 每个人都喜欢省钱。我们都试图充分利用我们的资金,有时候这是最简单的事情,可以造成最大的不同。长期以来,优惠券一直被带到超市拿到折扣,但使用优惠券从未如此简单,这要归功于Groupon。 Groupon是一个优惠券推荐服务,可以在您附近的餐馆和商店

  • 4.K均值算法--应用2020-04-18 22:02:29

    1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小  源代码: from sklearn.

  • 决策树与随机森林实例2020-04-18 14:00:13

    想必很多人都听说过决策树和随机森林,这是用来预测的数学模型,用python可以快速实现。下面这些代码请收好,理解其中的含义以后,改改参数你也可以用这个模型进行预测啦。不过博主以为,模型最后的寻找重要因子才是最有意思的部分~ 拿到数据集的第一步,清洗数据: import pandas as pd import n

  • 爬取B站热门视频排行榜2020-04-17 23:02:08

    一、主题式网络爬虫设计方案1.主题式网络爬虫名称:爬取B站热门视频排行榜2.主题式网络爬虫爬取的内容:统计所有投稿视频的数据综合得分,每日更新数据(作品,播放量,弹幕,作者) 3.主题式网络爬虫设计方案概述:找到网站地址,分析网站源代码,找到自己所需要的数据所在的位置,提取数据,进行数据整

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有