plt

Matplotlib cheatsheet2020-04-25 09:08:47

很多同学做数学建模都用过matlab，相信都用过matlab的强大可视化功能，非常方便。其实如果采用python语言实现也能实现和matlab一样的可视化效果，而且是免费使用。其中一个有名的可视化库叫Matplotlib（当然还有很多可视化库），它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案
Python爬取天气情况2020-04-24 22:55:34

一.设计方案爬虫名称：爬取天气情况并进行可视化爬虫内容：爬取2020年3月份莆田市天气情况爬虫设计：目标url，获取网页源代码，数据提取，数据保存二.页面的结构特征分析（网址：http://www.tianqihoubao.com/lishi/putian/month/202003.html）结构特质分析：源文件为html结构
2020年当下软件园软件下载总排行榜2020-04-24 19:04:31

一、主题式网络爬虫设计设计方案 1.爬虫名称：2020年当下软件园软件下载总排行榜。 2.爬取内容：排名、软件类型、软件名称、用户评分、内存大小、评级。 3.爬虫设计方案概述：（1）思路：找到要爬取的网页，按F12查看网页代码，找到所要爬取的数据及分析标签，导入相应库，然后开始对数据进
Seaborn实现回归分析2020-04-24 11:55:00

import numpy as np import pandas as pd from scipy import stats,integrate import matplotlib.pyplot as plt import seaborn as sns # iris = pd.read_csv("iris.csv") # # 对角线上是单个数据的情况,旁边的图都是关系分布的情况 # sns.pairplot(iris) # plt.show() tips =
爬取哔哩哔哩影视榜单2020-04-23 22:59:39

博客园首页新随笔联系订阅管理随笔 - 4 文章 - 0 评论 - 0 哔哩哔哩影视榜单一.主题式网络主题式网络爬虫设计方案 1.爬虫名称：爬取哔哩哔哩影视榜单 2.爬取内容：影片排名，影片标题，影片综合得分 3.网络爬虫设计方案概述：网页内容的选取对所选取网页进行h
爬取百度热搜榜及数据分析与可视化处理2020-04-23 22:06:56

一.主题式网络爬虫设计方案 1.主题式网络爬虫名称：爬取百度热搜排行榜及数据分析与可视化处理 2.主题式网络爬虫爬取的内容：爬取百度热搜排名，标题，热度值 3.方案设计：访问分析百度热搜网页，得到网页源代码，写出查找所需标签的代码，对数据进行相应的分析。提取标签保存到csv文件中，读取文
爬取微博热搜Top25的数据2020-04-23 20:57:13

一、主题式网络爬虫设计方案1.主题式网络爬虫名称：爬取微博热搜Top25的数据2.爬取微博热搜Top25的内容及其热度3.主题式网络爬虫设计方案概述先分析网页源代码，设置url地址，利用requests库和lxml来获取网页代码，由此来爬取微博热搜数据并采集；然后对数据进行清洗和处理并可视化技术难
5.线性回归算法2020-04-22 20:02:37

1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性（1）有监督：训练数据集必须是有标记，然后通过给定的训练数据和特定的算法去构造一个模型。无监督：训练数据集没有标记，去寻找训练数据中隐藏的模式或者是对数据进行分组。（2）线性回归的定义：通过一个或多个自变量
python进阶教程：PyTorch快速搭建神经网络及其保存提取方法详解2020-04-22 17:05:51

@本文来源于公众号：csdn2299，喜欢可以关注公众号程序员学府有时候我们训练了一个模型, 希望保存它下次直接使用,不需要下次再花时间去训练，本节我们来讲解一下PyTorch快速搭建神经网络及其保存提取方法详解一、PyTorch快速搭建神经网络方法先看实验代码： import torch imp
爬取360影视排行榜-总榜2020-04-22 15:53:19

一、主题式网络爬虫设计方案 1.主题式网络爬虫名称：360影视排行榜-总榜爬取2.主题式网络爬虫爬取的内容：爬取360影视排行榜-总榜的排名、作品名称和昨日指数（前十五）3.主题式网络爬虫设计方案概述：先确定想要爬取的网页以及内容，用requests库访问页面用get方法获取页面资源，后登陆网页，通
python 使用sklearn绘制roc曲线选取合适的分类阈值2020-04-22 15:38:22

https://zhuanlan.zhihu.com/p/26293316 比如, 我已经初步训练好了一个模型,现在我想用这个模型从海量的无标记数据集挖掘出某一类数据A,并且想要尽量不包含其他所有类B 但我挖掘出的结果必然包含错误的,我拿出的A越多,同时附带的分类错数据B也就越多, 一般,拿出的A占总体比例越大
5.线性回归算法2020-04-22 14:03:56

1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性这个知识点非常重要，复习了矩阵的相关知识。线性回归都基于矩阵的基础。损失函数是确定正确的线性方程的重要依据重点递归下降，是优化方程的最佳途径。 2.思考线性回归算法可以用来做什么？（大家尽量不要
第二讲神经网络优化--SGD2020-04-21 23:52:04

#利用鸢尾花数据，实现前向传播、反向传播，可视化loss曲线 #导入所需模块 import tensorflow as tf from sklearn import datasets import matplotlib.pyplot as plt import numpy as np import time #导入数据，分别为输入特征和标签 x_data = datasets.load_iris().data y_data =
广义线性模型--1.1.普通最小二乘法2020-04-21 16:02:49

1.最小二乘法数学表达式：使经验函数风险最小化 = 损失函数（平方损失） 2.示例 1 from sklearn import linear_model 2 reg = linear_model.LinearRegression() 3 reg.fit ([[0, 0], [1, 1], [2, 2]], [0, 1, 2]) 4 LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1,
bilibili弹幕网视频日排行榜数据分析2020-04-21 14:52:18

网络爬虫名称：bilibili弹幕网视频日排行榜数据分析网络爬虫爬取的内容：bilibili弹幕网视频日排行榜设计方案概述：实现思路：爬取网站html源代码，通过页面分析得到想要的数据位置，提取数据，之后数据可视化等操作技术难点: html源码过于杂乱,难以提取数据首先进行页面分析通过
5.线性回归算法2020-04-21 11:00:35

1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么？（大家尽量不要写重复） 3.自主编写线性回归算法，数据可以自己造，或者从网上获取。（加分题）第一题 ①机器学习分类 ②了解回归算法 ③回归和分类的区别
机器学习（KNN二）——案例：鸢尾花数据分类2020-04-21 10:02:34

常见API 这里有我们上篇博客提到的DKTree，还有最基本的KNeighborsClassifier(用于分类) 和 KNeighborsRegressor(用于回归)，这里列出常见的参数：参数 KNeighborsClassifier / KNeighborsRegressor weights 样本权重，可选参数: uniform(等权重)、distance(权重和距离
5.线性回归算法2020-04-21 09:57:27

1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性回归属于机器学习的监督学习，而回归主要包括线性回归、Logistic回归和回归的评估回归和分类的区别：分类和回归的区别在于输出变量的类型（预测的目标函数是否连续）。定量输出成为回归，或者说是连续变
5.线性回归算法 4/202020-04-20 23:05:38

1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性　· 我们先了解回归算法：　　　　　　　· 课上老师举了线性回归的应用：①房价预测；②销售额预测；③贷款额度预测；　　我们可以发现做线性回归，需要的数据都应该为连续型，最终要预测的因素成为目标值，把
5.线性回归算法2020-04-20 16:52:02

1.本节重点知识点用自己的话总结出来，可以配上图片，以及说明该知识点的重要性一.回归算法属于监督学习，线性回归就属于其中一个知识点。二.线性回归就是多个自变量和因变量组合形成的线性关系。三.统计学习中用到线性回归算法，它通过误差的评分合/最小二乘法。同时如果要将误差变最
Python实现为语音文件创建声谱图（包括窄带声谱和宽带声谱）2020-04-20 16:05:48

选题自（数字语音处理理论及应用） Python实现画语音文件的声谱图代码部分结果以及分析参数选用：窗函数：汉明窗宽带声谱窗长：5ms 宽带声谱FFT长度：1024 窄带声谱窗长：50ms 窄带声谱FFT长度：1024 使用对数幅度声谱图为彩色代码部分 import matplotlib.pyplot as plt #画图用 imp
scrapy爬虫框架和selenium的使用：对优惠券推荐网站数据LDA文本挖掘2020-04-20 13:55:22

原文链接：http://tecdat.cn/?p=12203 介绍每个人都喜欢省钱。我们都试图充分利用我们的资金，有时候这是最简单的事情，可以造成最大的不同。长期以来，优惠券一直被带到超市拿到折扣，但使用优惠券从未如此简单，这要归功于Groupon。 Groupon是一个优惠券推荐服务，可以在您附近的餐馆和商店
4.K均值算法--应用2020-04-18 22:02:29

1. 应用K-means算法进行图片压缩读取一张图片观察图片文件大小，占内存大小，图片数据结构，线性化用kmeans对图片像素颜色进行聚类获取每个像素的颜色类别，每个类别的颜色压缩图片生成：以聚类中收替代原像素颜色，还原为二维观察压缩图片的文件大小，占内存大小源代码： from sklearn.
决策树与随机森林实例2020-04-18 14:00:13

想必很多人都听说过决策树和随机森林，这是用来预测的数学模型，用python可以快速实现。下面这些代码请收好，理解其中的含义以后，改改参数你也可以用这个模型进行预测啦。不过博主以为，模型最后的寻找重要因子才是最有意思的部分～拿到数据集的第一步，清洗数据： import pandas as pd import n
爬取B站热门视频排行榜2020-04-17 23:02:08

一、主题式网络爬虫设计方案1.主题式网络爬虫名称：爬取B站热门视频排行榜2.主题式网络爬虫爬取的内容：统计所有投稿视频的数据综合得分，每日更新数据(作品，播放量，弹幕，作者) 3.主题式网络爬虫设计方案概述：找到网站地址，分析网站源代码，找到自己所需要的数据所在的位置，提取数据，进行数据整

首页 < > 尾页

ICode9

Matplotlib cheatsheet2020-04-25 09:08:47

Python爬取天气情况2020-04-24 22:55:34

2020年当下软件园软件下载总排行榜2020-04-24 19:04:31

Seaborn实现回归分析2020-04-24 11:55:00

爬取哔哩哔哩影视榜单2020-04-23 22:59:39

爬取百度热搜榜及数据分析与可视化处理2020-04-23 22:06:56

爬取微博热搜Top25的数据2020-04-23 20:57:13

5.线性回归算法2020-04-22 20:02:37

python进阶教程：PyTorch快速搭建神经网络及其保存提取方法详解2020-04-22 17:05:51

爬取360影视排行榜-总榜2020-04-22 15:53:19

python 使用sklearn绘制roc曲线选取合适的分类阈值2020-04-22 15:38:22

5.线性回归算法2020-04-22 14:03:56

第二讲 神经网络优化--SGD2020-04-21 23:52:04

广义线性模型--1.1.普通最小二乘法2020-04-21 16:02:49

bilibili弹幕网视频日排行榜数据分析2020-04-21 14:52:18

5.线性回归算法2020-04-21 11:00:35

机器学习（KNN二）——案例：鸢尾花数据分类2020-04-21 10:02:34

5.线性回归算法2020-04-21 09:57:27

5.线性回归算法 4/202020-04-20 23:05:38

5.线性回归算法2020-04-20 16:52:02

Python实现为语音文件创建声谱图（包括窄带声谱和宽带声谱）2020-04-20 16:05:48

scrapy爬虫框架和selenium的使用：对优惠券推荐网站数据LDA文本挖掘2020-04-20 13:55:22

4.K均值算法--应用2020-04-18 22:02:29

决策树与随机森林实例2020-04-18 14:00:13

爬取B站热门视频排行榜2020-04-17 23:02:08

第二讲神经网络优化--SGD2020-04-21 23:52:04