ICode9

精准搜索请尝试: 精确搜索
  • [POI2014]HOT-Hotels 加强版2021-04-09 14:33:27

    I.II.[POI2014]HOT-Hotels 加强版 易于发现,三点间两两距离相等,当且仅当两个LCA较深的点到它们的LCA距离相等,且第三个点到该LCA的距离与前两个点相同。 于是我们设 \(f_{x,i}\) 表示 \(x\) 子树中有多少对点,它们到LCA距离相同,且上述距离比该LCA到 \(x\) 的距离长 \(i\)。考虑现在将

  • HotRing——热点感知的哈希冲突解决方案2021-04-02 14:55:09

    本文作者:Jiekun,授权转发 原文链接:https://jiekun.dev/posts/hotring/在使用链表法解决哈希冲突时,由于多数场景下,热点数据异常集中,链表中多个item可能仅有一个是hot item。对于无特定排序规则的链表,其访问复杂度为O(n/2)。但如果能将hot item前置,理想情况下则能优化至O(1)。HotRing

  • Keras中one-hot码的编码和解码2021-03-31 21:57:08

    编码 from keras.utils import to_categorical (x_train,y_train),(x_test,y_test)= fashion_mnist.load_data() y_train = to_categorical(y_train) 解码 np.argmax(y_train,axis=1)

  • LeetCode Hot 100 No.198 打家劫舍2021-03-27 15:01:16

    你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋存放金额的非负整数数组,计算你 不触动警报装置的情况下 ,一夜

  • LeetCode Hot 100 No.53 最大子序和2021-03-26 14:57:08

    给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。 示例 1: 输入:nums = [-2,1,-3,4,-1,2,1,-5,4] 输出:6 解释:连续子数组 [4,-1,2,1] 的和最大,为 6 。 示例 2: 输入:nums = [1] 输出:1 示例 3: 输入:nums = [0] 输出:0 示例 4: 输入:nums = [

  • LeetCode Hot 100 No.538 把二叉搜索树转换为累加树2021-03-26 00:00:27

    给出二叉 搜索 树的根节点,该树的节点值各不相同,请你将其转换为累加树(Greater Sum Tree),使每个节点 node 的新值等于原树中大于或等于 node.val 的值之和。 提醒一下,二叉搜索树满足下列约束条件: 节点的左子树仅包含键 小于 节点键的节点。 节点的右子树仅包含键 大于 节点键的

  • 干货|咦?还可以这样图解Word2Vec2021-03-25 13:53:55

    Word2Vec的含义一个单词,神经网络理解不了,需要人转换成数字再喂给它。最naive的方式就是one-hot,但是太过于稀疏,不好。所以在改进一下,把one-hot进一步压缩成一个dense vector。word2vec算法就是根据上下文预测单词,从而获得词向量矩阵。预测单词的任务只是一个幌子,我们需要的结果并不

  • 干货|咦?还可以这样图解Word2Vec2021-03-25 13:53:38

    Word2Vec的含义一个单词,神经网络理解不了,需要人转换成数字再喂给它。最naive的方式就是one-hot,但是太过于稀疏,不好。所以在改进一下,把one-hot进一步压缩成一个dense vector。word2vec算法就是根据上下文预测单词,从而获得词向量矩阵。预测单词的任务只是一个幌子,我们需要的结果并不

  • 2021-03-242021-03-24 22:59:03

    爬取斗鱼并制图 from selenium import webdriver import time import matplotlib.pyplot as plt import jieba from wordcloud import WordCloud from pyecharts.charts import Bar from pyecharts import options as opts class DouYuSpider(): def __init__(self):

  • label smoothing2021-03-09 14:04:10

      An overconfident model is not calibrated and its predicted probabilities are consistently higher than the accuracy. For example, it may predict 0.9 for inputs where the accuracy is only 0.6. Notice that models with small test errors can still be overcon

  • 【LeetCode Hot 100 正则表达式匹配】2021-02-15 14:32:34

    题目如下: 给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。 '.' 匹配任意单个字符'*' 匹配零个或多个前面的那一个元素所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。  示例 1: 输入:s = "aa" p = "a"输出:false解释:"a" 无法匹配

  • LeetCode 热题 HOT 1002021-02-14 21:02:15

    LeetCode 热题 HOT 100 1. 两数之和1.1 题目1.2 解答1.3 答案 2 1. 两数之和 1.1 题目 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 的那 两个 整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元素

  • 今年该吃的瓜一个都逃不掉,Python爬虫可视化微博热搜实时平台2021-02-05 19:00:45

    前言 最近的瓜是又大又圆,作为前排吃瓜群众中的一员,自然要有独特的吃瓜方式,自己做个微博热搜实时平台,一个瓜都漏不掉 目录 前言 结果展示 一、定位爬取的数据内容 二、编写Python爬虫脚本 三、存储到Mysql数据库 四、编写简单的服务器端PHP脚本 五、前端Html5+Echarts可视化 六

  • 类别特征的编码处理2021-02-02 10:03:10

         其中count encoder,one-hot encoder,label encoder主要针对低基数无序特征,比如性别。可以采用target encoder或者mean encoder的方法来针对高基数无序特征,比如地区,邮编等 一、Label Encoding LabelEncoder() 将转换成连续的数值型变量。即是对不连续的数字或者文本进行编号

  • 如何解决树模型中one_hot的问题2021-01-29 19:53:50

    问题引入在做特征工程的时候,都会使用到one_hot编码,编码可以解决某些不能被数值化的问题,但是这种编码会带来很多问题,这点之前已经说过,那么如何解决这个问题呢?问题解答类别特征的最优切分。这个方法需要对应工具的支持,我所知的支持这个方法的工具有h2o.gbm和LightGBM,用LightGBM可以

  • Hot 100题刷题 Day 72021-01-25 23:02:37

    Day7 最大子序和 题目:给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。 输入: [-2,1,-3,4,-1,2,1,-5,4] 输出: 6 解释: 连续子数组 [4,-1,2,1] 的和最大,为 6。 题目解析: 动态规划,维护一个数表示以其为端点的最大子序列和,满足如下

  • Hot 100题刷题 Day 62021-01-23 16:33:25

    Day6 多数元素 给定一个大小为 n 的数组,找到其中的多数元素。多数元素是指在数组中出现次数 大于$ ⌊ n/2 ⌋$ 的元素。 你可以假设数组是非空的,并且给定的数组总是存在多数元素。例如: 输入:[3, 2, 3] 输出:3 题目解析,此题目做法较多,可以采用如下做法: 哈希表法,维护一个哈希

  • Python深度学习笔记04--使用Kears进行多分类2021-01-23 09:04:52

    1 import keras 2 from keras.datasets import reuters 3 import numpy as np 4 from keras import models 5 from keras import layers 6 import matplotlib.pyplot as plt 7 8 #1. 获取数据集 9 (train_data, train_labels), (test_data, test_labels) = re

  • Hot 100题刷题 Day 32021-01-17 22:04:26

    Day3 爬楼梯问题: 题目:假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢? 题目解析:每次可以爬 1 或 2 个台阶,可以通过动态规划的思想进行解题,具体代码如下: class Solution { public int climbStairs(int n) {

  • leetcode hot 100 刷题笔记2021-01-16 21:34:22

    226. 翻转二叉树 前序遍历即可,每层递归交换左右子节点 1 /** 2 * Definition for a binary tree node. 3 * public class TreeNode { 4 * int val; 5 * TreeNode left; 6 * TreeNode right; 7 * TreeNode(int x) { val = x; } 8 * } 9 */ 10

  • Scikit-learn数据预处理分类变量编码之多标签二值化2021-01-13 18:01:53

                          Scikit-learn数据预处理分类变量编码之多标签二值化 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。 2 名义变量多标签二值化编码简介 名义变量(特征)是(nominal features)分类

  • Scikit-learn数据预处理分类变量编码之标签二值化2021-01-13 18:00:44

                   Scikit-learn数据预处理分类变量编码之标签二值化 1 声明 本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理。 2 名义变量编码简介 名义变量(特征)是(nominal features)分类变量的一种,变量间没用次序

  • 06Embedding简介2021-01-02 16:04:18

    embedding:用一个数值向量表示一个对象的方法,主要用以表示对象之间的关系 重要性: 1.将高维稀疏特征转为低维稠密特征。 2.融合大量有价值的信息,表达能力强。 以下为word2vector的模型结构(输入词的 one-hot编码,拟合该词的muti-hot编码,利用反向传播,激活函数是softmax,其中输入到隐藏

  • Word2vec之CBOW 模型2021-01-02 13:59:55

    什么是 Word2vec? 在NLP中,如果你需要对语料库进行预处理,比如,英文语料库你可能需要大小写转换检查拼写错误等操作,如果是中文日语语料库你需要增加分词处理。在得到你想要的语料之后,将他们的one-hot向量作为word2vec的输入,通过word2vec训练低维词向量(word embedding)就可以了。

  • 05Spark特征处理2020-12-31 15:33:58

    Spark架构图如下: Spark 的计算过程:Stage内部数据高效并行计算,Stage边缘处进行消耗资源的shuffle或者reduce操作。 特征处理方法: 1.类别特征:one-hot编码 2.数值特征:归一化(不同类别特征权重不统一)与分桶(解决特征值分布不均与,过程:特征值高低排序->分位数->分样本->桶id作为特征值)。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有