ICode9

精准搜索请尝试: 精确搜索
  • .gitlab-ci.yml关键词完整解析(一)2022-02-27 18:31:45

    .gitlab-ci.yml关键词完整解析(一) 使用GitLab自带的流水线,必须要定义流水线的内容,而定义内容的文件默认叫做.gitlab-ci.yml,使用yml的语法进行编写。 目前任务关键词有28个,全局的关键词有10个,两者重叠的有很多。今天我给大家先讲解一下常用的关键词,掌握了这些关键词的用法,你可以编写

  • 01-Hadoop2022-02-27 15:01:08

    一、hadoop简介 1、优势 高可靠性:底层维护多个数据副本,所以即使hadoop某个计算元素或存储出现故障也不会导致数据丢失。 高扩展性:在集群间分配任务数据,可方便扩展很多节点 高效性:在MapRedurce的思想下,Hadoop是并行工作的,以加快任务的处理。 高容错性:能够自动将失败的任务重新分配

  • dremio job 处理流程参考2022-02-26 15:02:48

    内容来自官方文档,可以了解dremio对于job 的处理 参考图 流程图     说明 上图还是比较有意义的,可以了解dremio内部的一些处理机制,以及状态转换,同时官方文档也包含了job的性能参数 参考资料 https://docs.dremio.com/cloud/querying-data/jobs/

  • java异常----22022-02-25 12:05:02

    //类转换异常ClassCastException class job{} class student extends job {} class doctor extends job{} public class Test2 { public static void main(String[] args) { /** * 异常的分类 : * 所有的异常的根类为java.lang.Throwa

  • xxl-Job分布式任务调度2022-02-23 21:02:53

    1.1 分布式任务调度需求分析 问题1: 如何访问量较大,直接查询数据库,压力较大 问题2: 新发布的文章会展示在前面,并不是热点文章 把热点数据存入redis进行展示 判断文章是否是热点,有几项标准: 点赞数量,评论数量,阅读数量,收藏数量 计算文章热度,有两种方案: 定时计算文章热度 实时

  • DataX 浅入浅出2022-02-21 19:06:12

    DataX 定位:是一个异构数据源之间的离线同步工具 架构:采用Framework + Plugin架构构建,将数据源读取和写入抽象成为Reader/Writer插件 核心模块: DataX完成单个数据同步的作业,我们称之为Job,DataX接受到一个Job之后,将启动一个进程来完成整个作业同步过程。 DataX Job模块是单个

  • Kubernetes入门至精通 | DaemonSet、Job、CronJob控制器2022-02-21 15:34:46

    什么是 DaemonSet DaemonSet 确保全部(或者一些)Node 上运行一个 Pod 的副本。当有 Node 加入集群时,也会为他们新增一个 Pod 。当有 Node 从集群移除时,这些 Pod 也会被回收。删除 DaemonSet 将会删除它创建的所有 Pod 使用 DaemonSet 的一些典型用法: 运行集群存储 daemon,例如在每

  • DataX全量和增量mysqltomysql2022-02-20 19:00:26

    全量mysqltomysql 进入目录编写json cd /usr/local/datax/job vi zabbixmysql2mysql.json 写入的表结构要和reader的表结构一样,先建立好 编写json文件 { "job": { "content": [ { "reader": { "name"

  • 大数据_Flink_数据处理_资源的分配和并行度测试---Flink工作笔记00132022-02-20 09:03:39

    上一节我们已经知道了怎么样提交job,以及在提交job的时候给job配置并行度,以及查看 运行计划对吧,但是我们没有运行起来,我们说,我们有4个task,但是我们只有1个slot对吧 可以看到上面available task slots是1对吧,不够分配的,所以任务一直停滞,没有执行.   然后我们再看我们应

  • QuarZ笔记2022-02-20 01:02:34

    Quartz任务调度 一.Quartz概念 Quartz是OpenSymphony开源组织在Job scheduling领域又一个开源项目,它可以与J2EE与J2SE应用程序相结合也可以单独使用。 quartz是开源且具有丰富特性的"任务调度库",能够集成于任何的java应用,小到独立的应用,大至电子商业系统。quartz能够创建亦简单亦

  • python 定时任务apscheduler的使用2022-02-19 22:31:56

    apscheduler 的使用   我们项目中总是避免不了要使用一些定时任务,比如说最近的项目,用户点击报名考试以后需要在考试日期临近的时候推送小程序消息提醒到客户微信上,翻了翻 fastapi 中的实现,虽然方法和包也不少,但是要不就是太重了(比如需要再开服务,还要依赖 redis,都不好用),虽然也可

  • Prometheus监控系统概述2022-02-17 03:00:42

    一. 基本概念 1.1 监控指标-metrics 指标是衡量和描述对象的方式 监控是对指标进行监测和控制 监控指标应满足可量化、标准化、多维度 Flink的metrics Flink的metrics有四种类型: Counter:A Counter is used to count something. 整数 Gauge:A Gauge provides a value of any type o

  • springboot-quartz定时任务2022-02-16 22:34:44

    springboot-quartz的依赖 spring-boot-starter-quartz Quartz的基本组成部分: 任务:JobDetail,定义一个job任务 触发器:Trigger,包括SimpleTrigger和CronTrigger,指定Job的执行时间,执行间隔,运行次数等 调度器:Scheduler,指定Trigger去执行指定的Job Quartz定时任务状态 (在 QRTZ_T

  • MapReduce原理深入理解3----WordCount程序流程图解、combiner(合并)程序示例、InputSplit切片详解2022-02-16 22:02:26

    MapReduce原理深入理解3----WordCount程序流程图解、combiner(合并)程序示例、3、InputSplit切片详解 1、WordCount示例程序处理流程图解 2、combiner(合并)程序示例 combiner,发生在map阶段,又叫做预聚合; 相当于map端的Reduce,因为combiner的逻辑代码和Reduce端的逻辑代码一样 求max、

  • 推荐系统中双塔模型损失函数设计2022-02-16 14:31:49

    loss的设计对系统来说至关重要,最初采用用户侧和商品侧向量的夹角余弦,binary_crossentropy进行优化,无法得到满意的模型效果,依托深度模型强大的拟合能力,特征向量居然全部归零。随后重新对系统改进,主要是1.负样本构建;2.loss函数设计 这里主要讲第二点。 基于距离的损失函数--Hinge Lo

  • 蒟蒻君的刷题日记Day16(DP专题T5):CF467C George and Job2022-02-11 12:02:48

    解题思路 很明显的 dp 题。 状态定义:令 d p [ i ] [

  • kettle学习笔记及最佳实践2022-02-11 11:35:53

    最近在用kettle迁移数据,从对kettle一点不会到比较熟悉,对于期间的一些问题和坑做了记录和总结,内容涵盖了使用的经验和技巧,踩到的坑、最佳实践和优化前后结果对比。 常用转换组件 计算形成新字段:只限算术运算,并且选择固定 过滤记录:元表某字段按照某个条件分流,满足条件的到一个表,不

  • Pushgateway(2)自定义数据推送到pushgateway及推送数据的注意事项2022-02-11 10:59:09

    简单定义几条数据,并将其推送至pushgateway,方便我们验证自定义模板功能。 数据推送默认格式 们要 Push 数据到 PushGateway 中,可以通过其提供的 API 标准接口来添加, 默认 URL 地址为: http://<ip>:9091/metrics/job/<JOBNAME>{/<LABEL_NAME>/<LABEL_VALUE>}, 是必填项,为 job 标

  • Kubernetes:Pod总结(二)2022-02-10 10:35:24

    Blog:博客园 个人 承接上文。 在实际的生产使用场景中,直接用 Pod 是不合适的,因为必然会产生单点故障。因此,我们需要有一种方法来方便地创建、管理同一个服务的多个实例 Pod。Kubernetes 中引入了 Workload(工作负载) 的概念,它可以理解为 Pod 的父资源,主要的作用就是来管理多个 Po

  • Elasticsearch使用系列-基本查询和聚合查询+sql插件2022-02-10 10:02:04

    Elasticsearch使用系列-ES简介和环境搭建 Elasticsearch使用系列-ES增删查改基本操作+ik分词 Elasticsearch使用系列-基本查询和聚合查询+sql插件 一、基本查询 1.And查询must GET user2/_search { "query": { "bool":{ "must": [ { "match": {

  • Day612022-02-09 23:02:46

    分布式计算框架Map/Reduce 分布式计算框架MapReduce 1、产生背景 Web2.0时代,数据爆炸式、指数级增长,大数据分布式计算需求频繁通过单机内存扩展来增强计算能力,已经无法承载大规模数据量的计算分布式计算开发和维护的复杂与多变,对程序员要求太高 Google公司为了解决其搜索引擎中

  • 04_第四章 Hadoop数据压缩2022-02-07 17:31:53

    1. 01 Map输出设置压缩 案例 package ComMapOutPk { import java.lang import org.apache.hadoop.conf.Configuration import org.apache.hadoop.fs.Path import org.apache.hadoop.io.compress.{BZip2Codec, GzipCodec, SnappyCodec} import org.apache.hadoop.io.

  • dataxweb部署步骤(仅自己记录,情况也许不一样)2022-02-07 16:00:08

    1.前端打包,npm run build:prod,打包完后把打的包移到后端的datax-admin下resourses下的statistic中: 2.后端打包: 3.打包完后把后端的报上传到服务器并且解压 4.到这里编译: 运行命令:./install.sh 做选择题,答案是 三个y一个n一个y (第一次编译的时候是四个y) 5.到服务器上需要修

  • Hadoop常见错误及解决方案2022-02-07 12:03:02

    1)防火墙没关闭、或者没有启动YARN INFO client.RMProxy: Connecting to ResourceManager at hadoop108/192.168.10.108:8032 2)主机名称配置错误 3)IP地址配置错误 4)ssh没有配置好 5)root用户和atguigu两个用户启动集群不统一 6)配置文件修改不细心 7)未编译源码 Unable to load nativ

  • 【java学习之路】(mysql篇)002.mysql分组查询及连接查询2022-02-06 23:35:27

    单行处理函数 数据处理函数又被称为单行处理函数 单行处理函数的特点:一个输入对应一个输出。 和单行处理函数相对的是:多行处理函数。(多行处理函数特点:多个输入,对应1个输出!) 单行处理函数常见的有哪些? lower 转换小写 mysql> select lower(ename) as ename from emp; +--

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有