ICode9

精准搜索请尝试: 精确搜索
  • linux – 使用awk处理多个文件2019-06-09 03:38:09

    我必须使用awk处理大量的txt文件(每个文件有1600万行).我必须阅读例如十个文件: 档案#1: en sample_1 200 en.n sample_2 10 en sample_3 10 档案#2: en sample_1 10 en sample_3 67 文件#3: en sample_1 1 en.n sample_2 10 en sample_4 20 … 我希望有这样的输出: source titl

  • mysql – 使用Hive进行实时查询2019-05-29 23:02:56

    首先,我想澄清一下,我正在学习Hive和Hadoop(以及一般的大数据),所以请原谅缺乏适当的词汇. 我正在开始一个巨大的(至少对我而言)项目,这个项目需要处理大量的数据,这些数据在过去我并不常用,因为我一直主要使用MySQL. 对于这个项目,一系列传感器每小时产生大约125.000.000个数据点(

  • 新闻网大数据实时分析可视化系统项目——5、Hadoop2.X HA架构与部署2019-05-10 15:42:33

    1.HDFS-HA架构原理介绍 hadoop2.x之后,Clouera提出了QJM/Qurom Journal Manager,这是一个基于Paxos算法实现的HDFS HA方案,它给出了一种较好的解决思路和方案,示意图如下: 1)基本原理就是用2N+1台 JN 存储EditLog,每次写数据操作有大多数(>=N+1)返回成功时即认为该次写成功,数据不会丢失了

  • 大数据学习之BigData常用算法和数据结构2019-05-09 22:48:11

        1.Bloom Filter     由一个很长的二进制向量和一系列hash函数组成     优点:可以减少IO操作,省空间     缺点:不支持删除,有误判     如果要支持删除操作: 改成计数布隆过滤器     2.SkipList(跳表)     核心思路: 由多层组成,每层都是一个有序链表,最

  • Hadoop之yarn-site.xml配置文件2019-05-06 16:53:54

    下面介绍一下yarn-site.xml配置文件的配置过程: 增加yarn功能 <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-

  • Hadoop集群搭建 -------未完!!!!!!2019-04-25 17:55:09

    前言: 1)Vmware网络模式介绍。参考:http://blog.csdn.net/collection4u/article/details/14127671 2)Hadoop部署模式有:本地模式、伪分布模式、完全分布式模式、HA完全分布式模式。 区分的依据是NameNode、DataNode、ResourceManager、NodeManager等模块运行在几个JVM进程、几个机器

  • oracle数据库的常用操作整理2019-03-13 15:53:22

    1、删除用户及用户下的对象drop user xxxx cascade 2、查看表空间文件地址,表空间大小,已使用M,利用率select b.file_name 物理文件名,b.tablespace_name 表空间,b.bytes/1024/1024 大小M,(b.bytes-sum(nvl(a.bytes,0)))/1024/1024 已使用M,substr((b.bytes-sum(nvl(a.bytes,0)))/(b.

  • HDFS集群安装部署2019-03-07 20:40:12

    准备环境: 三台centos7虚拟机(Node-1,Node-2,Node-3) 配置虚拟机网络,保证三台机器可以互相ping通,并且和宿主机可以互相ping通。如果仅仅是作为虚拟机学习,可以关闭防火墙,避免后面的RPC端口或者web端口无法正常访问。 创建普通用户dtouding 安装jdk环境。 安装HDFS: 下载hadoop安装包(had

  • 用客户端命令psql连接 PostgreSQL 不输入密码的方法2019-02-28 14:51:49

    用客户端命令psql连接 PostgreSQL 不输入密码的方法 用psql命令连接远程的PostgreSql数据库时,在命令中不能传密码,只能连接后,再按照提弹出密码输入提示输入密码(这一点感觉很别扭,在Mysql上就可以在命令中传入密码),如果这样的话就涉及到和服务器的交互过程(或者称之为

  • 安装分布式zookeeper2019-02-27 16:52:45

    如果要master机器挂掉,单机版的Zookeeper就提供不了服务了,所以要多安装几个节点的Zookeeper服务,所以要安装分布式的Zookeeper 进入到zk中的conf目录,配置zoo.cfg文件,如下: vi zoo.cfg 填写如下配置: server.0=master:8880:7770 server.1=slave1:8881:7771 server.2=slave2:8882:77

  • 大数据基础Hadoop 3.1.1 的高可用HA安装~踩坑记录2019-01-31 16:05:05

    最近负责的项目准备上大数据平台存储,主要还是围绕Hadoop平台来实现,虽然打算上cdh版本的hadoop,但是为了前期方便开发还是先使用原声的hadoop进行开发,后期再准备更好的环境进行扩展。 环境准备 三台服务器系统环境是建立在Centos7.6基础上。并且是建立在root账户上运行的,如果需

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有