ICode9

精准搜索请尝试: 精确搜索
  • NoSQL简介2019-08-31 22:02:51

    NoSQL,全名为Not Only SQL ,指的是非关系型的数据库 随着访问量的上升,网站的数据库性能出现了问题,于是nosql被设计出来 优点/缺点 优点: 高可扩展性 分布式计算 低成本 架构的灵活性、半结构化数据 没有复杂的关系 缺点: 没有标准化 有限的查询功能(到目前为止) 最终一致是不直观的

  • 作为软件工程师解决现实问题应当具备的基础技能2019-08-31 14:55:20

    编程开发本质是运用程序和计算机来解决现实中的各种问题,因此,编程开发人员的才智发挥载体是计算机或者说计算设备,直接武器是程序。 难度:中级 程序员用来进行编程开发所需要的技能,归结起来主要如下: 理解计算模型和框架:顺序计算、并发计算 (并行计算、分布式计算)。 理解应用所基于

  • Hadoop生态系统2019-08-15 21:58:30

    Hadoop 生态系统 1) Hadoop:分布式存储、分布式计算、资源调度和任务管理、hdfs、mapreduce、yarn、common 2)Nutch:开源的搜索引擎 3)Hbase/Cassandra:基于google的 bigtable开源的列式存储的非关系型数据库 4) Hive:基于SQL的分布式计算引擎   Pig:基于Pig Latin脚本的计算框架 5)

  • 大数据入门之分布式计算框架Spark(2) -- Spark SQL2019-08-01 19:05:21

    1.Spark SQL概述 一个运行在Spark上执行sql的处理框架,可以用来处理结构化的数据【外部数据源(访问hive、json、parquet等文件的数据)】。 Spark SQL提供了SQL的API、DateFrame和DataSet的API 2.Spark SQL架构     前端可以有不同种的访问方式,Hive AST传过来的就是一个字符串(解

  • dask.distributed搭建分布式计算环境2019-07-14 22:01:45

    0. 前言 本文旨在快速上手dask.distributed搭建分布式集群环境, 详细内容请参考dask官网 1. 安装 pip install dask 2. 搭建dask分布式 (1) 简单的搭建 >>> ipython >>> from dask.distributed import Client >>> client = Client() # 创建运行scheduler, 并且创建运

  • 强-大数据第三讲2019-07-12 11:02:26

    Hadoop的背景起源二:MapReduce 一、什么是大数据,本质? (1)数据的存储:分布式文件系统(分布式存储)-----> HDFS: Hadoop Distributed File System (2)数据的计算:分布式计算 二、如何解决大数据的计算?分布式计算 (1)什么是PageRank(MapReduce的问题的来源) (*) 搜索排名 (2)MapReduce(Java

  • 并行计算学习之并行程序设计导论2019-07-08 12:55:59

    如何编写并行程序? 任务并行:将待解决问题所需要执行的各个任务分配到各个核上执行 数据并行:将待解决的问题所需要处理的数据分配给各个核,每个核在分配到的数据集上执行大致相似的操作。 协调过程 通信 负载平衡:每个核被分配到大致相同数目的数据来计算 同步 并行系统的种类

  • 大数据开发工程师都需要学什么?2019-07-07 22:40:57

    学习大数据需要的基础:java SE、EE(SSM)、MySQL、Linux等,大数据的框架安装在Linux操作系统上。 大数据开发工程师都需要学什么大数据课程? 第一、需要学习Java基础 很多人好奇学习大数据需不需要学Java,正确答案是需要。一方面Java是目前使用最为广泛的编程语言,它具有的众多特性

  • 初识数据库与MYSQL2019-06-20 22:48:21

    1.什么是mysql ?什么是数据库? 文件处理就可以将数据永久存储 问题: 1.管理不方便 2.文件操作效率低,速度慢 3.一个程序不太可能仅仅只运行在一台电脑上, 提高计算机性能的方式: 1,垂直扩展 指的是更换性能更好的硬件

  • 【时序数据库】十分钟系列2019-06-06 18:43:31

              参考文档: 十分钟看懂时序数据库(I)-存储 十分钟看懂时序数据库(II)- 预处理 十分钟看懂时序数据库(III)- 压缩 十分钟看懂时序数据库(IV)- 分级存储 十分钟看懂时序数据库(V)- 分布式计算

  • MapReduce分布式计算系统2019-05-26 18:51:28

    MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件

  • 游戏数据挖掘开发训练营(二)分布式运算与数据集群2019-05-23 13:52:41

    游戏数据挖掘开发训练营(二)分布式运算与数据集群 主要内容 分布式运算 分布式运算基石 分布式计算引擎演进 大数据常用工具 数据集群的搭建和维护 分布式运算 分配给许多计算机处理 把结果综合 为什么分布式运算? 数据量 例如 倩女幽魂手游日志1TB 运算效率 分布式运算实例: SE

  • Hadoop技术全解析 深度挖掘大数据背后的秘密2019-05-09 22:49:23

        大数据最近火热程度上升,而与之相关联的概念Hadoop也在被网友讨论?Hadoop到底是什么,它的技术基础是什么,主要用来干什么了呢?下面我们将详细探讨。     在了解以上问题之前,我们先了解三个最基本的知识点,这样子,你更能深入地了解大数据的内涵。     1.大数据是什么?

  • 浅谈分布式计算的开发与实现(二)2019-04-23 15:56:22

    实时计算 接上篇,离线计算是对已经入库的数据进行计算,在查询时对批量数据进行检索、磁盘读取展示。 而实时计算是在数据产生时就对其进行计算,然后实时展示结果,一般是秒级。 举个例子来说,如果有个大型网站,要实时统计用户的搜索内容,这样就能计算出热点新闻及突发事件了。 按照以前离线

  • 浅谈分布式计算的开发与实现(二)2019-04-23 15:56:05

    实时计算 接上篇,离线计算是对已经入库的数据进行计算,在查询时对批量数据进行检索、磁盘读取展示。 而实时计算是在数据产生时就对其进行计算,然后实时展示结果,一般是秒级。 举个例子来说,如果有个大型网站,要实时统计用户的搜索内容,这样就能计算出热点新闻及突发事件了。 按照以前离线

  • Zookeeper2019-04-16 19:48:05

    Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目, 主要是用来解决分布式应用中经常遇到的一些数据管理问题, 如:集群管理、统一命名服务、分布式配置管理、分布式消息队列jmq active amq、分布式锁、分布式通知协调等。 越来越多的分布式计算开始强依赖ZK,比如Storm、Hbase

  • 分布式计算(五)Azkaban使用2019-04-10 21:51:45

    在安装好Azkaban后,熟悉Azkaban的用法花了较长时间,也踩了一些坑,接下来将详细描述Azkaban的使用过程。  目录   一、界面介绍   二、Projects     1. 创建Command类型单一Job示例       1)创建一个Project,填写名称和描述       2)点击Create Project之后     

  • 分布式计算 ——原理、算法与系统(Distributed Computing —— Principles, Algorithms, and System)读书笔记2019-04-04 13:51:04

    分布式计算 ——原理、算法与系统 Distributed Computing —— Principles, Algorithms, and System 不定期更新   第一章 引言 第二章 分布式计算模型   第一章 引言 分布式系统:处理器、存储器、通信网络 1.4 与并行多处理器/多计算机系统的关系 并行系统:通过将计

  • Hadoop权威指南2019-03-29 16:43:10

    初识Hadoop Hadoop与其它系统比较 数据库的劣势:磁盘寻址性能低发展慢 数据库索引? MapReduce适合一次写入,多次读取的应用,关系型数据库适合持续更新的数据集 Hadoop在处理数据时才对数据进行解释(读时模式),所以对处理非结构化数据有优势 传统分布式计算使用规范化数据(完整且无冗余),这就

  • 分布式计算平台介绍2019-01-25 18:00:34

    分布式计算系统平台是将一系列用计算机网络相连接通信的,独立计算的模式和组件,集成到一个统一的平台,展现给用户的是一个完整的独立计算平台。本文介绍分布式计算平台的基本概念和不同计算模式,并对当前最为流行的Apache Spark / Hadoop原理做深入分享。 原文&下载h

  • 华为云计算HCNA--云计算概念与价值2019-01-12 17:55:22

    华为云计算考试体系:分为NA、NP、IE。其中NA与NP课程体系近似,IE与这两者在课程内容上没有关系。IE分为笔试、LAB和 面试,其中最难的是面试。一般笔试是2000左右,8000含一次LAB和一次面试,若面试不过,还需要额外花钱购买面试机会,一般是5000一次面试机会。华为跟云相关的认证分为两大类:云

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有