分布式计算

NoSQL简介2019-08-31 22:02:51

NoSQL，全名为Not Only SQL ，指的是非关系型的数据库随着访问量的上升，网站的数据库性能出现了问题，于是nosql被设计出来优点/缺点优点：高可扩展性分布式计算低成本架构的灵活性、半结构化数据没有复杂的关系缺点：没有标准化有限的查询功能（到目前为止）最终一致是不直观的
作为软件工程师解决现实问题应当具备的基础技能2019-08-31 14:55:20

编程开发本质是运用程序和计算机来解决现实中的各种问题，因此，编程开发人员的才智发挥载体是计算机或者说计算设备，直接武器是程序。难度：中级程序员用来进行编程开发所需要的技能，归结起来主要如下：理解计算模型和框架：顺序计算、并发计算 (并行计算、分布式计算)。理解应用所基于
Hadoop生态系统2019-08-15 21:58:30

Hadoop 生态系统 1） Hadoop:分布式存储、分布式计算、资源调度和任务管理、hdfs、mapreduce、yarn、common 2）Nutch:开源的搜索引擎 3）Hbase/Cassandra:基于google的 bigtable开源的列式存储的非关系型数据库 4） Hive:基于SQL的分布式计算引擎　　Pig:基于Pig Latin脚本的计算框架 5)
大数据入门之分布式计算框架Spark(2) -- Spark SQL2019-08-01 19:05:21

1.Spark SQL概述一个运行在Spark上执行sql的处理框架，可以用来处理结构化的数据【外部数据源（访问hive、json、parquet等文件的数据）】。 Spark SQL提供了SQL的API、DateFrame和DataSet的API 2.Spark SQL架构前端可以有不同种的访问方式，Hive AST传过来的就是一个字符串（解
dask.distributed搭建分布式计算环境2019-07-14 22:01:45

0. 前言本文旨在快速上手dask.distributed搭建分布式集群环境, 详细内容请参考dask官网 1. 安装 pip install dask 2. 搭建dask分布式 (1) 简单的搭建 >>> ipython >>> from dask.distributed import Client >>> client = Client() # 创建运行scheduler, 并且创建运
强-大数据第三讲2019-07-12 11:02:26

Hadoop的背景起源二：MapReduce 一、什么是大数据，本质？（1）数据的存储：分布式文件系统（分布式存储）-----> HDFS: Hadoop Distributed File System （2）数据的计算：分布式计算二、如何解决大数据的计算？分布式计算（1）什么是PageRank(MapReduce的问题的来源) (*) 搜索排名（2）MapReduce（Java
并行计算学习之并行程序设计导论2019-07-08 12:55:59

如何编写并行程序？任务并行：将待解决问题所需要执行的各个任务分配到各个核上执行数据并行：将待解决的问题所需要处理的数据分配给各个核，每个核在分配到的数据集上执行大致相似的操作。协调过程通信负载平衡：每个核被分配到大致相同数目的数据来计算同步并行系统的种类
大数据开发工程师都需要学什么？2019-07-07 22:40:57

学习大数据需要的基础：java SE、EE(SSM)、MySQL、Linux等，大数据的框架安装在Linux操作系统上。大数据开发工程师都需要学什么大数据课程? 第一、需要学习Java基础很多人好奇学习大数据需不需要学Java，正确答案是需要。一方面Java是目前使用最为广泛的编程语言，它具有的众多特性
初识数据库与MYSQL2019-06-20 22:48:21

1.什么是mysql ?什么是数据库? 文件处理就可以将数据永久存储问题: 1.管理不方便 2.文件操作效率低,速度慢 3.一个程序不太可能仅仅只运行在一台电脑上, 提高计算机性能的方式: 1,垂直扩展指的是更换性能更好的硬件
【时序数据库】十分钟系列2019-06-06 18:43:31

参考文档：十分钟看懂时序数据库（I）-存储十分钟看懂时序数据库（II）- 预处理十分钟看懂时序数据库（III）- 压缩十分钟看懂时序数据库（IV）- 分级存储十分钟看懂时序数据库（V）- 分布式计算
MapReduce分布式计算系统2019-05-26 18:51:28

MapReduce是一种编程模型，用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)"，和它们的主要思想，都是从函数式编程语言里借来的，还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下，将自己的程序运行在分布式系统上。当前的软件
游戏数据挖掘开发训练营（二）分布式运算与数据集群2019-05-23 13:52:41

游戏数据挖掘开发训练营（二）分布式运算与数据集群主要内容分布式运算分布式运算基石分布式计算引擎演进大数据常用工具数据集群的搭建和维护分布式运算分配给许多计算机处理把结果综合为什么分布式运算? 数据量例如倩女幽魂手游日志1TB 运算效率分布式运算实例: SE
Hadoop技术全解析深度挖掘大数据背后的秘密2019-05-09 22:49:23

大数据最近火热程度上升，而与之相关联的概念Hadoop也在被网友讨论？Hadoop到底是什么，它的技术基础是什么，主要用来干什么了呢？下面我们将详细探讨。在了解以上问题之前，我们先了解三个最基本的知识点，这样子，你更能深入地了解大数据的内涵。 1.大数据是什么？
浅谈分布式计算的开发与实现(二)2019-04-23 15:56:22

实时计算接上篇，离线计算是对已经入库的数据进行计算，在查询时对批量数据进行检索、磁盘读取展示。而实时计算是在数据产生时就对其进行计算，然后实时展示结果，一般是秒级。举个例子来说，如果有个大型网站，要实时统计用户的搜索内容，这样就能计算出热点新闻及突发事件了。按照以前离线
浅谈分布式计算的开发与实现(二)2019-04-23 15:56:05

实时计算接上篇，离线计算是对已经入库的数据进行计算，在查询时对批量数据进行检索、磁盘读取展示。而实时计算是在数据产生时就对其进行计算，然后实时展示结果，一般是秒级。举个例子来说，如果有个大型网站，要实时统计用户的搜索内容，这样就能计算出热点新闻及突发事件了。按照以前离线
Zookeeper2019-04-16 19:48:05

Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目，主要是用来解决分布式应用中经常遇到的一些数据管理问题，如：集群管理、统一命名服务、分布式配置管理、分布式消息队列jmq active amq、分布式锁、分布式通知协调等。越来越多的分布式计算开始强依赖ZK，比如Storm、Hbase
分布式计算（五）Azkaban使用2019-04-10 21:51:45

在安装好Azkaban后，熟悉Azkaban的用法花了较长时间，也踩了一些坑，接下来将详细描述Azkaban的使用过程。目录　　一、界面介绍　　二、Projects 　　　　1. 创建Command类型单一Job示例　　　　　　1）创建一个Project，填写名称和描述　　　　　　2）点击Create Project之后　　　　
分布式计算 ——原理、算法与系统（Distributed Computing —— Principles, Algorithms, and System）读书笔记2019-04-04 13:51:04

分布式计算 ——原理、算法与系统 Distributed Computing —— Principles, Algorithms, and System 不定期更新第一章引言第二章分布式计算模型第一章引言分布式系统：处理器、存储器、通信网络 1.4 与并行多处理器/多计算机系统的关系并行系统：通过将计
Hadoop权威指南2019-03-29 16:43:10

初识Hadoop Hadoop与其它系统比较数据库的劣势：磁盘寻址性能低发展慢数据库索引？ MapReduce适合一次写入，多次读取的应用，关系型数据库适合持续更新的数据集 Hadoop在处理数据时才对数据进行解释（读时模式），所以对处理非结构化数据有优势传统分布式计算使用规范化数据（完整且无冗余），这就
分布式计算平台介绍2019-01-25 18:00:34

分布式计算系统平台是将一系列用计算机网络相连接通信的，独立计算的模式和组件，集成到一个统一的平台，展现给用户的是一个完整的独立计算平台。本文介绍分布式计算平台的基本概念和不同计算模式，并对当前最为流行的Apache Spark / Hadoop原理做深入分享。原文&下载h
华为云计算HCNA--云计算概念与价值2019-01-12 17:55:22

华为云计算考试体系：分为NA、NP、IE。其中NA与NP课程体系近似，IE与这两者在课程内容上没有关系。IE分为笔试、LAB和面试，其中最难的是面试。一般笔试是2000左右，8000含一次LAB和一次面试，若面试不过，还需要额外花钱购买面试机会，一般是5000一次面试机会。华为跟云相关的认证分为两大类：云

首页 < 2 3 4

ICode9

NoSQL简介2019-08-31 22:02:51

作为软件工程师解决现实问题应当具备的基础技能2019-08-31 14:55:20

Hadoop生态系统2019-08-15 21:58:30

大数据入门之分布式计算框架Spark(2) -- Spark SQL2019-08-01 19:05:21

dask.distributed搭建分布式计算环境2019-07-14 22:01:45

强-大数据第三讲2019-07-12 11:02:26

并行计算学习之并行程序设计导论2019-07-08 12:55:59

大数据开发工程师都需要学什么？2019-07-07 22:40:57

初识数据库与MYSQL2019-06-20 22:48:21

【时序数据库】十分钟系列2019-06-06 18:43:31

MapReduce分布式计算系统2019-05-26 18:51:28

游戏数据挖掘开发训练营（二）分布式运算与数据集群2019-05-23 13:52:41

Hadoop技术全解析 深度挖掘大数据背后的秘密2019-05-09 22:49:23

浅谈分布式计算的开发与实现(二)2019-04-23 15:56:22

浅谈分布式计算的开发与实现(二)2019-04-23 15:56:05

Zookeeper2019-04-16 19:48:05

分布式计算（五）Azkaban使用2019-04-10 21:51:45

分布式计算 ——原理、算法与系统（Distributed Computing —— Principles, Algorithms, and System）读书笔记2019-04-04 13:51:04

Hadoop权威指南2019-03-29 16:43:10

分布式计算平台介绍2019-01-25 18:00:34

华为云计算HCNA--云计算概念与价值2019-01-12 17:55:22

Hadoop技术全解析深度挖掘大数据背后的秘密2019-05-09 22:49:23