数据量

数据库的分库分表2021-07-27 11:30:32

分库分表是为了解决由于数据量过大导致数据库性能降低的问题，将原来独立的数据库拆分为若干数据库组成，将原来数据大表拆分为若干数据表组成，使得单一数据库、单一数据表的数据量变小，从而达到数据库性能提升的目的一般来说，数据量与访问量不是很大的情况下，先考虑缓存、读写分离、索
数据分析、数据科学和大数据的区别2021-07-24 17:32:00

时间上，数据分析从数据科学还未出现的时候便已经存在了，数据分析的目的是提出新的假设、做出决策或者发现和提出存在问题。由于时代的发展和变迁，数据量日益提升，从而引发一系列问题，比如数据量爆炸的时代，信息如何实现规整的存储和传输，以便于提取和写入和搬运。在数据量少的时
(七)索引2021-07-24 12:32:22

MySQL官方对索引的定义为：索引（Index）是帮助MySQL高效获取数据的数据结构。提取句子主干，就可以得到索引的本质：索引是数据结构。 7.1 索引的分类在一个表中，主键索引只能有一个，唯一索引可以有多个 1.主键索引（PRIMARY KEY）唯一的标识，主键不可重复，只能有一个列作为主键 2.
分库分表的那些事2021-07-22 14:35:44

前言在互联网公司中，上至大厂，下到普通的公司企业，随着业务的发展，数据量的日积月累，对于数据库和表的设计和优化，显得尤为重要。其中关于分表分库的问题，在实际场景或者是面试中，亦是老生常谈。当我们明白了来龙去脉时，也就没那么复杂。为什么需要分库分表最为直接便是机器性能的问
业内公认的 OLAP 数据库黑马 ClickHouse 有哪些复合类型2021-07-22 13:00:06

业内公认的 OLAP 数据库黑马 ClickHouse 有哪些复合类型 - 华章IT的个人空间 - OSCHINA - 中文开源技术交流社区 https://my.oschina.net/u/4497340/blog/4410115?_from=gitee_rec ClickHouse 是一款由俄罗斯Yandex公司开源的OLAP数据库，拥有者卓越的性能表现，在官方公布的基准测试
【转】查看oracle每天及每小时产生归档日志的数据量2021-07-22 09:34:57

-- 查看每天产生归档日志的数据量来源：http://blog.51cto.com/bjiokn/321878 alter session set nls_date_format='yyyy.mm.dd hh24:mi:ss';select trunc(completion_time) as ARC_DATE, count(*) as COUNT, round((sum(blocks * block_size) / 1024 / 102
记一次大数据量后台服务的性能优化（转载）2021-07-20 06:31:06

背景最近被分配到的一个需求，数据量每周新增上千万，预计两个月就会破亿，这里记录一下对这个服务的性能优化的过程。正文需求介绍首先大致介绍一下这个需求的内容。这个需求是一个周报服务，每周日向用户推送他本周使用服务的时常，最晚使用时间等统计数据，这应该是很多应用
转：sqlserver无法创建索引,超时时间已到解决办法2021-07-19 23:01:49

在更改数据量大的表格数据结构时，不要点“保存”按钮，而是在表结构编辑框左侧点右键===》选择“生成更改脚本”,这时出来了文本对话框，把里面的内容全选并复制，并关闭这个表，选择不保存，右击该表所属的数据库，选“新建查询”，之后Ctrl+V把刚复制的脚本粘进来，并运行。这样就再也不会弹出超
记一次数据量上亿的后台服务的性能优化2021-07-19 10:35:28

背景最近被分配到的一个需求，数据量每周新增上千万，预计两个月就会破亿，这里记录一下对这个服务的性能优化的过程。正文需求介绍首先大致介绍一下这个需求的内容。这个需求是一个周报服务，每周日向用户推送他本周使用服务的时常，最晚使用时间等统计数据，这应该是很多应用
视频编解码(h264分析工具)2021-07-18 22:02:51

H264分析工具 Elecard Stream Eye 这是最常用最有名的一款分析工具，使用它可以分析目前所有的遇见的编码器，例如264、265等等。下载地址：https://www.elecard.com/products/video-analysis CodecVisa 同样是一款很有名的工具，也是非常全，包括mac端、linux端、windows端。二者依
在Xcode中如果不小心点了一下数据量特别大的文本文件导致Xcode卡死好长时间如何处理2021-07-18 12:33:14

比如xcode工程中引入了一个vConsole.js文件93k大小这是用”文本编辑“打开的如果使用Xcode打开，就会卡死有木有解决办法呢？压缩这个js文件，在Xcode工程中以.zip的文件格式出现。操作步骤：直接把.js后缀改成.zip。调用方法基本不变。把 NSString *path =
MSSQL·大数据量历史数据清理的思路2021-07-18 12:02:52

阅文时长 | 0.6分钟字数统计 | 963.2字符主要内容 | 1、引言&背景 2、Delete删除法 3、提取回写删除法 4、声明与参考资料『MSSQL·大数据量历史数据清理的思路』编写人 | SCscHero 编写时间 | 2021/7/15 PM10:45 文章类型 | 系列完成度 | 已完成座右铭每
H264视频编解码2021-07-18 10:59:51

一编解码基础问:为什么要进行编解码？答：如果不对视频进行编解码的话，数据量太大了,存储，IO速度将压力倍增。一个4K,24FPS,1小时的数据量为:3840 * 2160 * 3 * 3600 * 25= 2085.5 G, 播放一个4K网络视频，下载速度将要579M/S。经过H264编码后，数据将缩小40~100 倍, 而新一代编码算法H
Titanic - （XGBoost，RF随机森林，Fastai-tabular_learner）总结2021-07-17 14:02:01

数据处理从高分code学到很多表格数据处理的方法，主要是以下几种： fillna Nan值得填充确实会对准确率有小幅度的提升数据增强使用原始数据为基础生成额外的维度连续数据转换将连续数据分段转换成分类数据one-hot独热编码通过pandas.get_dummies()可以轻松实现分类数据的独
数据库索引的灵魂拷问？2021-07-15 12:32:04

最近一直在回顾一些数据库的知识，顺便就整理了一下一些常见的面试题以及关于一些容易被忽略的知识点，会陆续的在今后的文章里面展示出来，欢迎大家讨论，共同学习。今天我们聊一下关于索引底层的问题，聊聊为什么索引要设计成这个样子为什么数据库需要索引呢正如我们知道的，索引的目的
大数据基本概述2021-07-13 12:03:18

大数据基本概述一、大数据基本概念 1、大数据(Big Data)：指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，需要新处理模式才能俱有更强的决策边、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 2、主要解决：海量数据的存储和海数据的
SQLite解决插入特殊字符导致插入失败的问题2021-07-11 09:02:05

SQLite解决插入特殊字符导致插入失败的问题背景在使用SQLite数据库时，我们经常会遇到插入的数据里面有单引号之类的特殊字符，如果不能正确处理，会导致插入数据失败。解决方法方法一对特殊字符进行转义 INSERT INTO time VALUES('5 O''clock'); # 插入的数据是 5 O'clock
Python笔记：机器学习之基础概念2021-07-08 13:01:59

什么是机器学习　　机器学习是从数据中自动分析获得规律（模型），并利用规律对未知数据进行预测。为什么需要机器学习　　解放生产力　　解决专业问题　　提供社会便利机器学习的应用场景　　领域：医疗、航空、教育、物流、电商等　　目的：让机器学习程序替换手动的步骤，减少企业
记一次MySql千万级数据量单表按日分组查询平均值的优化遇到的各种问题2021-07-07 18:34:53

1、单表千万级数据量子查询 where in 要比 where exists 快（查询时间差了100倍） 2、需要对datetime类型进行group by时（众所周知，函数不走索引），把日期的值拆分，比如要按日进行分组，则增加字段int 存放yyyyMMdd（为什么不是varchar，尽量用int等小字节，加快速度） 3、数据量不大的临时表
关于Java性能优化的几点建议，大厂面试必备技能2021-07-07 09:33:44

ClickHouse 是什么？ ClickHouse：是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS) 我们首先理清一些基础概念 OLTP：是传统的关系型数据库，主要操作增删改查，强调事务一致性，比如银行系统、电商系统 OLAP：是仓库型数据库，主要是读取数据，做复杂数据分析，侧重技术决策支持，提供直观简单
elasticsearch2021-07-07 07:00:05

【Ant说题】不是吧,阿sir！ElasticSearch这么问你都栽了，不合适吧_哔哩哔哩_bilibili 专注面试的up主数据量大全文检索从内存中找到主键id 倒排索引，字典+倒排列表数据量大，单词就会多，用线性表，操作复杂度。基于单词列表，提高检索效率，所以，除了倒排索引，还会用到树的理论，使
索引有什么用？2021-07-06 01:01:00

索引也叫键，是存储引擎用于快速找到记录的一种数据结构。索引对于良好的性能很关键，尤其是当表中数据量越来越大时，索引对于性能的影响越来重要。在数据量小且负载较低时，不恰当的索引对性能的影响可能还不明显，但数据量逐渐增大时，性能会急剧下降。索引大大减少了服务器需要扫描的数
CIQ-100如何解决回波故障2021-07-05 18:58:30

当千兆网卡工作时，需要四对电缆参与数据传输。由于1 / 2对跳线质量较差，回波损耗较大，回波信号将破坏接收信号，随后的信号转发。在一个方向复制文件时，一边数据量大(主要是数据帧的长度)，另一边数据量小(只有请求帧和确认帧的短帧)。例如，1518字节数据帧与64字节数据帧之间的网络时
后台获取request payload传过来的数据2021-07-04 10:57:59

后台获取request payload传过来的数据在后台的处理中对这三种格式的处理是不相同的。 1. GET格式都在URL后面，以key1=value1&key2=value2的KV格式存在，且不会很长（协议规定为1024个字节，但现在浏览器都会适当加长一些）。后台可以使用同步处理处理这种参数时。 2. POST时参数也可
sql执行优化2021-07-03 21:58:00

在开发过程中或者面试过程中经常会被问到如果发现sql执行效率不高，如何优化？下面提出几个解决思路： 1、首先，我们要根据自己的表结构看，无论是多表关联查询还是单表查询，都要看是否有使用到索引，索引使用是否合理 2、如果使用了索引，而且数据量本身并不大，还是慢？需要解析该语句的执行计

首页 < 5 6 7 8 > 尾页

ICode9

数据库的分库分表2021-07-27 11:30:32

数据分析、数据科学和大数据的区别2021-07-24 17:32:00

(七)索引2021-07-24 12:32:22

分库分表的那些事2021-07-22 14:35:44

业内公认的 OLAP 数据库黑马 ClickHouse 有哪些复合类型2021-07-22 13:00:06

【转】查看oracle每天及每小时产生归档日志的数据量2021-07-22 09:34:57

记一次大数据量后台服务的性能优化（转载）2021-07-20 06:31:06

转：sqlserver无法创建索引,超时时间已到解决办法2021-07-19 23:01:49

记一次数据量上亿的后台服务的性能优化2021-07-19 10:35:28

视频编解码(h264分析工具)2021-07-18 22:02:51

在Xcode中如果不小心点了一下数据量特别大的文本文件导致Xcode卡死好长时间如何处理2021-07-18 12:33:14

MSSQL·大数据量历史数据清理的思路2021-07-18 12:02:52

H264视频编解码2021-07-18 10:59:51

Titanic - （XGBoost，RF随机森林，Fastai-tabular_learner）总结2021-07-17 14:02:01

数据库索引的灵魂拷问？2021-07-15 12:32:04

大数据基本概述2021-07-13 12:03:18

SQLite解决插入特殊字符导致插入失败的问题2021-07-11 09:02:05

Python笔记：机器学习之基础概念2021-07-08 13:01:59

记一次MySql千万级数据量单表按日分组查询平均值的优化遇到的各种问题2021-07-07 18:34:53

关于Java性能优化的几点建议，大厂面试必备技能2021-07-07 09:33:44

elasticsearch2021-07-07 07:00:05

索引有什么用？2021-07-06 01:01:00

CIQ-100如何解决回波故障2021-07-05 18:58:30

后台获取request payload传过来的数据2021-07-04 10:57:59

sql执行优化2021-07-03 21:58:00