书籍 大数据管理系统原理与技术的封面

大数据管理系统原理与技术PDF电子书下载

王宏志

购买点数

20

出版社

出版时间

2020

ISBN

标注页数

0 页

PDF页数

346 页

图书目录

第1章 绪论 1

1.1大数据的基本概念 1

1.2数据库管理系统 5

1.2.1数据库管理系统的基本概念 5

1.2.2数据库管理系统的发展历史 6

1.2.3数据库管理系统的要素 10

1.3大数据对数据库管理系统的需求和挑战 13

1.4本书结构 14

第2章 关系型数据库管理系统 15

2.1关系数据库概述 15

2.1.1关系模型 15

2.1.2关系数据的存储 17

2.1.3关系数据库的索引 20

2.1.4关系数据库中的查询处理算法 24

2.1.5并发控制 25

2.1.6数据库恢复 34

2.2关系数据库MySQL概述 35

2.3 MySQL应用 36

2.3.1 SQL概述 36

2.3.2数据定义语句 37

2.3.3数据处理语句 38

2.3.4事务和锁定声明 39

2.3.5其他 45

2.4存储过程 46

2.4.1概述 46

2.4.2建立存储过程 47

2.4.3调用存储过程 49

2.4.4查询存储过程 50

2.4.5删除存储过程 50

2.5视图 51

2.6分区 53

2.7复制 57

2.8 MySQL的Java客户端JDBC 62

2.8.1 JDBC概述 62

2.8.2 JDBC API 63

2.8.3 Java通过JDBC API操作MySQL 66

第3章 数据仓库Hive 72

3.1数据仓库概述 72

3.1.1数据仓库的概念和特征 72

3.1.2数据仓库的体系结构 73

3.1.3数据仓库的模型 74

3.1.4数据仓库关键技术 77

3.1.5数据仓库与大数据 79

3.2 Hive概述 80

3.2.1 Hive存储结构 80

3.2.2 Hive体系结构 82

3.2.3 Hive的任务执行流程 84

3.3 Hive的特征 85

3.3.1一致性 86

3.3.2可扩展性 86

3.3.3事务 86

3.4 Hive的基本概念 87

3.4.1基本数据类型 87

3.4.2数据类型转换 89

3.4.3复杂数据类型 90

3.4.4文本文件数据编码 91

3.4.5数据读取模式 92

3.4.6文件格式与压缩 93

3.4.7 Hive压缩 93

3.4.8 Hive关键字 95

3.5 Hive的使用 97

3.5.1 Hive命令 97

3.5.2 Hive DDL 100

3.5.3 Hive DML 104

3.5.4 HiveQL基本查询 108

3.5.5 Hive函数 118

3.5.6 HiveQL高级查询 121

3.6面向大数据的优化策略 133

3.6.1分桶 134

3.6.2视图和索引 136

3.6.3模式设计 139

3.7 Hive的调优 144

3.7.1使用EXPLAIN查看执行计划 145

3.7.2 Hive配置管理 147

3.7.3限制调整 148

3.7.4 JOIN优化 149

3.7.5本地模式 155

3.7.6并行执行 157

3.7.7严格模式 158

3.7.8调整Mapper和Reducer个数 159

3.7.9 JVM重用 161

3.7.10动态分区调整 162

3.7.11推测执行 163

3.7.12单个MapReduce中的多个GROUP BY 164

3.7.13虚拟列 164

3.8 Java通过JDBC操作Hive 165

第4章NoSQL概述 168

4.1 NoSQL与非关系型数据库 168

4.2 NoSQL数据模型 169

4.2.1键值数据库 170

4.2.2文档数据库 171

4.2.3列族数据库 172

4.2.4图数据库 173

4.2.5四者对比 173

4.3 NoSQL数据库中的事务 174

4.3.1 CAP理论 174

4.3.2 BASE原则 175

4.3.3一致性协议 176

4.4 NoSQL关键技术 177

4.4.1 NoSQL的技术原则 177

4.4.2存储技术 178

4.4.3数据划分技术 178

4.4.4索引技术 179

第5章 键值数据库 182

5.1模型结构 182

5.2特征 183

5.2.1一致性 183

5.2.2可扩展性 183

5.2.3事务 184

5.3关键技术 184

5.3.1索引技术 184

5.3.2查询支持 186

5.4 Redis 186

5.4.1 Redis数据类型 187

5.4.2 Redis的持久化 196

5.4.3 Redis事务 201

5.4.4 Redis的发布订阅 205

5.4.5 Redis的主从复制 208

5.5 Redis的Java客户端Jedis 213

5.5.1 Jedis所需要的jar包 214

5.5.2 Jedis常用操作 214

5.5.3 Jedis Pool 215

第6章 列族数据库 220

6.1模型结构 220

6.2特征 222

6.2.1一致性 222

6.2.2可用性 223

6.2.3可扩展性 224

6.3 HBase应用 224

6.3.1 HBase数据模型 225

6.3.2 HBase体系结构 227

6.3.3 HBase基本Shell操作 232

6.3.4 HBase压缩 234

6.3.5可用客户端Java 236

6.4架构与设计 244

6.4.1表设计规则 244

6.4.2 RowKey设计 245

6.4.3列族的数量 248

6.4.4版本的数量 248

6.5 HBase集成 248

6.5.1 HBase与Hive集成 249

6.5.2 MapReduce与HBase互操作 251

第7章 非关系型文档数据库 255

7.1模型结构 255

7.2特征 257

7.2.1一致性 257

7.2.2可扩展性 258

7.2.3事务 260

7.2.4可用性 261

7.3 MongoDB 261

7.3.1概述 261

7.3.2 Mongo Shell 262

7.3.3 MongoDB基本操作 269

7.3.4索引 276

7.3.5副本集 279

7.3.6分片 286

7.4 MongoDB的Java客户端 290

7.4.1 MongoDB驱动包的获得 290

7.4.2 Java操作举例 291

第8章 非关系型图数据库 296

8.1图数据库 297

8.1.1图模型的模型和定义 297

8.1.2图数据库的应用 298

8.1.3图管理的关键技术 299

8.2 Neo4j概述 302

8.2.1 Neo4j的特点 302

8.2.2 Neo4j的数据模型 304

8.2.3 Neo4j关键技术 312

8.3 Neo4j的应用 320

8.3.1使用嵌入在Java应用程序中的Neo4j 320

8.3.2 Neo4j的Java客户端环境配置 320

8.3.3一个简单的小型图数据库例子 321

8.3.4属性值 325

8.3.5带索引的用户数据库 325

8.4 Neo4j的优化 331

8.4.1索引 331

8.4.2批量导入/导出 332

查看更多关于的内容

出版社其它书籍
本类热门
在线购买PDF电子书
下载此书RAR压缩包