×

大数据

数据仓库中现实表的水平分区(数据库水平分区和垂直分区特点)

站长资讯网友投稿帖 站长资讯网友投稿帖 发表于2024-04-16 浏览4286 评论0
分区是管理大型数据库表的有效手段。表的水平分区是对表的行进行分区,分区后表的行会被划分为若干不重叠的小单元。通过FOR VALUES语句可以为这些分区单元指定边界范围值。要将事实表进行水平分区,我们首先需要创建一个分区函数和一个分区方案,然后再创建分区表。

未命名

详谈数字化转型(四):数字化转型如何改变你的企业

qingyahui qingyahui 发表于2024-04-16 浏览3532 评论0
数字化转型表明,只有企业对其业务进行系统性、彻底的(或重大和完全的)重新定义——而不仅仅是IT,而是对组织活动、流程、业务模式和员工能力的方方面面进行重新定义的时候,成功才会得以实现。 数字转型是使用数字技术来创建新的或修改现有的业务流程、文化和客户体验,以满足不断变化的业务和市场需求的过程。这种对数字时代商业的重新构想就是数字转型。 它超越了销售、营销和客户服务等传统角色。相反,数字转型的开始和结束都取决于你如何看待客户,如何与客户互动。随着我们从纸张到电子表格,再到用于管理业务的

未命名

虚拟机开启hive的命令

和煦的糖果风 和煦的糖果风 发表于2024-04-16 浏览4639 评论0
一.什么是hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件 映射为一张数据库表,并提供类SQL查询功能。其本质是将SQL转换 为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,可 以理解为一个将SQL转换为MapReduce的任务的工具。 二.开启hive的命令 通过第二代客户端beeline开启hive服务的命令: nohup /export/server/hive/bin/hive --service metastore & noh

scala

Spark 参数说明(spark参数说明)

™無聲煩の告別™ ™無聲煩の告別™ 发表于2024-04-15 浏览2903 评论0
前言 本篇的主要阐述了Spark 各个参数的使用场景,以及使用的说明与参考;其实主要就是对 Spark 运行过程中各个使用资源的地方,通过调节各种参数来优化资源使用的效率,从而提升Spark作业的执行性能。首先通过大致的 Spark 任务提交流程了解,然后再介绍说明 Spark 各个参数的使用方式,这样更有利于熟悉了解。 Spark Job 提交 Spark Job 提交流程 spark-submit提交 Spark 作业之后,就会启动一个对应的 Driver;不同

后端

Kettle变量和参数介绍系列文章1-变量的使用

ㅤචᆽච ㅤචᆽච 发表于2024-04-15 浏览6644 评论0
本文主要讲述Kettle中变量的分类,并针对每一类变量的使用进行说明。  变量的分类 在Kettle中变量一共可以分为3类,分别是系统变量(对应“kettle.properties”文件)、自定义变量(对应“设置变量”组件)和环境变量,其中系统变量是全局变量,自定义变量是局部变量,而环境变量指的是当前脚本文件中出现的所有变量,包括系统变量、自定义变量以及环境变量自身定义的变量。 系统变量和自定义变量的最大区别:系统变量是在文件中定义的,对所有脚本文件都始终有效;自定义变量是在脚本中定义的,

MYSQL教程

超详细 MySQL8.0的下载、安装配置教程、连接数据可视图形化界面和卸载及MySQL基本使用教程(霸霸看了都说好)

ㅤ 发表于2024-04-15 浏览21638 评论0
首先,去数据库的官网链接: http://www.mysql.com下载MySQL。 MySQL WorkBench 8.0中文菜单导航通用版链接:https://download.csdn.net/download/pujun1201/21509272 MySQL8.0下载 点击进入后的首页如下: 然后点击downloads,选择MySQL Community Downloads。如下图: 点击下方 MySQL Installer for