• Hive on Spark安装配置详解(都是坑啊)

    时间:2023-02-06 17:01:36

    个人主页:http://www.linbingdong.com简书地址:http://www.jianshu.com/p/a7f75b868568简介本文主要记录如何安装配置Hive on Spark,在执行以下步骤之前,请先确保已经安装Hadoop集群,Hive,MySQL,JDK,Scala,具...

  • 01、Spark安装与配置

    时间:2023-02-05 19:47:11

    01、Spark安装与配置1、hadoop回顾Hadoop是分布式计算引擎,含有四大模块,common、hdfs、mapreduce和yarn。2、并发和并行并发通常指针对单个节点的应对多个请求的能力,是单一节点上计算能力的衡量,并行通常针对集群来讲,是利用多个节点进行分布式协同作业,我们称之为并行...

  • 在Spark executor节点上安装Python依赖项的最简单方法?

    时间:2023-02-04 23:10:50

    I understand that you can send individual files as dependencies with Python Spark programs. But what about full-fledged libraries (e.g. numpy)? 我理解您可以...

  • Windows下单机安装Spark开发环境

    时间:2023-02-03 00:11:23

    机器:windows 10 64位。因Spark支持java、python等语言,所以尝试安装了两种语言环境下的spark开发环境。1、Java下Spark开发环境搭建1.1、jdk安装安装oracle下的jdk,我安装的是jdk 1.7,安装完新建系统环境变量JAVA_HOME,变量值为“C:\P...

  • CentOS7安装spark集群

    时间:2023-01-28 17:05:21

    前提:使用的环境是centos7.2,已经安装了jdk 1.8 和hadoop2.7.1,三个服务器节点master,salve1,slave21、安装scala1)下载scala下载地址​​https://www.scala-lang.org/download/​​我这里下载了scale 2.11...

  • Spark--安装与配置

    时间:2023-01-27 20:12:51

    一,环境机器名IP集群状态zookeeperhadoop01176.129.8.111activefollowerhadoop02176.129.8.112standbyleaderhadoop03176.129.8.113observerCentOS6.5JDK1.8.0Hadoop2.7.1Zo...

  • CDH5.5.1 安装Spark ON Yarn环境

    时间:2023-01-18 06:51:11

    CDH对我们已经封装了,我们如果需要Spark on Yarn,只需要yum安装几个包就可以了。前面的文章我有写过如果搭建自己内网的CDH Yum服务器,请参考《CDH 5.5.1 Yum源服务器搭建》http://www.cnblogs.com/luguoyuanf/p/56187ea1049f4...

  • ubuntu14.04中安装spark步骤

    时间:2023-01-18 06:32:36

    1.首先在官网下载http://spark.apache.org/downloads.html,选择与scala对应的版本,对应关系为:spark1.6.2--scala2.10;spark2.0.0--scala2.11 在ubuntu中右键点击下载,选择复制链接,在终端中输入wget http...

  • 集群计算系统Spark——安装

    时间:2023-01-08 18:16:32

    Spark——Lightning-Fast Cluster Computing,这是Spark 官方logo的内容,让人很期待它的计算速度是否真的如此之快。 Spark是由UC Berkeley AMPLab开发的,一种类似Hadoop MapReduce的系统,但是在读写速度上面都有很快的速度。大...

  • spark安装mysql与hive

    时间:2023-01-01 15:29:51

    第一眼spark安装文件夹lib\spark-assembly-1.0.0-hadoop2.2.0.jar\org\apache\spark\sql下有没有hive文件夹,假设没有的话先下载支持hive版的spark。安装mysqllsb_release -a  查看虚拟机版本号http://dev...

  • CentOS7安装CDH 第十章:CDH中安装Spark2

    时间:2022-12-23 19:27:20

    相关文章链接CentOS7安装CDH 第一章:CentOS7系统安装CentOS7安装CDH 第二章:CentOS7各个软件安装和启动CentOS7安装CDH 第三章:CDH中的问题和解决方法CentOS7安装CDH 第四章:CDH的版本选择和安装方式CentOS7安装CDH 第五章:CDH的安装和...

  • CentOS7安装spark2.0集群

    时间:2022-12-22 13:26:45

    1、虚拟机运行环境:             JDK: jdk1.8.0_171 64位             Scala:scala-2.12.6            Spark:spark-2.3.1-bin-hadoop2.7 2、集群网络环境:     使用winscp工具上传jdk、s...

  • 7-安装Spark

    时间:2022-12-18 19:43:01

    1、Apache Hadoop2.7中的YARN与JAVA8有冲突,如果想要使用spark on yarn,首先需要在yarn-site.xml中配置如下项:<property> <name>yarn.nodemanager.pmem-check-enabled<...

  • 大数据笔记(二十七)——Spark Core简介及安装配置

    时间:2022-12-13 20:20:07

    1、Spark Core: 类似MapReduce 核心:RDD2、Spark SQL: 类似Hive,支持SQL3、Spark Streaming:类似Storm =================== Spark Core =================...

  • 大数据技术之_19_Spark学习_01_Spark 基础解析 + Spark 概述 + Spark 集群安装 + 执行 Spark 程序

    时间:2022-12-12 20:44:22

    第1章 Spark 概述1.1 什么是 Spark1.2 Spark 特点1.3 Spark 的用户和用途第2章 Spark 集群安装2.1 集群角色2.2 机器准备2.3 下载 Spark 安装包2.4 配置 Spark Standalone 模式2.5 配置 Spark History Serv...

  • 安装spark ha集群

    时间:2022-12-04 00:13:22

    安装spark ha集群 1.默认安装好hadoop+zookeeper2.安装scala1.解压安装包tar zxvf scala-2.11.7.tgz2.配置环境变量vim /etc/profile#scalaexport SCALA_HOME=/opt/scala-2.11.7#CLASSPA...

  • Windows32或64位下载安装配置Spark

    时间:2022-11-30 18:43:47

    【学习笔记】 Windows 32或64位下载安装配置Spark:1)下载地址:http://spark.apache.org/downloads.html马克-to-win @ 马克java社区:选择需要下载的Spark版本,我选的是当前最新的版本2.2.0。因为我已经安装了Hadoop 2.7....

  • linux安装JDK1.8、tomcat8、Maven3.2、Scala2.10、Spark1.3.0

    时间:2022-11-17 13:48:41

    下载JDK1.8、tomcat8、Maven、Spark、Scala wget http://download.oracle.com/otn-pub/java/jdk/8u45-b14/jdk-8u45-linux-x64.tar.gz wget http://mirrors.h...

  • 如何在虚拟机上安装和配置Spark开发环境

    时间:2022-11-13 18:55:06

    如何文章目录​​如何​​​​在虚拟机上安装和配置Spark开发环境​​​​下载解压安装包​​​​配置环境变量:​​​​修改Spark配置文件​​​​校验​​在虚拟机上安装和配置Spark开发环境背景:​​Apache Spark​​​是专为大规模数据处理而设计的快速通用的计算引擎。​​Spark​​...

  • Spark简单介绍,Windows下安装Scala+Hadoop+Spark运行环境,集成到IDEA中

    时间:2022-11-03 09:05:56

    一、前言近几年大数据是异常的火爆,今天小编以java开发的身份来会会大数据,提高一下自己的层面!大数据技术也是有很多:HadoopSparkFlink小编也只知道这些了,由于Hadoop,存在一定的缺陷(循环迭代式数据流处理:多并行运行的数据可复用场景效率不行)。所以Spark出来了,一匹黑马,8个...