参考http://www.mamicode.com/info-detail-1523356.html
1.远端执行:vi /etc/profile
添加一行:
PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.9-src.zip
或者PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip
2.安装pip 和 py4j
下载pip-9.0.1.tar.gz和py4j-0.10.4.tar.gz
解压pip-9.0.1.tar.gz和py4j-0.10.4.tar.gz,cd到解压目录执行:sudo python setup.py install
3.本地Pycharm设置
File > Settings > Project Interpreter:
Tools > Dployment > Configuration:
4.运行代码中加入:
import os
import sys
os.environ['SPARK_HOME'] = "/opt/cloudera/parcels/CDH-5.9.1-1.cdh5.9.1.p0.4/lib/spark"
sys.path.append("/opt/cloudera/parcels/CDH-5.9.1-1.cdh5.9.1.p0.4/lib/spark/python")
相关文章
- Qt Creator + MinGW 在windows 下的调试GDB停止工作解决
- windows环境下:MySQL远程连接失败(错误码:2003)
- Windows下远程删除文件/目录命令
- windows下开启mysql远程访问
- [Android] Windows 7下 Android studio 安装 Genymotion 来调试 Android 遇到的问题总结
- windows下pyspark异常
- windows下ssh远程连接服务器
- Windows下配置SSH实现免密访问和远程端口转发
- windows10下设置Maven的本地仓库和阿里云的远程*仓库
- Windows server 2012下搭建MySQL数据库并创建远程连接