sparkSQL 连接读取Oracle数据库

发布时间:2025-02-10 02:37

参加Oracle Certified Professional培训,精通Oracle数据库操作 #生活技巧# #工作学习技巧# #工作技能认证#

最新推荐文章于 2024-12-08 19:42:25 发布

thinklog2018 于 2018-06-05 10:35:27 发布

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

类似于mysql的连接方式,不过稍有细节差别。

1. Oracle数据库在安装后一般会在$ORACLE_HOME/jdbc/lib目录中放置ojdbc*.jar等jar文件,将这些文件复制到spark集群服务器上,比如$SPARK_HOME/jars/中,然后修改CLASSPATH=$SPARK_HOME/jars/ojdbc6.jar:$CLASSPATH

2. 重启jupyter notebook

3.  连接读取oracle数据库

from pyspark.sql import SparkSession

try:
   sc.stop()
except:
    pass

spk = SparkSession.builder.master("spark://192.168.12.7:7077").appName("spark-oracle").getOrCreate()
print(spk)
sc11=spk.sparkContext
print(sc11)

#从oracle 数据库表中读取数据到spark,如果要使用sql语句,则必须添加别名alias,比如下面的t
sqltext="(select col1,col2,col3 from tablename) t"
jdbcdf = spk.read.format('jdbc').options(
    url='jdbc:oracle:thin:@//192.168.2.7:1521/dbname',
    dbtable=sqltext,
    user='username',
    password='password'   
).load()
print(jdbcdf)
jdbcdf.createOrReplaceTempView('ls')
spk.sql("select * from ls).show()

sc11.stop()

网址:sparkSQL 连接读取Oracle数据库 https://www.yuejiaxmz.com/news/view/764145

相关内容

Oracle数据库数据安全面面观
Oracle数据库日常维护命令
Oracle数据库日常维护知识总结
Oracle数据库日常维护技巧与最佳实践:提升性能与安全
oracle 清理lob set (lob字段)='n',ORACLE数据库使用的常见问题(三)
Oracle数据库高效数据清洗策略与实践案例分析
Oracle数据库日常管理与维护技巧:提升SQL性能与数据安全
达梦数据库
数据库 = JDBC,连接池对象
数据库连接对象Connection对象的获取及相关知识总结

随便看看