温馨提示×

spark如何连接mysql数据库

小亿
276
2024-05-06 19:49:53
栏目: 云计算
亿速云云数据库,读写分离,安全稳定,弹性扩容,低至0.3元/天!! 点击查看>>

在Spark中连接MySQL数据库有两种方式:

  1. 使用JDBC连接:
import org.apache.spark.sql.SparkSession

val spark = SparkSession.builder()
  .appName("MySQLExample")
  .getOrCreate()

val url = "jdbc:mysql://hostname:port/databaseName"
val table = "tableName"
val properties = new Properties()
properties.put("user", "username")
properties.put("password", "password")

val df = spark.read.jdbc(url, table, properties)
df.show()
  1. 使用MySQL Connector for Apache Spark:

首先需要在spark-submit命令中添加MySQL Connector的jar包路径:

spark-submit --jars /path/to/mysql-connector-java.jar --class your_class your_jar.jar

然后在代码中使用MySQL Connector连接MySQL数据库:

import org.apache.spark.sql.SparkSession

val spark = SparkSession.builder()
  .appName("MySQLExample")
  .getOrCreate()

val url = "jdbc:mysql://hostname:port/databaseName"
val table = "tableName"
val properties = new Properties()
properties.put("user", "username")
properties.put("password", "password")

val df = spark.read.format("jdbc")
  .option("url", url)
  .option("dbtable", table)
  .option("user", properties.getProperty("user"))
  .option("password", properties.getProperty("password"))
  .load()

df.show()

以上是两种连接MySQL数据库的方式,可以根据需要选择适合自己的方法。

亿速云「云数据库 MySQL」免部署即开即用,比自行安装部署数据库高出1倍以上的性能,双节点冗余防止单节点故障,数据自动定期备份随时恢复。点击查看>>

推荐阅读:spark连接mysql数据库后怎么使用

0