【文件属性】:
文件名称:spark-xml:Spark SQL和DataFrames的XML数据源
文件大小:167KB
文件格式:ZIP
更新时间:2021-05-12 10:29:18
Scala
Apache Spark的XML数据源
一个用于使用解析和查询XML数据的库,用于Spark SQL和DataFrames。 结构和测试工具大部分是从复制的。
该软件包支持以分布式方式处理无格式的XML文件,这与Spark中的JSON数据源限制嵌入式JSON格式不同。
从0.6.x开始,还支持Spark 3.x(需要Scala 2.12)
要求
spark-xml
火花
0.6.x +
2.3.x +,3.x
0.5.x
2.2.x-2.4.x
0.4.x
2.0.x-2.1.x
0.3.x
1.x
连结中
您可以在程序中的以下坐标处链接到该库:
Scala2.11
groupId: com.databricks
artifactId: spark-xml_2.11
version: 0.12.0
Scala2.12
groupId: com.databricks