spark-xml:Spark SQL和DataFrames的XML数据源

时间:2021-05-12 10:29:18
【文件属性】:
文件名称:spark-xml:Spark SQL和DataFrames的XML数据源
文件大小:167KB
文件格式:ZIP
更新时间:2021-05-12 10:29:18
Scala Apache Spark的XML数据源 一个用于使用解析和查询XML数据的库,用于Spark SQL和DataFrames。 结构和测试工具大部分是从复制的。 该软件包支持以分布式方式处理无格式的XML文件,这与Spark中的JSON数据源限制嵌入式JSON格式不同。 从0.6.x开始,还支持Spark 3.x(需要Scala 2.12) 要求 spark-xml 火花 0.6.x + 2.3.x +,3.x 0.5.x 2.2.x-2.4.x 0.4.x 2.0.x-2.1.x 0.3.x 1.x 连结中 您可以在程序中的以下坐标处链接到该库: Scala2.11 groupId: com.databricks artifactId: spark-xml_2.11 version: 0.12.0 Scala2.12 groupId: com.databricks

网友评论