Rebasing

JosepSampe · Oct 24, 2024 · b5c9d4a · b5c9d4a
1 parent 5be787a
commit b5c9d4a
Show file tree

Hide file tree

Showing 216 changed files with 325 additions and 265 deletions.
diff --git a/.github/workflows/test-artifact.yml b/.github/workflows/test-artifact.yml
@@ -31,7 +31,7 @@ jobs:
       run: sbt "scalafixAll --check"
     - name: Test
       run: |
-        sbt coverage 'test' coverageReport
+        sbt coverage 'qbeastCore/test' 'qbeastDelta/test' 'qbeastSpark/test' coverageReport
     - name: Upload to Codecov
       run: |
         curl https://keybase.io/codecovsecurity/pgp_keys.asc | gpg --no-default-keyring --keyring trustedkeys.gpg --import # One-time step

diff --git a/CONTRIBUTING.md b/CONTRIBUTING.md
@@ -193,8 +193,8 @@ sbt assembly
 $SPARK_HOME/bin/spark-shell \
 --jars ./target/scala-2.12/qbeast-spark-assembly-0.6.0.jar \
 --packages io.delta:delta-spark_2.12:3.1.0 \
---conf spark.sql.extensions=io.qbeast.spark.delta.QbeastDeltaSparkSessionExtension \
---conf spark.sql.catalog.spark_catalog=io.qbeast.spark.internal.sources.catalog.QbeastCatalog
+--conf spark.sql.extensions=io.qbeast.sql.QbeastSparkSessionExtension \
+--conf spark.sql.catalog.spark_catalog=io.qbeast.catalog.QbeastCatalog
 ```
 
 ### 4. Publishing artefacts in the local repository
@@ -280,8 +280,8 @@ To publish a new version of the qbeast-spark project, follow these steps:
 export QBEAST_SPARK_VERSION=0.6.0-SNAPSHOT
 $SPARK_350/bin/spark-shell --repositories https://s01.oss.sonatype.org/content/repositories/snapshots \
 --packages io.delta:delta-spark_2.12:3.1.0,io.qbeast:qbeast-spark_2.12:$QBEAST_SPARK_VERSION \
---conf spark.sql.extensions=io.qbeast.spark.delta.QbeastDeltaSparkSessionExtension \
---conf spark.sql.catalog.spark_catalog=io.qbeast.spark.internal.sources.catalog.QbeastCatalog
+--conf spark.sql.extensions=io.qbeast.sql.QbeastSparkSessionExtension \
+--conf spark.sql.catalog.spark_catalog=io.qbeast.catalog.QbeastCatalog
 
 ```
 6. If everything is ok, change the `build.sbt` with the corresponding version and publish the RC.

diff --git a/README.md b/README.md
@@ -89,8 +89,8 @@ export SPARK_HOME=$PWD/spark-3.5.0-bin-hadoop3
 ```bash
 $SPARK_HOME/bin/spark-shell \
 --packages io.qbeast:qbeast-spark_2.12:0.7.0,io.delta:delta-spark_2.12:3.1.0 \
---conf spark.sql.extensions=io.qbeast.spark.delta.QbeastDeltaSparkSessionExtension \
---conf spark.sql.catalog.spark_catalog=io.qbeast.spark.internal.sources.catalog.QbeastCatalog
+--conf spark.sql.extensions=io.qbeast.sql.QbeastSparkSessionExtension \
+--conf spark.sql.catalog.spark_catalog=io.qbeast.catalog.QbeastCatalog
 ```
 
 ### 2. Indexing a dataset
@@ -173,7 +173,7 @@ Go to the [Quickstart](./docs/Quickstart.md) or [notebook](docs/sample_pushdown_
 Get **insights** to the data using the `QbeastTable` interface!
 
 ```scala
-import io.qbeast.spark.QbeastTable
+import io.qbeast.table.QbeastTable
 
 val qbeastTable = QbeastTable.forPath(spark, tmpDir) 
 

diff --git a/build.sbt b/build.sbt
@@ -3,26 +3,49 @@ import Dependencies._
 
 val mainVersion = "0.8.0-SNAPSHOT"
 
-// Projects
+lazy val qbeastCore = (project in file("./core"))
+  .settings(
+    name := "qbeast-core",
+    libraryDependencies ++= Seq(sparkCore % Provided, sparkSql % Provided, sparkml % Provided),
+    Test / parallelExecution := false,
+    assembly / test := {},
+    assembly / assemblyOption := (assembly / assemblyOption).value.copy(includeScala = false))
+  .settings(noWarningInConsole)
+
+lazy val qbeastDelta = (project in file("./delta"))
+  .dependsOn(qbeastCore)
+  .settings(
+    name := "qbeast-delta",
+    libraryDependencies ++= Seq(sparkCore % Provided, deltaSpark % Provided, sparkSql % Provided),
+    Test / parallelExecution := false,
+    assembly / test := {},
+    assembly / assemblyOption := (assembly / assemblyOption).value.copy(includeScala = false))
+  .settings(noWarningInConsole)
+
 lazy val qbeastSpark = (project in file("."))
+  .dependsOn(qbeastCore, qbeastDelta)
   .enablePlugins(ScalaUnidocPlugin)
   .settings(
     name := "qbeast-spark",
     libraryDependencies ++= Seq(
       sparkCore % Provided,
       sparkSql % Provided,
-      hadoopClient % Provided,
       deltaSpark % Provided,
-      sparkml % Provided,
-      apacheCommons % Test,
-      amazonAws % Test,
-      hadoopCommons % Test,
+      sparkml % Test,
       hadoopAws % Test),
     Test / parallelExecution := false,
     assembly / test := {},
     assembly / assemblyOption := (assembly / assemblyOption).value.copy(includeScala = false))
   .settings(noWarningInConsole)
 
+qbeastCore / Compile / doc / scalacOptions ++= Seq(
+  "-doc-title",
+  "qbeast-core",
+  "-doc-version",
+  mainVersion,
+  "-doc-footer",
+  "Copyright 2022 Qbeast - Docs for version " + mainVersion + " of qbeast-core")
+
 qbeastSpark / Compile / doc / scalacOptions ++= Seq(
   "-doc-title",
   "qbeast-spark",
@@ -31,6 +54,14 @@ qbeastSpark / Compile / doc / scalacOptions ++= Seq(
   "-doc-footer",
   "Copyright 2022 Qbeast - Docs for version " + mainVersion + " of qbeast-spark")
 
+qbeastDelta / Compile / doc / scalacOptions ++= Seq(
+  "-doc-title",
+  "qbeast-delta",
+  "-doc-version",
+  mainVersion,
+  "-doc-footer",
+  "Copyright 2022 Qbeast - Docs for version " + mainVersion + " of qbeast-delta")
+
 // Common metadata
 ThisBuild / version := mainVersion
 ThisBuild / organization := "io.qbeast"

diff --git a/.../scala/io/qbeast/core/keeper/Keeper.scala → .../scala/io/qbeast/core/keeper/Keeper.scala b/.../scala/io/qbeast/core/keeper/Keeper.scala → .../scala/io/qbeast/core/keeper/Keeper.scala
diff --git a/...a/io/qbeast/core/keeper/LocalKeeper.scala → ...a/io/qbeast/core/keeper/LocalKeeper.scala b/...a/io/qbeast/core/keeper/LocalKeeper.scala → ...a/io/qbeast/core/keeper/LocalKeeper.scala
diff --git a/...in/scala/io/qbeast/core/model/Block.scala → ...in/scala/io/qbeast/core/model/Block.scala b/...in/scala/io/qbeast/core/model/Block.scala → ...in/scala/io/qbeast/core/model/Block.scala
diff --git a/.../core/model/BroadcastedTableChanges.scala → .../core/model/BroadcastedTableChanges.scala b/.../core/model/BroadcastedTableChanges.scala → .../core/model/BroadcastedTableChanges.scala
@@ -15,11 +15,11 @@
  */
 package io.qbeast.core.model
 
-import io.qbeast.spark.model.CubeState
-import io.qbeast.spark.model.CubeState.CubeStateValue
 import org.apache.spark.broadcast.Broadcast
 import org.apache.spark.sql.SparkSession
 
+import CubeState.CubeStateValue
+
 /**
  * Container for the table changes
  */

diff --git a/.../io/qbeast/core/model/ColumnToIndex.scala → .../io/qbeast/core/model/ColumnToIndex.scala b/.../io/qbeast/core/model/ColumnToIndex.scala → .../io/qbeast/core/model/ColumnToIndex.scala
diff --git a/...beast/core/model/ColumnToIndexUtils.scala → ...beast/core/model/ColumnToIndexUtils.scala b/...beast/core/model/ColumnToIndexUtils.scala → ...beast/core/model/ColumnToIndexUtils.scala
diff --git a/...t/core/model/ColumnsToIndexSelector.scala → ...t/core/model/ColumnsToIndexSelector.scala b/...t/core/model/ColumnsToIndexSelector.scala → ...t/core/model/ColumnsToIndexSelector.scala
diff --git a/...beast/core/model/CubeDomainsBuilder.scala → ...beast/core/model/CubeDomainsBuilder.scala b/...beast/core/model/CubeDomainsBuilder.scala → ...beast/core/model/CubeDomainsBuilder.scala
diff --git a/...n/scala/io/qbeast/core/model/CubeId.scala → ...n/scala/io/qbeast/core/model/CubeId.scala b/...n/scala/io/qbeast/core/model/CubeId.scala → ...n/scala/io/qbeast/core/model/CubeId.scala
diff --git a/...st/core/model/CubeNormalizedWeights.scala → ...st/core/model/CubeNormalizedWeights.scala b/...st/core/model/CubeNormalizedWeights.scala → ...st/core/model/CubeNormalizedWeights.scala
diff --git a/...ala/io/qbeast/spark/model/CubeState.scala → ...cala/io/qbeast/core/model/CubeState.scala b/...ala/io/qbeast/spark/model/CubeState.scala → ...cala/io/qbeast/core/model/CubeState.scala
@@ -13,7 +13,7 @@
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */
-package io.qbeast.spark.model
+package io.qbeast.core.model
 
 /**
  * Names of possible states of the cube

diff --git a/...ala/io/qbeast/core/model/DataWriter.scala → ...ala/io/qbeast/core/model/DataWriter.scala b/...ala/io/qbeast/core/model/DataWriter.scala → ...ala/io/qbeast/core/model/DataWriter.scala
diff --git a/...qbeast/core/model/DenormalizedBlock.scala → ...qbeast/core/model/DenormalizedBlock.scala b/...qbeast/core/model/DenormalizedBlock.scala → ...qbeast/core/model/DenormalizedBlock.scala
diff --git a/.../qbeast/core/model/IndexFileBuilder.scala → .../qbeast/core/model/IndexFileBuilder.scala b/.../qbeast/core/model/IndexFileBuilder.scala → .../qbeast/core/model/IndexFileBuilder.scala
diff --git a/...a/io/qbeast/core/model/IndexManager.scala → ...a/io/qbeast/core/model/IndexManager.scala b/...a/io/qbeast/core/model/IndexManager.scala → ...a/io/qbeast/core/model/IndexManager.scala
diff --git a/...o/qbeast/core/model/MetadataManager.scala → ...o/qbeast/core/model/MetadataManager.scala b/...o/qbeast/core/model/MetadataManager.scala → ...o/qbeast/core/model/MetadataManager.scala
diff --git a/.../qbeast/core/model/NormalizedWeight.scala → .../qbeast/core/model/NormalizedWeight.scala b/.../qbeast/core/model/NormalizedWeight.scala → .../qbeast/core/model/NormalizedWeight.scala
diff --git a/...in/scala/io/qbeast/core/model/Point.scala → ...in/scala/io/qbeast/core/model/Point.scala b/...in/scala/io/qbeast/core/model/Point.scala → ...in/scala/io/qbeast/core/model/Point.scala
diff --git a/...beast/core/model/PointWeightIndexer.scala → ...beast/core/model/PointWeightIndexer.scala b/...beast/core/model/PointWeightIndexer.scala → ...beast/core/model/PointWeightIndexer.scala
diff --git a/.../io/qbeast/core/model/PreCommitHook.scala → .../io/qbeast/core/model/PreCommitHook.scala b/.../io/qbeast/core/model/PreCommitHook.scala → .../io/qbeast/core/model/PreCommitHook.scala
diff --git a/...cala/io/qbeast/core/model/QDataType.scala → ...cala/io/qbeast/core/model/QDataType.scala b/...cala/io/qbeast/core/model/QDataType.scala → ...cala/io/qbeast/core/model/QDataType.scala
diff --git a/...qbeast/core/model/QbeastCoreContext.scala → ...qbeast/core/model/QbeastCoreContext.scala b/...qbeast/core/model/QbeastCoreContext.scala → ...qbeast/core/model/QbeastCoreContext.scala
diff --git a/...la/io/qbeast/core/model/QbeastFiles.scala → ...la/io/qbeast/core/model/QbeastFiles.scala b/...la/io/qbeast/core/model/QbeastFiles.scala → ...la/io/qbeast/core/model/QbeastFiles.scala
diff --git a/...io/qbeast/core/model/QbeastSnapshot.scala → ...io/qbeast/core/model/QbeastSnapshot.scala b/...io/qbeast/core/model/QbeastSnapshot.scala → ...io/qbeast/core/model/QbeastSnapshot.scala
diff --git a/...la/io/qbeast/core/model/QbeastStats.scala → ...la/io/qbeast/core/model/QbeastStats.scala b/...la/io/qbeast/core/model/QbeastStats.scala → ...la/io/qbeast/core/model/QbeastStats.scala
diff --git a/...ala/io/qbeast/core/model/QuerySpace.scala → ...ala/io/qbeast/core/model/QuerySpace.scala b/...ala/io/qbeast/core/model/QuerySpace.scala → ...ala/io/qbeast/core/model/QuerySpace.scala
diff --git a/...o/qbeast/core/model/RevisionClasses.scala → ...o/qbeast/core/model/RevisionClasses.scala b/...o/qbeast/core/model/RevisionClasses.scala → ...o/qbeast/core/model/RevisionClasses.scala
diff --git a/...beast/core/model/StagingDataManager.scala → ...beast/core/model/StagingDataManager.scala b/...beast/core/model/StagingDataManager.scala → ...beast/core/model/StagingDataManager.scala
diff --git a/...a/io/qbeast/core/model/StagingUtils.scala → ...a/io/qbeast/core/model/StagingUtils.scala b/...a/io/qbeast/core/model/StagingUtils.scala → ...a/io/qbeast/core/model/StagingUtils.scala
diff --git a/...n/scala/io/qbeast/core/model/Weight.scala → ...n/scala/io/qbeast/core/model/Weight.scala b/...n/scala/io/qbeast/core/model/Weight.scala → ...n/scala/io/qbeast/core/model/Weight.scala
diff --git a/...la/io/qbeast/core/model/WeightRange.scala → ...la/io/qbeast/core/model/WeightRange.scala b/...la/io/qbeast/core/model/WeightRange.scala → ...la/io/qbeast/core/model/WeightRange.scala
diff --git a/.../scala/io/qbeast/core/model/package.scala → .../scala/io/qbeast/core/model/package.scala b/.../scala/io/qbeast/core/model/package.scala → .../scala/io/qbeast/core/model/package.scala
diff --git a/...m/CDFNumericQuantilesTransformation.scala → ...m/CDFNumericQuantilesTransformation.scala b/...m/CDFNumericQuantilesTransformation.scala → ...m/CDFNumericQuantilesTransformation.scala
diff --git a/...form/CDFNumericQuantilesTransformer.scala → ...form/CDFNumericQuantilesTransformer.scala b/...form/CDFNumericQuantilesTransformer.scala → ...form/CDFNumericQuantilesTransformer.scala
diff --git a/...ransform/CDFQuantilesTransformation.scala → ...ransform/CDFQuantilesTransformation.scala b/...ransform/CDFQuantilesTransformation.scala → ...ransform/CDFQuantilesTransformation.scala
diff --git a/...e/transform/CDFQuantilesTransformer.scala → ...e/transform/CDFQuantilesTransformer.scala b/...e/transform/CDFQuantilesTransformer.scala → ...e/transform/CDFQuantilesTransformer.scala
diff --git a/...rm/CDFStringQuantilesTransformation.scala → ...rm/CDFStringQuantilesTransformation.scala b/...rm/CDFStringQuantilesTransformation.scala → ...rm/CDFStringQuantilesTransformation.scala
diff --git a/...sform/CDFStringQuantilesTransformer.scala → ...sform/CDFStringQuantilesTransformer.scala b/...sform/CDFStringQuantilesTransformer.scala → ...sform/CDFStringQuantilesTransformer.scala
diff --git a/.../core/transform/EmptyTransformation.scala → .../core/transform/EmptyTransformation.scala b/.../core/transform/EmptyTransformation.scala → .../core/transform/EmptyTransformation.scala
diff --git a/...ast/core/transform/EmptyTransformer.scala → ...ast/core/transform/EmptyTransformer.scala b/...ast/core/transform/EmptyTransformer.scala → ...ast/core/transform/EmptyTransformer.scala
diff --git a/...t/core/transform/HashTransformation.scala → ...t/core/transform/HashTransformation.scala b/...t/core/transform/HashTransformation.scala → ...t/core/transform/HashTransformation.scala
diff --git a/...east/core/transform/HashTransformer.scala → ...east/core/transform/HashTransformer.scala b/...east/core/transform/HashTransformer.scala → ...east/core/transform/HashTransformer.scala
diff --git a/...core/transform/LinearTransformation.scala → ...core/transform/LinearTransformation.scala b/...core/transform/LinearTransformation.scala → ...core/transform/LinearTransformation.scala
diff --git a/...st/core/transform/LinearTransformer.scala → ...st/core/transform/LinearTransformer.scala b/...st/core/transform/LinearTransformer.scala → ...st/core/transform/LinearTransformer.scala
diff --git a/...orm/ManualPlaceholderTransformation.scala → ...orm/ManualPlaceholderTransformation.scala b/...orm/ManualPlaceholderTransformation.scala → ...orm/ManualPlaceholderTransformation.scala
diff --git a/...beast/core/transform/Transformation.scala → ...beast/core/transform/Transformation.scala b/...beast/core/transform/Transformation.scala → ...beast/core/transform/Transformation.scala
diff --git a/...o/qbeast/core/transform/Transformer.scala → ...o/qbeast/core/transform/Transformer.scala b/...o/qbeast/core/transform/Transformer.scala → ...o/qbeast/core/transform/Transformer.scala
diff --git a/src/main/scala/io/qbeast/package.scala → core/src/main/scala/io/qbeast/package.scala b/src/main/scala/io/qbeast/package.scala → core/src/main/scala/io/qbeast/package.scala
diff --git a/...a/io/qbeast/spark/implicits/package.scala → ...a/io/qbeast/spark/implicits/package.scala b/...a/io/qbeast/spark/implicits/package.scala → ...a/io/qbeast/spark/implicits/package.scala
diff --git a/...o/qbeast/spark/index/ColumnsToIndex.scala → ...o/qbeast/spark/index/ColumnsToIndex.scala b/...o/qbeast/spark/index/ColumnsToIndex.scala → ...o/qbeast/spark/index/ColumnsToIndex.scala
diff --git a/...o/qbeast/spark/index/EmptyFileIndex.scala → ...o/qbeast/spark/index/EmptyFileIndex.scala b/...o/qbeast/spark/index/EmptyFileIndex.scala → ...o/qbeast/spark/index/EmptyFileIndex.scala
@@ -23,7 +23,7 @@ import org.apache.spark.sql.types.StructField
 import org.apache.spark.sql.types.StructType
 
 /**
- * Implementation of FileIndex to be used for empty tables.
+ * Implementation of FileIndex to be used for empty table.
  */
 object EmptyFileIndex extends FileIndex with Serializable {
 

diff --git a/...east/spark/index/IndexStatusBuilder.scala → ...east/spark/index/IndexStatusBuilder.scala b/...east/spark/index/IndexStatusBuilder.scala → ...east/spark/index/IndexStatusBuilder.scala
diff --git a/...beast/spark/index/OTreeDataAnalyzer.scala → ...beast/spark/index/OTreeDataAnalyzer.scala b/...beast/spark/index/OTreeDataAnalyzer.scala → ...beast/spark/index/OTreeDataAnalyzer.scala
diff --git a/...io/qbeast/spark/index/QbeastColumns.scala → ...io/qbeast/spark/index/QbeastColumns.scala b/...io/qbeast/spark/index/QbeastColumns.scala → ...io/qbeast/spark/index/QbeastColumns.scala
diff --git a/...cala/io/qbeast/spark/index/RowUtils.scala → ...cala/io/qbeast/spark/index/RowUtils.scala b/...cala/io/qbeast/spark/index/RowUtils.scala → ...cala/io/qbeast/spark/index/RowUtils.scala
diff --git a/...k/index/SparkColumnsToIndexSelector.scala → ...k/index/SparkColumnsToIndexSelector.scala b/...k/index/SparkColumnsToIndexSelector.scala → ...k/index/SparkColumnsToIndexSelector.scala
diff --git a/...beast/spark/index/SparkOTreeManager.scala → ...beast/spark/index/SparkOTreeManager.scala b/...beast/spark/index/SparkOTreeManager.scala → ...beast/spark/index/SparkOTreeManager.scala
diff --git a/...spark/index/SparkPointWeightIndexer.scala → ...spark/index/SparkPointWeightIndexer.scala b/...spark/index/SparkPointWeightIndexer.scala → ...spark/index/SparkPointWeightIndexer.scala
diff --git a/...st/spark/index/SparkRevisionFactory.scala → ...st/spark/index/SparkRevisionFactory.scala b/...st/spark/index/SparkRevisionFactory.scala → ...st/spark/index/SparkRevisionFactory.scala
diff --git a/...scala/io/qbeast/spark/index/package.scala → ...scala/io/qbeast/spark/index/package.scala b/...scala/io/qbeast/spark/index/package.scala → ...scala/io/qbeast/spark/index/package.scala
diff --git a/...ast/spark/index/query/QbeastFilters.scala → ...ast/spark/index/query/QbeastFilters.scala b/...ast/spark/index/query/QbeastFilters.scala → ...ast/spark/index/query/QbeastFilters.scala
diff --git a/...ast/spark/index/query/QueryExecutor.scala → ...ast/spark/index/query/QueryExecutor.scala b/...ast/spark/index/query/QueryExecutor.scala → ...ast/spark/index/query/QueryExecutor.scala
diff --git a/...spark/index/query/QueryFiltersUtils.scala → ...spark/index/query/QueryFiltersUtils.scala b/...spark/index/query/QueryFiltersUtils.scala → ...spark/index/query/QueryFiltersUtils.scala
diff --git a/.../qbeast/spark/index/query/QuerySpec.scala → .../qbeast/spark/index/query/QuerySpec.scala b/.../qbeast/spark/index/query/QuerySpec.scala → .../qbeast/spark/index/query/QuerySpec.scala
diff --git a/.../spark/index/query/QuerySpecBuilder.scala → .../spark/index/query/QuerySpecBuilder.scala b/.../spark/index/query/QuerySpecBuilder.scala → .../spark/index/query/QuerySpecBuilder.scala
diff --git a/...east/spark/internal/QbeastFunctions.scala → ...east/spark/internal/QbeastFunctions.scala b/...east/spark/internal/QbeastFunctions.scala → ...east/spark/internal/QbeastFunctions.scala
diff --git a/...qbeast/spark/internal/QbeastOptions.scala → ...qbeast/spark/internal/QbeastOptions.scala b/...qbeast/spark/internal/QbeastOptions.scala → ...qbeast/spark/internal/QbeastOptions.scala
@@ -24,6 +24,7 @@ import io.qbeast.spark.index.ColumnsToIndex
 import io.qbeast.spark.internal.QbeastOptions.COLUMNS_TO_INDEX
 import io.qbeast.spark.internal.QbeastOptions.CUBE_SIZE
 import org.apache.spark.qbeast.config.DEFAULT_CUBE_SIZE
+import org.apache.spark.qbeast.config.DEFAULT_TABLE_FORMAT
 import org.apache.spark.sql.catalyst.util.CaseInsensitiveMap
 import org.apache.spark.sql.AnalysisExceptionFactory
 import org.apache.spark.sql.DataFrame
@@ -56,6 +57,7 @@ import scala.util.matching.Regex
 case class QbeastOptions(
     columnsToIndex: Seq[String],
     cubeSize: Int,
+    tableFormat: String,
     stats: Option[DataFrame],
     txnAppId: Option[String],
     txnVersion: Option[String],
@@ -104,6 +106,7 @@ case class QbeastOptions(
 object QbeastOptions {
   val COLUMNS_TO_INDEX: String = "columnsToIndex"
   val CUBE_SIZE: String = "cubeSize"
+  val TABLE_FORMAT: String = "tableFormat"
   val PATH: String = "path"
   val STATS: String = "columnStats"
   val TXN_APP_ID: String = "txnAppId"
@@ -142,6 +145,12 @@ object QbeastOptions {
     }
   }
 
+  private def getTableFormat(options: Map[String, String]): String =
+    options.get(TABLE_FORMAT) match {
+      case Some(value) => value
+      case None => DEFAULT_TABLE_FORMAT
+    }
+
   /**
    * Get the column stats from the options This stats should be in a JSON formatted string with
    * the following schema {columnName_min:value, columnName_max:value, ...}
@@ -219,6 +228,7 @@ object QbeastOptions {
   def apply(options: CaseInsensitiveMap[String]): QbeastOptions = {
     val columnsToIndex = getColumnsToIndex(options)
     val desiredCubeSize = getDesiredCubeSize(options)
+    val tableFormat = getTableFormat(options)
     val stats = getStats(options)
     val txnAppId = getTxnAppId(options)
     val txnVersion = getTxnVersion(options)
@@ -230,6 +240,7 @@ object QbeastOptions {
     QbeastOptions(
       columnsToIndex,
       desiredCubeSize,
+      tableFormat,
       stats,
       txnAppId,
       txnVersion,
@@ -258,14 +269,33 @@ object QbeastOptions {
     val caseInsensitiveMap = CaseInsensitiveMap(options)
     val userMetadata = getUserMetadata(caseInsensitiveMap)
     val hookInfo = getHookInfo(caseInsensitiveMap)
-    QbeastOptions(Seq.empty, 0, None, None, None, userMetadata, None, None, hookInfo)
+    QbeastOptions(
+      Seq.empty,
+      0,
+      DEFAULT_TABLE_FORMAT,
+      None,
+      None,
+      None,
+      userMetadata,
+      None,
+      None,
+      hookInfo)
   }
 
   /**
    * The empty options to be used as a placeholder.
    */
   lazy val empty: QbeastOptions =
-    QbeastOptions(Seq.empty, DEFAULT_CUBE_SIZE, None, None, None, None, None, None)
+    QbeastOptions(
+      Seq.empty,
+      DEFAULT_CUBE_SIZE,
+      DEFAULT_TABLE_FORMAT,
+      None,
+      None,
+      None,
+      None,
+      None,
+      None)
 
   def loadTableIDFromParameters(parameters: Map[String, String]): QTableID = {
     new QTableID(

diff --git a/...ernal/expressions/QbeastMurmur3Hash.scala → ...ernal/expressions/QbeastMurmur3Hash.scala b/...ernal/expressions/QbeastMurmur3Hash.scala → ...ernal/expressions/QbeastMurmur3Hash.scala
diff --git a/.../io/qbeast/spark/utils/IndexMetrics.scala → .../io/qbeast/spark/utils/IndexMetrics.scala b/.../io/qbeast/spark/utils/IndexMetrics.scala → .../io/qbeast/spark/utils/IndexMetrics.scala
diff --git a/.../scala/io/qbeast/spark/utils/Params.scala → .../scala/io/qbeast/spark/utils/Params.scala b/.../scala/io/qbeast/spark/utils/Params.scala → .../scala/io/qbeast/spark/utils/Params.scala
diff --git a/...spark/utils/QbeastExceptionMessages.scala → ...spark/utils/QbeastExceptionMessages.scala b/...spark/utils/QbeastExceptionMessages.scala → ...spark/utils/QbeastExceptionMessages.scala
diff --git a/...east/spark/utils/SparkToQTypesUtils.scala → ...east/spark/utils/SparkToQTypesUtils.scala b/...east/spark/utils/SparkToQTypesUtils.scala → ...east/spark/utils/SparkToQTypesUtils.scala
diff --git a/...a/io/qbeast/spark/writer/BlockStats.scala → ...a/io/qbeast/spark/writer/BlockStats.scala b/...a/io/qbeast/spark/writer/BlockStats.scala → ...a/io/qbeast/spark/writer/BlockStats.scala
diff --git a/.../io/qbeast/spark/writer/BlockWriter.scala → .../io/qbeast/spark/writer/BlockWriter.scala b/.../io/qbeast/spark/writer/BlockWriter.scala → .../io/qbeast/spark/writer/BlockWriter.scala
@@ -16,13 +16,13 @@
 package io.qbeast.spark.writer
 
 import io.qbeast.core.model.CubeId
+import io.qbeast.core.model.CubeState
 import io.qbeast.core.model.IndexFile
 import io.qbeast.core.model.IndexFileBuilder
 import io.qbeast.core.model.IndexFileBuilder.BlockBuilder
 import io.qbeast.core.model.TableChanges
 import io.qbeast.core.model.Weight
 import io.qbeast.spark.index.QbeastColumns
-import io.qbeast.spark.model.CubeState
 import org.apache.hadoop.fs.Path
 import org.apache.hadoop.mapred.JobConf
 import org.apache.hadoop.mapred.TaskAttemptContextImpl

diff --git a/...qbeast/spark/writer/IndexFileWriter.scala → ...qbeast/spark/writer/IndexFileWriter.scala b/...qbeast/spark/writer/IndexFileWriter.scala → ...qbeast/spark/writer/IndexFileWriter.scala
diff --git a/...spark/writer/IndexFileWriterFactory.scala → ...spark/writer/IndexFileWriterFactory.scala b/...spark/writer/IndexFileWriterFactory.scala → ...spark/writer/IndexFileWriterFactory.scala
diff --git a/...scala/io/qbeast/spark/writer/Rollup.scala → ...scala/io/qbeast/spark/writer/Rollup.scala b/...scala/io/qbeast/spark/writer/Rollup.scala → ...scala/io/qbeast/spark/writer/Rollup.scala
diff --git a/...beast/spark/writer/RollupDataWriter.scala → ...beast/spark/writer/RollupDataWriter.scala b/...beast/spark/writer/RollupDataWriter.scala → ...beast/spark/writer/RollupDataWriter.scala
diff --git a/...io/qbeast/spark/writer/StatsTracker.scala → ...io/qbeast/spark/writer/StatsTracker.scala b/...io/qbeast/spark/writer/StatsTracker.scala → ...io/qbeast/spark/writer/StatsTracker.scala
diff --git a/...cala/org/apache/spark/qbeast/config.scala → ...cala/org/apache/spark/qbeast/config.scala b/...cala/org/apache/spark/qbeast/config.scala → ...cala/org/apache/spark/qbeast/config.scala
@@ -15,10 +15,10 @@
  */
 package org.apache.spark.qbeast
 
-import io.qbeast.context.QbeastContext
 import org.apache.spark.internal.config.ConfigBuilder
 import org.apache.spark.internal.config.ConfigEntry
 import org.apache.spark.internal.config.OptionalConfigEntry
+import org.apache.spark.sql.SparkSession
 
 package object config {
 
@@ -58,19 +58,31 @@ package object config {
       .intConf
       .createWithDefault(3)
 
-  def DEFAULT_NUMBER_OF_RETRIES: Int = QbeastContext.config
+  private[config] val tableFormat: ConfigEntry[String] =
+    ConfigBuilder("spark.qbeast.tableFormat")
+      .version("0.2.0")
+      .stringConf
+      .createWithDefault("delta")
+
+  def DEFAULT_NUMBER_OF_RETRIES: Int = SparkSession.active.sparkContext.conf
     .get(defaultNumberOfRetries)
 
-  def DEFAULT_CUBE_SIZE: Int = QbeastContext.config
+  def DEFAULT_CUBE_SIZE: Int = SparkSession.active.sparkContext.conf
     .get(defaultCubeSize)
 
-  def CUBE_WEIGHTS_BUFFER_CAPACITY: Long = QbeastContext.config
+  def DEFAULT_TABLE_FORMAT: String = SparkSession.active.sparkContext.conf
+    .get(tableFormat)
+
+  def CUBE_WEIGHTS_BUFFER_CAPACITY: Long = SparkSession.active.sparkContext.conf
     .get(cubeWeightsBufferCapacity)
 
-  def STAGING_SIZE_IN_BYTES: Option[Long] = QbeastContext.config.get(stagingSizeInBytes)
+  def STAGING_SIZE_IN_BYTES: Option[Long] =
+    SparkSession.active.sparkContext.conf.get(stagingSizeInBytes)
 
-  def COLUMN_SELECTOR_ENABLED: Boolean = QbeastContext.config.get(columnsToIndexSelectorEnabled)
+  def COLUMN_SELECTOR_ENABLED: Boolean =
+    SparkSession.active.sparkContext.conf.get(columnsToIndexSelectorEnabled)
 
-  def MAX_NUM_COLUMNS_TO_INDEX: Int = QbeastContext.config.get(maxNumColumnsToIndex)
+  def MAX_NUM_COLUMNS_TO_INDEX: Int =
+    SparkSession.active.sparkContext.conf.get(maxNumColumnsToIndex)
 
 }
diff --git a/.../spark/sql/AnalysisExceptionFactory.scala → .../spark/sql/AnalysisExceptionFactory.scala b/.../spark/sql/AnalysisExceptionFactory.scala → .../spark/sql/AnalysisExceptionFactory.scala
diff --git a/...org/apache/spark/sql/DataFrameUtils.scala → ...org/apache/spark/sql/DataFrameUtils.scala b/...org/apache/spark/sql/DataFrameUtils.scala → ...org/apache/spark/sql/DataFrameUtils.scala
diff --git a/...org/apache/spark/sql/DatasetFactory.scala → ...org/apache/spark/sql/DatasetFactory.scala b/...org/apache/spark/sql/DatasetFactory.scala → ...org/apache/spark/sql/DatasetFactory.scala
diff --git a/...la/org/apache/spark/sql/SchemaUtils.scala → ...la/org/apache/spark/sql/SchemaUtils.scala b/...la/org/apache/spark/sql/SchemaUtils.scala → ...la/org/apache/spark/sql/SchemaUtils.scala
diff --git a/.../apache/spark/sql/SparkCatalogUtils.scala → .../apache/spark/sql/SparkCatalogUtils.scala b/.../apache/spark/sql/SparkCatalogUtils.scala → .../apache/spark/sql/SparkCatalogUtils.scala
diff --git a/.../org/apache/spark/sql/V2AndV1Traits.scala → .../org/apache/spark/sql/V2AndV1Traits.scala b/.../org/apache/spark/sql/V2AndV1Traits.scala → .../org/apache/spark/sql/V2AndV1Traits.scala
diff --git a/...onnector/catalog/SparkCatalogV2Util.scala → ...onnector/catalog/SparkCatalogV2Util.scala b/...onnector/catalog/SparkCatalogV2Util.scala → ...onnector/catalog/SparkCatalogV2Util.scala
diff --git a/...qbeast/core/model/CubeKeyFactoryJava.java → ...qbeast/core/model/CubeKeyFactoryJava.java b/...qbeast/core/model/CubeKeyFactoryJava.java → ...qbeast/core/model/CubeKeyFactoryJava.java
diff --git a/...beast/spark/model/CubeKeyFactoryJava.java → ...beast/spark/model/CubeKeyFactoryJava.java b/...beast/spark/model/CubeKeyFactoryJava.java → ...beast/spark/model/CubeKeyFactoryJava.java
diff --git a/...cala/io/qbeast/core/model/BlockTest.scala → ...cala/io/qbeast/core/model/BlockTest.scala b/...cala/io/qbeast/core/model/BlockTest.scala → ...cala/io/qbeast/core/model/BlockTest.scala
diff --git a/...qbeast/core/model/ColumnToIndexTest.scala → ...qbeast/core/model/ColumnToIndexTest.scala b/...qbeast/core/model/ColumnToIndexTest.scala → ...qbeast/core/model/ColumnToIndexTest.scala
diff --git a/...t/core/model/ColumnToIndexUtilsTest.scala → ...t/core/model/ColumnToIndexUtilsTest.scala b/...t/core/model/ColumnToIndexUtilsTest.scala → ...t/core/model/ColumnToIndexUtilsTest.scala
diff --git a/...t/core/model/CreateCubeKeySpeedTest.scala → ...t/core/model/CreateCubeKeySpeedTest.scala b/...t/core/model/CreateCubeKeySpeedTest.scala → ...t/core/model/CreateCubeKeySpeedTest.scala
diff --git a/...qbeast/core/model/CreateCubeKeyTest.scala → ...qbeast/core/model/CreateCubeKeyTest.scala b/...qbeast/core/model/CreateCubeKeyTest.scala → ...qbeast/core/model/CreateCubeKeyTest.scala
diff --git a/...t/core/model/CubeDomainsBuilderTest.scala → ...t/core/model/CubeDomainsBuilderTest.scala b/...t/core/model/CubeDomainsBuilderTest.scala → ...t/core/model/CubeDomainsBuilderTest.scala
diff --git a/...o/qbeast/core/model/CubeIdSpeedTest.scala → ...o/qbeast/core/model/CubeIdSpeedTest.scala b/...o/qbeast/core/model/CubeIdSpeedTest.scala → ...o/qbeast/core/model/CubeIdSpeedTest.scala
diff --git a/...ala/io/qbeast/core/model/CubeIdTest.scala → ...ala/io/qbeast/core/model/CubeIdTest.scala b/...ala/io/qbeast/core/model/CubeIdTest.scala → ...ala/io/qbeast/core/model/CubeIdTest.scala
diff --git a/...io/qbeast/core/model/CubeKeyFactory.scala → ...io/qbeast/core/model/CubeKeyFactory.scala b/...io/qbeast/core/model/CubeKeyFactory.scala → ...io/qbeast/core/model/CubeKeyFactory.scala
diff --git a/...ore/model/CubeNormalizedWeightsTest.scala → ...ore/model/CubeNormalizedWeightsTest.scala b/...ore/model/CubeNormalizedWeightsTest.scala → ...ore/model/CubeNormalizedWeightsTest.scala
diff --git a/...ore/model/EstimateGroupCubeSizeTest.scala → ...ore/model/EstimateGroupCubeSizeTest.scala b/...ore/model/EstimateGroupCubeSizeTest.scala → ...ore/model/EstimateGroupCubeSizeTest.scala
diff --git a/.../io/qbeast/core/model/IndexFileTest.scala → .../io/qbeast/core/model/IndexFileTest.scala b/.../io/qbeast/core/model/IndexFileTest.scala → .../io/qbeast/core/model/IndexFileTest.scala
diff --git a/...t/core/model/JSONSerializationTests.scala → ...t/core/model/JSONSerializationTests.scala b/...t/core/model/JSONSerializationTests.scala → ...t/core/model/JSONSerializationTests.scala
diff --git a/...cala/io/qbeast/core/model/PointTest.scala → ...cala/io/qbeast/core/model/PointTest.scala b/...cala/io/qbeast/core/model/PointTest.scala → ...cala/io/qbeast/core/model/PointTest.scala
diff --git a/...t/core/model/PointWeightIndexerTest.scala → ...t/core/model/PointWeightIndexerTest.scala b/...t/core/model/PointWeightIndexerTest.scala → ...t/core/model/PointWeightIndexerTest.scala
diff --git a/...a/io/qbeast/core/model/QTableIDTest.scala → ...a/io/qbeast/core/model/QTableIDTest.scala b/...a/io/qbeast/core/model/QTableIDTest.scala → ...a/io/qbeast/core/model/QTableIDTest.scala
diff --git a/...ast/core/model/QbeastHookLoaderTest.scala → ...ast/core/model/QbeastHookLoaderTest.scala b/...ast/core/model/QbeastHookLoaderTest.scala → ...ast/core/model/QbeastHookLoaderTest.scala
diff --git a/...ast/core/model/QuerySpaceFromToTest.scala → ...ast/core/model/QuerySpaceFromToTest.scala b/...ast/core/model/QuerySpaceFromToTest.scala → ...ast/core/model/QuerySpaceFromToTest.scala
diff --git a/...a/io/qbeast/core/model/RevisionTest.scala → ...a/io/qbeast/core/model/RevisionTest.scala b/...a/io/qbeast/core/model/RevisionTest.scala → ...a/io/qbeast/core/model/RevisionTest.scala
diff --git a/...beast/core/model/WeightAndCountTest.scala → ...beast/core/model/WeightAndCountTest.scala b/...beast/core/model/WeightAndCountTest.scala → ...beast/core/model/WeightAndCountTest.scala
diff --git a/...FNumericQuantilesTransformationTest.scala → ...FNumericQuantilesTransformationTest.scala b/...FNumericQuantilesTransformationTest.scala → ...FNumericQuantilesTransformationTest.scala
diff --git a/...ansform/CDFQuantilesTransformerTest.scala → ...ansform/CDFQuantilesTransformerTest.scala b/...ansform/CDFQuantilesTransformerTest.scala → ...ansform/CDFQuantilesTransformerTest.scala
diff --git a/...DFStringQuantilesTransformationTest.scala → ...DFStringQuantilesTransformationTest.scala b/...DFStringQuantilesTransformationTest.scala → ...DFStringQuantilesTransformationTest.scala
diff --git a/...e/transform/EmptyTransformationTest.scala → ...e/transform/EmptyTransformationTest.scala b/...e/transform/EmptyTransformationTest.scala → ...e/transform/EmptyTransformationTest.scala
diff --git a/...re/transform/HashTransformationTest.scala → ...re/transform/HashTransformationTest.scala b/...re/transform/HashTransformationTest.scala → ...re/transform/HashTransformationTest.scala
diff --git a/.../transform/LinearTransformationTest.scala → .../transform/LinearTransformationTest.scala b/.../transform/LinearTransformationTest.scala → .../transform/LinearTransformationTest.scala
diff --git a/...east/core/transform/TransformerTest.scala → ...east/core/transform/TransformerTest.scala b/...east/core/transform/TransformerTest.scala → ...east/core/transform/TransformerTest.scala
diff --git a/...qbeast/spark/delta/DefaultFileIndex.scala → ...qbeast/spark/delta/DefaultFileIndex.scala b/...qbeast/spark/delta/DefaultFileIndex.scala → ...qbeast/spark/delta/DefaultFileIndex.scala
diff --git a/...park/delta/DefaultListFilesStrategy.scala → ...park/delta/DefaultListFilesStrategy.scala b/...park/delta/DefaultListFilesStrategy.scala → ...park/delta/DefaultListFilesStrategy.scala
diff --git a/...st/spark/delta/DeltaMetadataManager.scala → ...st/spark/delta/DeltaMetadataManager.scala b/...st/spark/delta/DeltaMetadataManager.scala → ...st/spark/delta/DeltaMetadataManager.scala
diff --git a/...ast/spark/delta/DeltaMetadataWriter.scala → ...ast/spark/delta/DeltaMetadataWriter.scala b/...ast/spark/delta/DeltaMetadataWriter.scala → ...ast/spark/delta/DeltaMetadataWriter.scala
diff --git a/...st/spark/delta/DeltaQbeastFileUtils.scala → ...st/spark/delta/DeltaQbeastFileUtils.scala b/...st/spark/delta/DeltaQbeastFileUtils.scala → ...st/spark/delta/DeltaQbeastFileUtils.scala
diff --git a/...ast/spark/delta/DeltaQbeastSnapshot.scala → ...ast/spark/delta/DeltaQbeastSnapshot.scala b/...ast/spark/delta/DeltaQbeastSnapshot.scala → ...ast/spark/delta/DeltaQbeastSnapshot.scala
diff --git a/...t/spark/delta/DeltaQbeastStatsUtils.scala → ...t/spark/delta/DeltaQbeastStatsUtils.scala b/...t/spark/delta/DeltaQbeastStatsUtils.scala → ...t/spark/delta/DeltaQbeastStatsUtils.scala
diff --git a/...t/spark/delta/DeltaRollupDataWriter.scala → ...t/spark/delta/DeltaRollupDataWriter.scala b/...t/spark/delta/DeltaRollupDataWriter.scala → ...t/spark/delta/DeltaRollupDataWriter.scala
diff --git a/...spark/delta/DeltaStagingDataManager.scala → ...spark/delta/DeltaStagingDataManager.scala b/...spark/delta/DeltaStagingDataManager.scala → ...spark/delta/DeltaStagingDataManager.scala
@@ -20,7 +20,6 @@ import io.qbeast.core.model.QTableID
 import io.qbeast.core.model.StagingDataManager
 import io.qbeast.core.model.StagingDataManagerFactory
 import io.qbeast.core.model.StagingResolution
-import io.qbeast.spark.internal.commands.ConvertToQbeastCommand
 import io.qbeast.spark.internal.QbeastOptions
 import org.apache.hadoop.fs.Path
 import org.apache.spark.qbeast.config.STAGING_SIZE_IN_BYTES
@@ -36,7 +35,7 @@ import org.apache.spark.sql.SparkSession
 /**
  * Access point for staged data
  */
-private[spark] class DeltaStagingDataManager(tableID: QTableID)
+class DeltaStagingDataManager(tableID: QTableID)
     extends DeltaStagingUtils
     with StagingDataManager {
   private val spark = SparkSession.active
@@ -133,13 +132,6 @@ private[spark] class DeltaStagingDataManager(tableID: QTableID)
         .option(DeltaOptions.USER_METADATA_OPTION, options.userMetadata.get)
     }
     writer.save(tableID.id)
-
-    // Convert if the table is not yet qbeast
-    if (isInitial) {
-      val colsToIndex = indexStatus.revision.columnTransformers.map(_.columnName)
-      val dcs = indexStatus.revision.desiredCubeSize
-      ConvertToQbeastCommand(s"delta.`${tableID.id}`", colsToIndex, dcs).run(spark)
-    }
   }
 
 }

diff --git a/...beast/spark/delta/DeltaStagingUtils.scala → ...beast/spark/delta/DeltaStagingUtils.scala b/...beast/spark/delta/DeltaStagingUtils.scala → ...beast/spark/delta/DeltaStagingUtils.scala
diff --git a/...beast/spark/delta/ListFilesStrategy.scala → ...beast/spark/delta/ListFilesStrategy.scala b/...beast/spark/delta/ListFilesStrategy.scala → ...beast/spark/delta/ListFilesStrategy.scala
diff --git a/...spark/delta/QbeastMetadataOperation.scala → ...spark/delta/QbeastMetadataOperation.scala b/...spark/delta/QbeastMetadataOperation.scala → ...spark/delta/QbeastMetadataOperation.scala
diff --git a/...ark/delta/SamplingListFilesStrategy.scala → ...ark/delta/SamplingListFilesStrategy.scala b/...ark/delta/SamplingListFilesStrategy.scala → ...ark/delta/SamplingListFilesStrategy.scala
diff --git a/...sql/delta/DeltaStatsCollectionUtils.scala → ...sql/delta/DeltaStatsCollectionUtils.scala b/...sql/delta/DeltaStatsCollectionUtils.scala → ...sql/delta/DeltaStatsCollectionUtils.scala
@@ -15,7 +15,6 @@
  */
 package org.apache.spark.sql.delta
 
-import io.qbeast.context.QbeastContext
 import io.qbeast.core.model.QTableID
 import org.apache.spark.sql.catalyst.expressions.Attribute
 import org.apache.spark.sql.catalyst.expressions.Expression
@@ -85,7 +84,7 @@ trait DeltaStatsCollectionUtils {
       sparkSession: SparkSession,
       tableID: QTableID): Option[DeltaJobStatisticsTracker] = {
 
-    if (QbeastContext.config.get(DeltaSQLConf.DELTA_COLLECT_STATS)) {
+    if (sparkSession.conf.get(DeltaSQLConf.DELTA_COLLECT_STATS)) {
       val outputStatsAtrributes = data.queryExecution.analyzed.output
       val outputSchema = data.schema