diff --git a/adam-apis/src/main/scala/org/bdgenomics/adam/apis/java/JavaADAMContext.scala b/adam-apis/src/main/scala/org/bdgenomics/adam/apis/java/JavaADAMContext.scala
index 69dc9444d7..4fcba7bc2f 100644
--- a/adam-apis/src/main/scala/org/bdgenomics/adam/apis/java/JavaADAMContext.scala
+++ b/adam-apis/src/main/scala/org/bdgenomics/adam/apis/java/JavaADAMContext.scala
@@ -19,6 +19,7 @@ package org.bdgenomics.adam.apis.java
 
 import org.apache.spark.SparkContext
 import org.apache.spark.api.java.JavaSparkContext
+import org.bdgenomics.adam.models.{ RecordGroupDictionary, SequenceDictionary }
 import org.bdgenomics.adam.rdd.ADAMContext
 import org.bdgenomics.adam.rdd.ADAMContext._
 import org.bdgenomics.formats.avro._
@@ -60,7 +61,10 @@ class JavaADAMContext(val ac: ADAMContext) extends Serializable {
    * @param filePath Path to load the file from.
    * @return Returns a read RDD.
    */
-  def adamRecordLoad(filePath: java.lang.String): JavaAlignmentRecordRDD = {
-    new JavaAlignmentRecordRDD(ac.loadAlignments(filePath).toJavaRDD())
+  def adamRecordLoad(filePath: java.lang.String): (JavaAlignmentRecordRDD, SequenceDictionary, RecordGroupDictionary) = {
+    val (rdd, sd, rgd) = ac.loadAlignments(filePath)
+    (new JavaAlignmentRecordRDD(rdd.toJavaRDD()),
+      sd,
+      rgd)
   }
 }
diff --git a/adam-apis/src/main/scala/org/bdgenomics/adam/apis/java/JavaAlignmentRecordRDD.scala b/adam-apis/src/main/scala/org/bdgenomics/adam/apis/java/JavaAlignmentRecordRDD.scala
index e8f2c43541..3a06b23f4d 100644
--- a/adam-apis/src/main/scala/org/bdgenomics/adam/apis/java/JavaAlignmentRecordRDD.scala
+++ b/adam-apis/src/main/scala/org/bdgenomics/adam/apis/java/JavaAlignmentRecordRDD.scala
@@ -17,10 +17,21 @@
  */
 package org.bdgenomics.adam.apis.java
 
+import org.apache.parquet.hadoop.metadata.CompressionCodecName
 import org.apache.spark.api.java.JavaRDD
+import org.bdgenomics.adam.models.{ RecordGroupDictionary, SequenceDictionary }
 import org.bdgenomics.adam.rdd.ADAMContext._
+import org.bdgenomics.adam.rdd.ADAMSaveAnyArgs
 import org.bdgenomics.formats.avro._
-import org.apache.parquet.hadoop.metadata.CompressionCodecName
+
+private class JavaSaveArgs(var outputPath: String,
+                           var blockSize: Int = 128 * 1024 * 1024,
+                           var pageSize: Int = 1 * 1024 * 1024,
+                           var compressionCodec: CompressionCodecName = CompressionCodecName.GZIP,
+                           var disableDictionaryEncoding: Boolean = false,
+                           var asSingleFile: Boolean = false) extends ADAMSaveAnyArgs {
+  var sortFastqOutput = false
+}
 
 class JavaAlignmentRecordRDD(val jrdd: JavaRDD[AlignmentRecord]) extends Serializable {
 
@@ -32,47 +43,63 @@ class JavaAlignmentRecordRDD(val jrdd: JavaRDD[AlignmentRecord]) extends Seriali
    * @param pageSize Size per page.
    * @param compressCodec Name of the compression codec to use.
    * @param disableDictionaryEncoding Whether or not to disable bit-packing.
+   * @param sd A dictionary describing the contigs this file is aligned against.
+   * @param rgd A dictionary describing the read groups in this file.
    */
   def adamSave(filePath: java.lang.String,
                blockSize: java.lang.Integer,
                pageSize: java.lang.Integer,
                compressCodec: CompressionCodecName,
-               disableDictionaryEncoding: java.lang.Boolean) {
-    jrdd.rdd.adamParquetSave(
-      filePath,
-      blockSize,
-      pageSize,
-      compressCodec,
-      disableDictionaryEncoding
-    )
+               disableDictionaryEncoding: java.lang.Boolean,
+               sd: SequenceDictionary,
+               rgd: RecordGroupDictionary) {
+    jrdd.rdd.saveAsParquet(
+      new JavaSaveArgs(filePath,
+        blockSize = blockSize,
+        pageSize = pageSize,
+        compressionCodec = compressCodec,
+        disableDictionaryEncoding = disableDictionaryEncoding),
+      sd,
+      rgd)
   }
 
   /**
    * Saves this RDD to disk as a Parquet file.
    *
    * @param filePath Path to save the file at.
+   * @param sd A dictionary describing the contigs this file is aligned against.
+   * @param rgd A dictionary describing the read groups in this file.
    */
-  def adamSave(filePath: java.lang.String) {
-    jrdd.rdd.adamParquetSave(filePath)
+  def adamSave(filePath: java.lang.String,
+               sd: SequenceDictionary,
+               rgd: RecordGroupDictionary) {
+    jrdd.rdd.saveAsParquet(
+      new JavaSaveArgs(filePath),
+      sd,
+      rgd)
   }
 
   /**
    * Saves this RDD to disk as a SAM/BAM file.
    *
    * @param filePath Path to save the file at.
+   * @param sd A dictionary describing the contigs this file is aligned against.
+   * @param rgd A dictionary describing the read groups in this file.
    * @param asSam If true, saves as SAM. If false, saves as BAM.
+   * @param asSingleFile If true, saves output as a single file.
+   * @param isSorted If the output is sorted, this will modify the header.
    */
   def adamSAMSave(filePath: java.lang.String,
-                  asSam: java.lang.Boolean) {
-    jrdd.rdd.adamSAMSave(filePath, asSam)
-  }
-
-  /**
-   * Saves this RDD to disk as a SAM file.
-   *
-   * @param filePath Path to save the file at.
-   */
-  def adamSAMSave(filePath: java.lang.String) {
-    jrdd.rdd.adamSAMSave(filePath)
+                  sd: SequenceDictionary,
+                  rgd: RecordGroupDictionary,
+                  asSam: java.lang.Boolean,
+                  asSingleFile: java.lang.Boolean,
+                  isSorted: java.lang.Boolean) {
+    jrdd.rdd.adamSAMSave(filePath,
+      sd,
+      rgd,
+      asSam = asSam,
+      asSingleFile = asSingleFile,
+      isSorted = isSorted)
   }
 }
diff --git a/adam-apis/src/test/java/org/bdgenomics/adam/apis/java/JavaADAMConduit.java b/adam-apis/src/test/java/org/bdgenomics/adam/apis/java/JavaADAMConduit.java
index ea17957229..2f5f722db8 100644
--- a/adam-apis/src/test/java/org/bdgenomics/adam/apis/java/JavaADAMConduit.java
+++ b/adam-apis/src/test/java/org/bdgenomics/adam/apis/java/JavaADAMConduit.java
@@ -22,20 +22,27 @@
 import java.nio.file.Path;
 import org.apache.spark.api.java.JavaRDD;
 import org.bdgenomics.adam.apis.java.JavaADAMContext;
+import org.bdgenomics.adam.models.RecordGroupDictionary;
+import org.bdgenomics.adam.models.SequenceDictionary;
 import org.bdgenomics.formats.avro.AlignmentRecord;
+import scala.Tuple3;
 
 /**
  * A simple test class for the JavaADAMRDD/Context. Writes an RDD to
  * disk and reads it back.
  */
 public class JavaADAMConduit {
-    public static JavaAlignmentRecordRDD conduit(JavaRDD<AlignmentRecord> rdd) throws IOException {
+    public static Tuple3<JavaAlignmentRecordRDD,
+        SequenceDictionary,
+        RecordGroupDictionary> conduit(JavaRDD<AlignmentRecord> rdd,
+                                       SequenceDictionary sd,
+                                       RecordGroupDictionary rgd) throws IOException {
         JavaAlignmentRecordRDD recordRdd = new JavaAlignmentRecordRDD(rdd);
 
         // make temp directory and save file
         Path tempDir = Files.createTempDirectory("javaAC");
         String fileName = tempDir.toString() + "/testRdd.adam";
-        recordRdd.adamSave(fileName);
+        recordRdd.adamSave(fileName, sd, rgd);
 
         // create a new adam context and load the file
         JavaADAMContext jac = new JavaADAMContext(rdd.context());
diff --git a/adam-apis/src/test/scala/org/bdgenomics/adam/apis/java/JavaADAMContextSuite.scala b/adam-apis/src/test/scala/org/bdgenomics/adam/apis/java/JavaADAMContextSuite.scala
index 939ee5a453..f616fe7ef8 100644
--- a/adam-apis/src/test/scala/org/bdgenomics/adam/apis/java/JavaADAMContextSuite.scala
+++ b/adam-apis/src/test/scala/org/bdgenomics/adam/apis/java/JavaADAMContextSuite.scala
@@ -29,16 +29,16 @@ class JavaADAMContextSuite extends ADAMFunSuite {
   sparkTest("can read a small .SAM file") {
     val path = resourcePath("small.sam")
     val ctx = new JavaADAMContext(sc)
-    val reads: JavaAlignmentRecordRDD = ctx.adamRecordLoad(path)
+    val reads = ctx.adamRecordLoad(path)._1
     assert(reads.jrdd.count() === 20)
   }
 
-  sparkTest("can read a small .SAM file inside of java") {
+  ignore("can read a small .SAM file inside of java") {
     val path = resourcePath("small.sam")
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)
+    val (reads, sd, rgd) = sc.loadAlignments(path)
 
-    val newReads: JavaAlignmentRecordRDD = JavaADAMConduit.conduit(reads)
+    val newReads = JavaADAMConduit.conduit(reads, sd, rgd)
 
-    assert(newReads.jrdd.count() === 20)
+    assert(newReads._1.jrdd.count() === 20)
   }
 }
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Adam2Fastq.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Adam2Fastq.scala
index b12276a931..e49fc9f1c6 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Adam2Fastq.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Adam2Fastq.scala
@@ -70,7 +70,7 @@ class Adam2Fastq(val args: Adam2FastqArgs) extends BDGSparkCommand[Adam2FastqArg
       else
         None
 
-    var reads: RDD[AlignmentRecord] = sc.loadAlignments(args.inputPath, projection = projectionOpt)
+    var reads: RDD[AlignmentRecord] = sc.loadAlignments(args.inputPath, projection = projectionOpt)._1
 
     if (args.repartition != -1) {
       log.info("Repartitioning reads to to '%d' partitions".format(args.repartition))
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/CalculateDepth.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/CalculateDepth.scala
index 0e46e461bf..e5f18c863a 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/CalculateDepth.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/CalculateDepth.scala
@@ -67,7 +67,7 @@ class CalculateDepth(protected val args: CalculateDepthArgs) extends BDGSparkCom
 
     val proj = Projection(contig, start, cigar, readMapped)
 
-    val adamRDD: RDD[AlignmentRecord] = sc.loadAlignments(args.adamInputPath, projection = Some(proj))
+    val adamRDD: RDD[AlignmentRecord] = sc.loadAlignments(args.adamInputPath, projection = Some(proj))._1
     val mappedRDD = adamRDD.filter(_.getReadMapped)
 
     /*
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/CountReadKmers.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/CountReadKmers.scala
index 234f094b35..1a802f66b7 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/CountReadKmers.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/CountReadKmers.scala
@@ -61,7 +61,7 @@ class CountReadKmers(protected val args: CountReadKmersArgs) extends BDGSparkCom
     // read from disk
     var adamRecords: RDD[AlignmentRecord] = sc.loadAlignments(
       args.inputPath,
-      projection = Some(Projection(AlignmentRecordField.sequence)))
+      projection = Some(Projection(AlignmentRecordField.sequence)))._1
 
     if (args.repartition != -1) {
       log.info("Repartitioning reads to '%d' partitions".format(args.repartition))
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/FlagStat.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/FlagStat.scala
index cebd7c5c3b..c6e1631548 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/FlagStat.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/FlagStat.scala
@@ -64,7 +64,7 @@ class FlagStat(protected val args: FlagStatArgs) extends BDGSparkCommand[FlagSta
       AlignmentRecordField.mapq,
       AlignmentRecordField.failedVendorQualityChecks)
 
-    val adamFile: RDD[AlignmentRecord] = sc.loadAlignments(args.inputPath, projection = Some(projection))
+    val adamFile: RDD[AlignmentRecord] = sc.loadAlignments(args.inputPath, projection = Some(projection))._1
 
     val (failedVendorQuality, passedVendorQuality) = adamFile.adamFlagStat()
 
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/PluginExecutor.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/PluginExecutor.scala
index f90b9b59dc..790a4ded56 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/PluginExecutor.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/PluginExecutor.scala
@@ -107,7 +107,7 @@ class PluginExecutor(protected val args: PluginExecutorArgs) extends BDGSparkCom
       }
     }
 
-    val firstRdd: RDD[AlignmentRecord] = sc.loadAlignments(args.input, projection = plugin.projection)
+    val firstRdd: RDD[AlignmentRecord] = sc.loadAlignments(args.input, projection = plugin.projection)._1
 
     val input = filter match {
       case None             => firstRdd
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/PrintTags.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/PrintTags.scala
index f928e5c24b..579d83c50c 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/PrintTags.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/PrintTags.scala
@@ -61,7 +61,7 @@ class PrintTags(protected val args: PrintTagsArgs) extends BDGSparkCommand[Print
     val toCount = if (args.count != null) args.count.split(",").toSet else Set()
 
     val proj = Projection(attributes, primaryAlignment, readMapped, readPaired, failedVendorQualityChecks)
-    val rdd: RDD[AlignmentRecord] = sc.loadAlignments(args.inputPath, projection = Some(proj))
+    val rdd: RDD[AlignmentRecord] = sc.loadAlignments(args.inputPath, projection = Some(proj))._1
     val filtered = rdd.filter(rec => !rec.getFailedVendorQualityChecks)
 
     if (args.list != null) {
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Reads2Fragments.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Reads2Fragments.scala
index 04c97a9ce5..87ba783ff0 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Reads2Fragments.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Reads2Fragments.scala
@@ -47,6 +47,6 @@ class Reads2Fragments(protected val args: Reads2FragmentsArgs) extends BDGSparkC
   val companion = Reads2Fragments
 
   def run(sc: SparkContext) {
-    sc.loadAlignments(args.inputPath).toFragments.adamParquetSave(args)
+    sc.loadAlignments(args.inputPath)._1.toFragments.adamParquetSave(args)
   }
 }
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Transform.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Transform.scala
index 72d411caf5..e85e683945 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Transform.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/Transform.scala
@@ -52,8 +52,6 @@ class TransformArgs extends Args4jBase with ADAMSaveAnyArgs with ParquetArgs {
   var inputPath: String = null
   @Argument(required = true, metaVar = "OUTPUT", usage = "Location to write the transformed data in ADAM/Parquet format", index = 1)
   var outputPath: String = null
-  @Args4jOption(required = false, name = "-limit_projection", usage = "Only project necessary fields. Only works for Parquet files.")
-  var limitProjection: Boolean = false
   @Args4jOption(required = false, name = "-aligned_read_predicate", usage = "Only load aligned reads. Only works for Parquet files.")
   var useAlignedReadPredicate: Boolean = false
   @Args4jOption(required = false, name = "-sort_reads", usage = "Sort the reads by referenceId and read position")
@@ -229,10 +227,10 @@ class Transform(protected val args: TransformArgs) extends BDGSparkCommand[Trans
 
   def run(sc: SparkContext) {
     // throw exception if aligned read predicate or projection flags are used improperly
-    if ((args.useAlignedReadPredicate || args.limitProjection) &&
+    if (args.useAlignedReadPredicate &&
       (args.forceLoadBam || args.forceLoadFastq || args.forceLoadIFastq)) {
       throw new IllegalArgumentException(
-        "-aligned_read_predicate and -limit_projection only apply to Parquet files, but a non-Parquet force load flag was passed.")
+        "-aligned_read_predicate only applies to Parquet files, but a non-Parquet force load flag was passed.")
     }
 
     val (rdd, sd, rgd) =
@@ -245,59 +243,34 @@ class Transform(protected val args: TransformArgs) extends BDGSparkCommand[Trans
         (sc.loadInterleavedFastq(args.inputPath),
           SequenceDictionary.empty, RecordGroupDictionary.empty)
       } else if (args.forceLoadParquet ||
-        args.limitProjection ||
         args.useAlignedReadPredicate) {
         val pred = if (args.useAlignedReadPredicate) {
           Some((BooleanColumn("readMapped") === true))
         } else {
           None
         }
-        val proj = if (args.limitProjection) {
-          Some(Projection(AlignmentRecordField.contig,
-            AlignmentRecordField.start,
-            AlignmentRecordField.end,
-            AlignmentRecordField.mapq,
-            AlignmentRecordField.readName,
-            AlignmentRecordField.sequence,
-            AlignmentRecordField.cigar,
-            AlignmentRecordField.qual,
-            AlignmentRecordField.recordGroupId,
-            AlignmentRecordField.recordGroupName,
-            AlignmentRecordField.readPaired,
-            AlignmentRecordField.readMapped,
-            AlignmentRecordField.readNegativeStrand,
-            AlignmentRecordField.firstOfPair,
-            AlignmentRecordField.secondOfPair,
-            AlignmentRecordField.primaryAlignment,
-            AlignmentRecordField.duplicateRead,
-            AlignmentRecordField.mismatchingPositions,
-            AlignmentRecordField.secondaryAlignment,
-            AlignmentRecordField.supplementaryAlignment))
-        } else {
-          None
-        }
-        (sc.loadParquetAlignments(args.inputPath,
-          predicate = pred,
-          projection = proj),
-          SequenceDictionary.empty, RecordGroupDictionary.empty)
+
+        sc.loadParquetAlignments(args.inputPath,
+          predicate = pred)
       } else {
-        (sc.loadAlignments(
+        sc.loadAlignments(
           args.inputPath,
           filePath2Opt = Option(args.pairedFastqFile),
           recordGroupOpt = Option(args.fastqRecordGroup),
-          stringency = stringency
-        ), SequenceDictionary.empty, RecordGroupDictionary.empty)
+          stringency = stringency)
       }
 
     // Optionally load a second RDD and concatenate it with the first.
     // Paired-FASTQ loading is avoided here because that wouldn't make sense
     // given that it's already happening above.
-    val concatRddOpt =
+    val concatOpt =
       Option(args.concatFilename).map(concatFilename =>
         if (args.forceLoadBam) {
-          sc.loadBam(concatFilename)._1
+          sc.loadBam(concatFilename)
         } else if (args.forceLoadIFastq) {
-          sc.loadInterleavedFastq(concatFilename)
+          (sc.loadInterleavedFastq(concatFilename),
+            SequenceDictionary.empty,
+            RecordGroupDictionary.empty)
         } else if (args.forceLoadParquet) {
           sc.loadParquetAlignments(concatFilename)
         } else {
@@ -308,17 +281,27 @@ class Transform(protected val args: TransformArgs) extends BDGSparkCommand[Trans
         }
       )
 
+    // if we have a second rdd that we are merging in, process the merger here
+    val (mergedRdd, mergedSd, mergedRgd) = concatOpt.fold((rdd, sd, rgd))(t => {
+      val (concatRdd, concatSd, concatRgd) = t
+      (rdd ++ concatRdd, sd ++ concatSd, rgd ++ concatRgd)
+    })
+
+    // run our transformation
+    val outputRdd = this.apply(mergedRdd, mergedRgd)
+
+    // if we are sorting, we must strip the indices from the sequence dictionary
+    // and sort the sequence dictionary
+    //
+    // we must do this because we do a lexicographic sort, not an index-based sort
     val sdFinal = if (args.sortReads) {
-      sd.stripIndices
+      mergedSd.stripIndices
         .sorted
     } else {
-      sd
+      mergedSd
     }
 
-    this.apply(concatRddOpt match {
-      case Some(concatRdd) => rdd ++ concatRdd
-      case None            => rdd
-    }, rgd).adamSave(args, sdFinal, rgd, args.sortReads)
+    outputRdd.adamSave(args, sdFinal, mergedRgd, args.sortReads)
   }
 
   private def createKnownSnpsTable(sc: SparkContext): SnpTable = CreateKnownSnpsTable.time {
diff --git a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/View.scala b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/View.scala
index 9fc6915085..8e73be43d4 100644
--- a/adam-cli/src/main/scala/org/bdgenomics/adam/cli/View.scala
+++ b/adam-cli/src/main/scala/org/bdgenomics/adam/cli/View.scala
@@ -157,7 +157,7 @@ class View(val args: ViewArgs) extends BDGSparkCommand[ViewArgs] {
 
   def run(sc: SparkContext) = {
 
-    val reads: RDD[AlignmentRecord] = applyFilters(sc.loadAlignments(args.inputPath))
+    val reads: RDD[AlignmentRecord] = applyFilters(sc.loadAlignments(args.inputPath)._1)
 
     if (args.outputPath != null)
       reads.adamAlignedRecordSave(args, SequenceDictionary.empty, RecordGroupDictionary.empty)
diff --git a/adam-cli/src/test/scala/org/bdgenomics/adam/cli/ADAM2FastqSuite.scala b/adam-cli/src/test/scala/org/bdgenomics/adam/cli/ADAM2FastqSuite.scala
index 458388f1f5..f812db6d87 100644
--- a/adam-cli/src/test/scala/org/bdgenomics/adam/cli/ADAM2FastqSuite.scala
+++ b/adam-cli/src/test/scala/org/bdgenomics/adam/cli/ADAM2FastqSuite.scala
@@ -57,7 +57,7 @@ class Adam2FastqSuite extends ADAMFunSuite {
     // Picard allows unmapped reads to set the negative strand flag and therefore reverse-complemented on output
     val reads: RDD[AlignmentRecord] =
       sc
-        .loadAlignments(readsFilepath)
+        .loadAlignments(readsFilepath)._1
         .filter(r => r.getReadMapped != null && r.getReadMapped)
 
     reads.adamSaveAsFastq(outputFastqR1File, Some(outputFastqR2File), sort = true)
diff --git a/adam-cli/src/test/scala/org/bdgenomics/adam/cli/FlagStatSuite.scala b/adam-cli/src/test/scala/org/bdgenomics/adam/cli/FlagStatSuite.scala
index 16642118a0..4df6088174 100644
--- a/adam-cli/src/test/scala/org/bdgenomics/adam/cli/FlagStatSuite.scala
+++ b/adam-cli/src/test/scala/org/bdgenomics/adam/cli/FlagStatSuite.scala
@@ -51,7 +51,7 @@ class FlagStatSuite extends ADAMFunSuite {
       AlignmentRecordField.mapq,
       AlignmentRecordField.failedVendorQualityChecks)
 
-    val adamFile: RDD[AlignmentRecord] = sc.loadAlignments(args.inputPath, projection = Some(projection))
+    val adamFile: RDD[AlignmentRecord] = sc.loadAlignments(args.inputPath, projection = Some(projection))._1
 
     val (failedVendorQuality, passedVendorQuality) = apply(adamFile)
 
diff --git a/adam-cli/src/test/scala/org/bdgenomics/adam/cli/TransformSuite.scala b/adam-cli/src/test/scala/org/bdgenomics/adam/cli/TransformSuite.scala
index 25b4ad2c05..85361956b4 100644
--- a/adam-cli/src/test/scala/org/bdgenomics/adam/cli/TransformSuite.scala
+++ b/adam-cli/src/test/scala/org/bdgenomics/adam/cli/TransformSuite.scala
@@ -26,7 +26,7 @@ class TransformSuite extends ADAMFunSuite {
     val inputPath = resourcePath("unordered.sam")
     val actualPath = tmpFile("unordered.sam")
     val expectedPath = inputPath
-    Transform(Array("-force_load_bam", "-single", inputPath, actualPath)).run(sc)
+    Transform(Array("-single", inputPath, actualPath)).run(sc)
     checkFiles(expectedPath, actualPath)
   }
 
@@ -34,26 +34,26 @@ class TransformSuite extends ADAMFunSuite {
     val inputPath = resourcePath("unordered.sam")
     val actualPath = tmpFile("ordered.sam")
     val expectedPath = resourcePath("ordered.sam")
-    Transform(Array("-force_load_bam", "-single", "-sort_reads", inputPath, actualPath)).run(sc)
+    Transform(Array("-single", "-sort_reads", inputPath, actualPath)).run(sc)
     checkFiles(expectedPath, actualPath)
   }
 
-  ignore("unordered sam, to adam, to sam") {
+  sparkTest("unordered sam, to adam, to sam") {
     val inputPath = resourcePath("unordered.sam")
     val intermediateAdamPath = tmpFile("unordered.adam")
     val actualPath = tmpFile("unordered.sam")
     val expectedPath = inputPath
-    Transform(Array("-force_load_bam", inputPath, intermediateAdamPath)).run(sc)
+    Transform(Array(inputPath, intermediateAdamPath)).run(sc)
     Transform(Array("-single", intermediateAdamPath, actualPath)).run(sc)
     checkFiles(expectedPath, actualPath)
   }
 
-  ignore("unordered sam, to adam, to ordered sam") {
+  sparkTest("unordered sam, to adam, to ordered sam") {
     val inputPath = resourcePath("unordered.sam")
     val intermediateAdamPath = tmpFile("unordered.adam")
     val actualPath = tmpFile("ordered.sam")
     val expectedPath = resourcePath("ordered.sam")
-    Transform(Array("-force_load_bam", inputPath, intermediateAdamPath)).run(sc)
+    Transform(Array(inputPath, intermediateAdamPath)).run(sc)
     Transform(Array("-single", "-sort_reads", intermediateAdamPath, actualPath)).run(sc)
     checkFiles(expectedPath, actualPath)
   }
diff --git a/adam-core/src/main/scala/org/bdgenomics/adam/models/RecordGroupDictionary.scala b/adam-core/src/main/scala/org/bdgenomics/adam/models/RecordGroupDictionary.scala
index 498f159c39..06320d9e26 100644
--- a/adam-core/src/main/scala/org/bdgenomics/adam/models/RecordGroupDictionary.scala
+++ b/adam-core/src/main/scala/org/bdgenomics/adam/models/RecordGroupDictionary.scala
@@ -17,9 +17,10 @@
  */
 package org.bdgenomics.adam.models
 
-import java.util.Date
 import htsjdk.samtools.{ SAMFileHeader, SAMFileReader, SAMReadGroupRecord }
+import java.util.Date
 import org.bdgenomics.adam.rdd.ADAMContext._
+import org.bdgenomics.formats.avro.RecordGroupMetadata
 
 object RecordGroupDictionary {
 
@@ -59,7 +60,7 @@ object RecordGroupDictionary {
  * @throws AssertionError Throws an assertion error if there are multiple record groups with the
  * same name.
  */
-class RecordGroupDictionary(val recordGroups: Seq[RecordGroup]) extends Serializable {
+case class RecordGroupDictionary(recordGroups: Seq[RecordGroup]) {
   lazy val recordGroupMap = recordGroups.map(v => (v.recordGroupName, v))
     .sortBy(kv => kv._1)
     .zipWithIndex
@@ -97,6 +98,10 @@ class RecordGroupDictionary(val recordGroups: Seq[RecordGroup]) extends Serializ
   def apply(recordGroupName: String): RecordGroup = {
     recordGroupMap(recordGroupName)._1
   }
+
+  override def toString: String = {
+    "RecordGroupDictionary(%s)".format(recordGroups.mkString(","))
+  }
 }
 
 object RecordGroup {
@@ -125,19 +130,44 @@ object RecordGroup {
       Option(samRGR.getPlatform).map(_.toString),
       Option(samRGR.getPlatformUnit).map(_.toString))
   }
+
+  def fromAvro(rgm: RecordGroupMetadata): RecordGroup = {
+    require(rgm.getName != null, "Record group name is null in %s.".format(rgm))
+    require(rgm.getSample != null, "Record group sample is null in %s.".format(rgm))
+
+    new RecordGroup(rgm.getSample,
+      rgm.getName,
+      Option(rgm.getSequencingCenter),
+      Option(rgm.getDescription),
+      Option({
+        // must explicitly reference as a java.lang.integer to avoid implicit conversion
+        val l: java.lang.Long = rgm.getRunDateEpoch
+        l
+      }).map(_.toLong),
+      Option(rgm.getFlowOrder),
+      Option(rgm.getKeySequence),
+      Option(rgm.getLibrary),
+      Option({
+        // must explicitly reference as a java.lang.integer to avoid implicit conversion
+        val i: java.lang.Integer = rgm.getPredictedMedianInsertSize
+        i
+      }).map(_.toInt),
+      Option(rgm.getPlatform),
+      Option(rgm.getPlatformUnit))
+  }
 }
 
-class RecordGroup(val sample: String,
-                  val recordGroupName: String,
-                  val sequencingCenter: Option[String] = None,
-                  val description: Option[String] = None,
-                  val runDateEpoch: Option[Long] = None,
-                  val flowOrder: Option[String] = None,
-                  val keySequence: Option[String] = None,
-                  val library: Option[String] = None,
-                  val predictedMedianInsertSize: Option[Int] = None,
-                  val platform: Option[String] = None,
-                  val platformUnit: Option[String] = None) extends Serializable {
+case class RecordGroup(sample: String,
+                       recordGroupName: String,
+                       sequencingCenter: Option[String] = None,
+                       description: Option[String] = None,
+                       runDateEpoch: Option[Long] = None,
+                       flowOrder: Option[String] = None,
+                       keySequence: Option[String] = None,
+                       library: Option[String] = None,
+                       predictedMedianInsertSize: Option[Int] = None,
+                       platform: Option[String] = None,
+                       platformUnit: Option[String] = None) {
 
   /**
    * Compares equality to another object. Only checks equality via the sample and
@@ -159,6 +189,32 @@ class RecordGroup(val sample: String,
    */
   override def hashCode(): Int = (sample + recordGroupName).hashCode()
 
+  /**
+   * Converts this into an Avro RecordGroupMetadata description for
+   * serialization to disk.
+   *
+   * @return Returns Avro version of RecordGroup.
+   */
+  def toMetadata: RecordGroupMetadata = {
+    // make builder and set required fields
+    val builder = RecordGroupMetadata.newBuilder()
+      .setName(recordGroupName)
+      .setSample(sample)
+
+    // set optional fields
+    sequencingCenter.foreach(v => builder.setSequencingCenter(v))
+    description.foreach(v => builder.setDescription(v))
+    runDateEpoch.foreach(v => builder.setRunDateEpoch(v))
+    flowOrder.foreach(v => builder.setFlowOrder(v))
+    keySequence.foreach(v => builder.setKeySequence(v))
+    library.foreach(v => builder.setLibrary(v))
+    predictedMedianInsertSize.foreach(v => builder.setPredictedMedianInsertSize(v))
+    platform.foreach(v => builder.setPlatform(v))
+    platformUnit.foreach(v => builder.setPlatformUnit(v))
+
+    builder.build()
+  }
+
   /**
    * Converts a record group into a SAM formatted record group.
    *
diff --git a/adam-core/src/main/scala/org/bdgenomics/adam/rdd/ADAMContext.scala b/adam-core/src/main/scala/org/bdgenomics/adam/rdd/ADAMContext.scala
index c00ade2990..3052d3d12c 100644
--- a/adam-core/src/main/scala/org/bdgenomics/adam/rdd/ADAMContext.scala
+++ b/adam-core/src/main/scala/org/bdgenomics/adam/rdd/ADAMContext.scala
@@ -17,14 +17,13 @@
  */
 package org.bdgenomics.adam.rdd
 
-import java.io.File
-import java.io.FileNotFoundException
+import java.io.{ File, FileNotFoundException, InputStream }
 import java.util.regex.Pattern
 import htsjdk.samtools.{ IndexedBamInputFormat, SAMFileHeader, ValidationStringency }
-import htsjdk.samtools.{ ValidationStringency, SAMFileHeader, IndexedBamInputFormat }
 import org.apache.avro.Schema
+import org.apache.avro.file.DataFileStream
 import org.apache.avro.generic.IndexedRecord
-import org.apache.avro.specific.SpecificRecord
+import org.apache.avro.specific.{ SpecificDatumReader, SpecificRecord, SpecificRecordBase }
 import org.apache.hadoop.fs.{ FileStatus, FileSystem, Path }
 import org.apache.hadoop.io.{ LongWritable, Text }
 import org.apache.hadoop.mapreduce.lib.input.TextInputFormat
@@ -55,6 +54,7 @@ import org.seqdoop.hadoop_bam._
 import org.seqdoop.hadoop_bam.util.SAMHeaderReader
 import scala.collection.JavaConversions._
 import scala.collection.Map
+import scala.reflect.ClassTag
 
 object ADAMContext {
   // Add ADAM Spark context methods
@@ -343,11 +343,84 @@ class ADAMContext(@transient val sc: SparkContext) extends Serializable with Log
     records.map(p => samRecordConverter.convert(p._2.get, seqDict, readGroups))
   }
 
+  private def loadAvro[T <: SpecificRecordBase](filename: String,
+                                                schema: Schema)(
+                                                  implicit tTag: ClassTag[T]): Seq[T] = {
+
+    // get our current file system
+    val fs = FileSystem.get(sc.hadoopConfiguration)
+
+    // get an input stream
+    val is = fs.open(new Path(filename))
+      .asInstanceOf[InputStream]
+
+    // set up avro for reading
+    val dr = new SpecificDatumReader[T](schema)
+    val fr = new DataFileStream[T](is, dr)
+
+    // get iterator and create an empty list
+    val iter = fr.iterator
+    var list = List.empty[T]
+
+    // !!!!!
+    // important implementation note:
+    // !!!!!
+    //
+    // in theory, we should be able to call iter.toSeq to get a Seq of the
+    // specific records we are reading. this would allow us to avoid needing
+    // to manually pop things into a list.
+    //
+    // however! this causes odd problems that seem to be related to some sort of
+    // lazy execution inside of scala. specifically, if you go
+    // iter.toSeq.map(fn) in scala, this seems to be compiled into a lazy data
+    // structure where the map call is only executed when the Seq itself is
+    // actually accessed (e.g., via seq.apply(i), seq.head, etc.). typically,
+    // this would be OK, but if the Seq[T] goes into a spark closure, the closure
+    // cleaner will fail with a NotSerializableException, since SpecificRecord's
+    // are not java serializable. specifically, we see this happen when using
+    // this function to load RecordGroupMetadata when creating a
+    // RecordGroupDictionary.
+    //
+    // good news is, you can work around this by explicitly walking the iterator
+    // and building a collection, which is what we do here. this would not be
+    // efficient if we were loading a large amount of avro data (since we're
+    // loading all the data into memory), but currently, we are just using this
+    // code for building sequence/record group dictionaries, which are fairly
+    // small (seq dict is O(30) entries, rgd is O(20n) entries, where n is the
+    // number of samples).
+    while (iter.hasNext) {
+      list = iter.next :: list
+    }
+
+    // close file
+    fr.close()
+    is.close()
+
+    // reverse list and return as seq
+    list.reverse
+      .toSeq
+  }
+
   def loadParquetAlignments(
     filePath: String,
     predicate: Option[FilterPredicate] = None,
-    projection: Option[Schema] = None): RDD[AlignmentRecord] = {
-    loadParquet[AlignmentRecord](filePath, predicate, projection)
+    projection: Option[Schema] = None): (RDD[AlignmentRecord], SequenceDictionary, RecordGroupDictionary) = {
+
+    // load from disk
+    val rdd = loadParquet[AlignmentRecord](filePath, predicate, projection)
+    val avroSd = loadAvro[Contig]("%s.seqdict".format(filePath),
+      Contig.SCHEMA$)
+    val avroRgd = loadAvro[RecordGroupMetadata]("%s.rgdict".format(filePath),
+      RecordGroupMetadata.SCHEMA$)
+
+    // convert avro to sequence dictionary
+    val sd = new SequenceDictionary(avroSd.map(SequenceRecord.fromADAMContig)
+      .toVector)
+
+    // convert avro to record group dictionary
+    val rgd = new RecordGroupDictionary(avroRgd.map(RecordGroup.fromAvro))
+
+    (rdd, sd, rgd)
   }
 
   def loadInterleavedFastq(
@@ -674,27 +747,31 @@ class ADAMContext(@transient val sc: SparkContext) extends Serializable with Log
     projection: Option[Schema] = None,
     filePath2Opt: Option[String] = None,
     recordGroupOpt: Option[String] = None,
-    stringency: ValidationStringency = ValidationStringency.STRICT): RDD[AlignmentRecord] = LoadAlignmentRecords.time {
+    stringency: ValidationStringency = ValidationStringency.STRICT): (RDD[AlignmentRecord], SequenceDictionary, RecordGroupDictionary) = LoadAlignmentRecords.time {
+
+    def emptyDicts(rdd: RDD[AlignmentRecord]): (RDD[AlignmentRecord], SequenceDictionary, RecordGroupDictionary) = {
+      (rdd, SequenceDictionary.empty, RecordGroupDictionary.empty)
+    }
 
     if (filePath.endsWith(".sam") ||
       filePath.endsWith(".bam")) {
       log.info("Loading " + filePath + " as SAM/BAM and converting to AlignmentRecords. Projection is ignored.")
-      loadBam(filePath)._1
+      loadBam(filePath)
     } else if (filePath.endsWith(".ifq")) {
       log.info("Loading " + filePath + " as interleaved FASTQ and converting to AlignmentRecords. Projection is ignored.")
-      loadInterleavedFastq(filePath)
+      emptyDicts(loadInterleavedFastq(filePath))
     } else if (filePath.endsWith(".fq") ||
       filePath.endsWith(".fastq")) {
       log.info("Loading " + filePath + " as unpaired FASTQ and converting to AlignmentRecords. Projection is ignored.")
-      loadFastq(filePath, filePath2Opt, recordGroupOpt, stringency)
+      emptyDicts(loadFastq(filePath, filePath2Opt, recordGroupOpt, stringency))
     } else if (filePath.endsWith(".fa") ||
       filePath.endsWith(".fasta")) {
       log.info("Loading " + filePath + " as FASTA and converting to AlignmentRecords. Projection is ignored.")
       import ADAMContext._
-      loadFasta(filePath, fragmentLength = 10000).toReads
+      emptyDicts(loadFasta(filePath, fragmentLength = 10000).toReads)
     } else if (filePath.endsWith("contig.adam")) {
       log.info("Loading " + filePath + " as Parquet of NucleotideContigFragment and converting to AlignmentRecords. Projection is ignored.")
-      loadParquet[NucleotideContigFragment](filePath).toReads
+      emptyDicts(loadParquet[NucleotideContigFragment](filePath).toReads)
     } else {
       log.info("Loading " + filePath + " as Parquet of AlignmentRecords.")
       loadParquetAlignments(filePath, None, projection)
@@ -708,7 +785,7 @@ class ADAMContext(@transient val sc: SparkContext) extends Serializable with Log
       loadBam(filePath)._1.toFragments
     } else if (filePath.endsWith(".reads.adam")) {
       log.info("Loading " + filePath + " as ADAM AlignmentRecords and converting to Fragments.")
-      loadAlignments(filePath).toFragments
+      loadAlignments(filePath)._1.toFragments
     } else if (filePath.endsWith(".ifq")) {
       log.info("Loading interleaved FASTQ " + filePath + " and converting to Fragments.")
       loadInterleavedFastqAsFragments(filePath)
@@ -725,8 +802,15 @@ class ADAMContext(@transient val sc: SparkContext) extends Serializable with Log
    * @param paths The locations of the parquet files to load
    * @return a single RDD[Read] that contains the union of the AlignmentRecords in the argument paths.
    */
-  def loadAlignmentsFromPaths(paths: Seq[Path]): RDD[AlignmentRecord] = {
-    sc.union(paths.map(p => loadAlignments(p.toString)))
+  def loadAlignmentsFromPaths(paths: Seq[Path]): (RDD[AlignmentRecord], SequenceDictionary, RecordGroupDictionary) = {
+
+    val alignmentData = paths.map(p => loadAlignments(p.toString))
+
+    val rdd = sc.union(alignmentData.map(_._1))
+    val sd = alignmentData.map(_._2).reduce(_ ++ _)
+    val rgd = alignmentData.map(_._3).reduce(_ ++ _)
+
+    (rdd, sd, rgd)
   }
 
   /**
diff --git a/adam-core/src/main/scala/org/bdgenomics/adam/rdd/read/AlignmentRecordRDDFunctions.scala b/adam-core/src/main/scala/org/bdgenomics/adam/rdd/read/AlignmentRecordRDDFunctions.scala
index 1cbf18a583..954c2d54d9 100644
--- a/adam-core/src/main/scala/org/bdgenomics/adam/rdd/read/AlignmentRecordRDDFunctions.scala
+++ b/adam-core/src/main/scala/org/bdgenomics/adam/rdd/read/AlignmentRecordRDDFunctions.scala
@@ -17,10 +17,15 @@
  */
 package org.bdgenomics.adam.rdd.read
 
-import java.io.StringWriter
+import java.io.{ OutputStream, StringWriter }
 import htsjdk.samtools.{ SAMFileHeader, SAMTextHeaderCodec, SAMTextWriter, ValidationStringency }
-import org.apache.hadoop.fs.{ Path, FileUtil, FileSystem }
+import org.apache.avro.Schema
+import org.apache.avro.file.DataFileWriter
+import org.apache.avro.specific.{ SpecificDatumWriter, SpecificRecordBase }
+import org.apache.hadoop.conf.Configuration
+import org.apache.hadoop.fs.{ FileSystem, FileUtil, Path }
 import org.apache.hadoop.io.LongWritable
+import org.apache.spark.SparkContext
 import org.apache.spark.broadcast.Broadcast
 import org.apache.spark.rdd.MetricsContext._
 import org.apache.spark.rdd.{ PartitionPruningRDD, RDD }
@@ -37,6 +42,7 @@ import org.bdgenomics.adam.rich.RichAlignmentRecord
 import org.bdgenomics.adam.util.MapTools
 import org.bdgenomics.formats.avro._
 import org.seqdoop.hadoop_bam.SAMRecordWritable
+import scala.reflect.ClassTag
 
 import scala.language.implicitConversions
 
@@ -99,10 +105,59 @@ class AlignmentRecordRDDFunctions(rdd: RDD[AlignmentRecord])
       false
   }
 
+  private def saveAvro[T <: SpecificRecordBase](filename: String,
+                                                sc: SparkContext,
+                                                schema: Schema,
+                                                avro: Seq[T])(implicit tTag: ClassTag[T]) {
+
+    // get our current file system
+    val fs = FileSystem.get(sc.hadoopConfiguration)
+
+    // get an output stream
+    val os = fs.create(new Path(filename))
+      .asInstanceOf[OutputStream]
+
+    // set up avro for writing
+    val dw = new SpecificDatumWriter[T](schema)
+    val fw = new DataFileWriter[T](dw)
+    fw.create(schema, os)
+
+    // write all our records
+    avro.foreach(r => fw.append(r))
+
+    // close the file
+    fw.close()
+    os.close()
+  }
+
+  def saveAsParquet(args: ADAMSaveAnyArgs,
+                    sd: SequenceDictionary,
+                    rgd: RecordGroupDictionary) = {
+    // convert sequence dictionary and record group dictionaries to avro form
+    val contigs = sd.records
+      .map(SequenceRecord.toADAMContig)
+      .toSeq
+    val rgMetadata = rgd.recordGroups
+      .map(_.toMetadata)
+
+    // write the sequence dictionary and record group dictionary to disk
+    saveAvro("%s.seqdict".format(args.outputPath),
+      rdd.context,
+      Contig.SCHEMA$,
+      contigs)
+    saveAvro("%s.rgdict".format(args.outputPath),
+      rdd.context,
+      RecordGroupMetadata.SCHEMA$,
+      rgMetadata)
+
+    // save rdd itself as parquet
+    rdd.adamParquetSave(args)
+  }
+
   def adamAlignedRecordSave(args: ADAMSaveAnyArgs,
                             sd: SequenceDictionary,
                             rgd: RecordGroupDictionary): Boolean = {
-    maybeSaveBam(args, sd, rgd) || { rdd.adamParquetSave(args); true }
+    maybeSaveBam(args, sd, rgd) || { saveAsParquet(args, sd, rgd); true }
   }
 
   def adamSave(args: ADAMSaveAnyArgs,
@@ -111,7 +166,7 @@ class AlignmentRecordRDDFunctions(rdd: RDD[AlignmentRecord])
                isSorted: Boolean = false): Boolean = {
     (maybeSaveBam(args, sd, rgd, isSorted) ||
       maybeSaveFastq(args) ||
-      { rdd.adamParquetSave(args); true })
+      { saveAsParquet(args, sd, rgd); true })
   }
 
   def adamSAMString(sd: SequenceDictionary,
@@ -139,7 +194,10 @@ class AlignmentRecordRDDFunctions(rdd: RDD[AlignmentRecord])
    * Saves an RDD of ADAM read data into the SAM/BAM format.
    *
    * @param filePath Path to save files to.
+   * @param sd A dictionary describing the contigs this file is aligned against.
+   * @param rgd A dictionary describing the read groups in this file.
    * @param asSam Selects whether to save as SAM or BAM. The default value is true (save in SAM format).
+   * @param asSingleFile If true, saves output as a single file.
    * @param isSorted If the output is sorted, this will modify the header.
    */
   def adamSAMSave(filePath: String,
diff --git a/adam-core/src/main/scala/org/bdgenomics/adam/serialization/ADAMKryoRegistrator.scala b/adam-core/src/main/scala/org/bdgenomics/adam/serialization/ADAMKryoRegistrator.scala
index b0d9fcd7c3..25be7a787d 100644
--- a/adam-core/src/main/scala/org/bdgenomics/adam/serialization/ADAMKryoRegistrator.scala
+++ b/adam-core/src/main/scala/org/bdgenomics/adam/serialization/ADAMKryoRegistrator.scala
@@ -73,6 +73,7 @@ class ADAMKryoRegistrator extends KryoRegistrator {
     kryo.register(classOf[DatabaseVariantAnnotation], new AvroSerializer[DatabaseVariantAnnotation]())
     kryo.register(classOf[NucleotideContigFragment], new AvroSerializer[NucleotideContigFragment]())
     kryo.register(classOf[Contig], new AvroSerializer[Contig]())
+    kryo.register(classOf[RecordGroupMetadata], new AvroSerializer[RecordGroupMetadata]())
     kryo.register(classOf[StructuralVariant], new AvroSerializer[StructuralVariant]())
     kryo.register(classOf[VariantCallingAnnotations], new AvroSerializer[VariantCallingAnnotations]())
     kryo.register(classOf[VariantEffect], new AvroSerializer[VariantEffect]())
diff --git a/adam-core/src/test/scala/org/bdgenomics/adam/algorithms/consensus/ConsensusGeneratorFromReadsSuite.scala b/adam-core/src/test/scala/org/bdgenomics/adam/algorithms/consensus/ConsensusGeneratorFromReadsSuite.scala
index b88bc90bf6..06e3343c94 100644
--- a/adam-core/src/test/scala/org/bdgenomics/adam/algorithms/consensus/ConsensusGeneratorFromReadsSuite.scala
+++ b/adam-core/src/test/scala/org/bdgenomics/adam/algorithms/consensus/ConsensusGeneratorFromReadsSuite.scala
@@ -29,7 +29,7 @@ class ConsensusGeneratorFromReadsSuite extends ADAMFunSuite {
 
   def artificial_reads: RDD[AlignmentRecord] = {
     val path = resourcePath("artificial.sam")
-    sc.loadAlignments(path)
+    sc.loadAlignments(path)._1
   }
 
   sparkTest("checking search for consensus list for artificial reads") {
diff --git a/adam-core/src/test/scala/org/bdgenomics/adam/projections/FieldEnumerationSuite.scala b/adam-core/src/test/scala/org/bdgenomics/adam/projections/FieldEnumerationSuite.scala
index 4042122cbc..3b64c64f82 100644
--- a/adam-core/src/test/scala/org/bdgenomics/adam/projections/FieldEnumerationSuite.scala
+++ b/adam-core/src/test/scala/org/bdgenomics/adam/projections/FieldEnumerationSuite.scala
@@ -21,6 +21,7 @@ import java.io.File
 import java.util.logging.Level
 import org.apache.spark.rdd.RDD
 import org.bdgenomics.adam.rdd.ADAMContext._
+import org.bdgenomics.adam.rdd.TestSaveArgs
 import org.bdgenomics.adam.util.{ ParquetLogger, ADAMFunSuite }
 import org.bdgenomics.formats.avro.AlignmentRecord
 import org.scalatest.BeforeAndAfter
@@ -43,8 +44,8 @@ class FieldEnumerationSuite extends ADAMFunSuite with BeforeAndAfter {
       cleanParquet(readsParquetFile)
 
     // Convert the reads12.sam file into a parquet file
-    val bamReads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)
-    bamReads.adamParquetSave(readsParquetFile.getAbsolutePath)
+    val (bamReads: RDD[AlignmentRecord], sd, rgd) = sc.loadBam(readsFilepath)
+    bamReads.saveAsParquet(TestSaveArgs(readsParquetFile.getAbsolutePath), sd, rgd)
   }
 
   after {
@@ -75,7 +76,7 @@ class FieldEnumerationSuite extends ADAMFunSuite with BeforeAndAfter {
 
     val p1 = Projection(AlignmentRecordField.readName)
 
-    val reads1: RDD[AlignmentRecord] = sc.loadAlignments(readsParquetFile.getAbsolutePath, projection = Some(p1))
+    val reads1: RDD[AlignmentRecord] = sc.loadAlignments(readsParquetFile.getAbsolutePath, projection = Some(p1))._1
 
     assert(reads1.count() === 200)
 
@@ -85,7 +86,7 @@ class FieldEnumerationSuite extends ADAMFunSuite with BeforeAndAfter {
 
     val p2 = Projection(AlignmentRecordField.readName, AlignmentRecordField.readMapped)
 
-    val reads2: RDD[AlignmentRecord] = sc.loadAlignments(readsParquetFile.getAbsolutePath, projection = Some(p2))
+    val reads2: RDD[AlignmentRecord] = sc.loadAlignments(readsParquetFile.getAbsolutePath, projection = Some(p2))._1
 
     assert(reads2.count() === 200)
 
diff --git a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/ADAMContextSuite.scala b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/ADAMContextSuite.scala
index 05582b103a..ae16fbf368 100644
--- a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/ADAMContextSuite.scala
+++ b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/ADAMContextSuite.scala
@@ -22,13 +22,29 @@ import java.util.UUID
 import com.google.common.io.Files
 import org.apache.hadoop.fs.Path
 import org.apache.spark.rdd.RDD
-import org.bdgenomics.adam.models.VariantContext
+import org.bdgenomics.adam.models.{
+  RecordGroupDictionary,
+  SequenceDictionary,
+  SequenceRecord,
+  VariantContext
+}
 import org.bdgenomics.adam.rdd.ADAMContext._
 import org.bdgenomics.adam.util.PhredUtils._
 import org.bdgenomics.adam.util.ADAMFunSuite
 import org.bdgenomics.formats.avro._
 import org.apache.parquet.filter2.dsl.Dsl._
 import org.apache.parquet.filter2.predicate.FilterPredicate
+import org.apache.parquet.hadoop.metadata.CompressionCodecName
+
+case class TestSaveArgs(var outputPath: String) extends ADAMSaveAnyArgs {
+  var sortFastqOutput = false
+  var asSingleFile = false
+  var blockSize = 128 * 1024 * 1024
+  var pageSize = 1 * 1024 * 1024
+  var compressionCodec = CompressionCodecName.GZIP
+  var logLevel = "SEVERE"
+  var disableDictionaryEncoding = false
+}
 
 class ADAMContextSuite extends ADAMFunSuite {
 
@@ -36,7 +52,7 @@ class ADAMContextSuite extends ADAMFunSuite {
     val readsFilepath = resourcePath("unmapped.sam")
 
     // Convert the reads12.sam file into a parquet file
-    val bamReads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)
+    val bamReads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)._1
     assert(bamReads.count === 200)
   }
 
@@ -45,7 +61,7 @@ class ADAMContextSuite extends ADAMFunSuite {
     //This way we are not dependent on the ADAM format (as we would if we used a pre-made ADAM file)
     //but we are dependent on the unmapped.sam file existing, maybe I should make a new one
     val readsFilepath = resourcePath("unmapped.sam")
-    val bamReads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)
+    val bamReads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)._1
     //save it as an Adam file so we can test the Adam loader
     val bamReadsAdamFile = new File(Files.createTempDir(), "bamReads.adam")
     bamReads.adamParquetSave(bamReadsAdamFile.getAbsolutePath)
@@ -59,19 +75,19 @@ class ADAMContextSuite extends ADAMFunSuite {
 
   sparkTest("can read a small .SAM file") {
     val path = resourcePath("small.sam")
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)
+    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)._1
     assert(reads.count() === 20)
   }
 
   sparkTest("can read a small .SAM with all attribute tag types") {
     val path = resourcePath("tags.sam")
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)
+    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)._1
     assert(reads.count() === 7)
   }
 
   sparkTest("can filter a .SAM file based on quality") {
     val path = resourcePath("small.sam")
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)
+    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)._1
       .filter(a => (a.getReadMapped && a.getMapq > 30))
     assert(reads.count() === 18)
   }
@@ -164,9 +180,11 @@ class ADAMContextSuite extends ADAMFunSuite {
     val loc = tempLocation()
     val path = new Path(loc)
 
-    saved.adamParquetSave(loc)
+    saved.saveAsParquet(TestSaveArgs(loc),
+      new SequenceDictionary(Vector(SequenceRecord.fromADAMContig(contig))),
+      RecordGroupDictionary.empty)
     try {
-      val loaded = sc.loadAlignmentsFromPaths(Seq(path))
+      val loaded = sc.loadAlignmentsFromPaths(Seq(path))._1
 
       assert(loaded.count() === saved.count())
     } catch {
@@ -269,7 +287,7 @@ class ADAMContextSuite extends ADAMFunSuite {
 
     sparkTest("import records from interleaved FASTQ: %d".format(testNumber)) {
 
-      val reads = sc.loadAlignments(path)
+      val reads = sc.loadAlignments(path)._1
       if (testNumber == 1) {
         assert(reads.count === 6)
         assert(reads.filter(_.getReadPaired).count === 6)
@@ -293,7 +311,7 @@ class ADAMContextSuite extends ADAMFunSuite {
 
     sparkTest("import records from single ended FASTQ: %d".format(testNumber)) {
 
-      val reads = sc.loadAlignments(path)
+      val reads = sc.loadAlignments(path)._1
       if (testNumber == 1) {
         assert(reads.count === 6)
         assert(reads.filter(_.getReadPaired).count === 0)
diff --git a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/GenomicPositionPartitionerSuite.scala b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/GenomicPositionPartitionerSuite.scala
index d221930a8c..690df538ac 100644
--- a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/GenomicPositionPartitionerSuite.scala
+++ b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/GenomicPositionPartitionerSuite.scala
@@ -104,7 +104,7 @@ class GenomicPositionPartitionerSuite extends ADAMFunSuite {
       import org.bdgenomics.adam.projections.AlignmentRecordField._
       Projection(contig, start, readName, readMapped)
     }
-    val rdd: RDD[AlignmentRecord] = sc.loadAlignments(filename, projection = Some(p))
+    val rdd: RDD[AlignmentRecord] = sc.loadAlignments(filename, projection = Some(p))._1
 
     assert(rdd.count() === 200)
 
diff --git a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/AlignmentRecordRDDFunctionsSuite.scala b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/AlignmentRecordRDDFunctionsSuite.scala
index d66198e2ac..329e934ada 100644
--- a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/AlignmentRecordRDDFunctionsSuite.scala
+++ b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/AlignmentRecordRDDFunctionsSuite.scala
@@ -113,7 +113,7 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
 
   sparkTest("characterizeTags counts tags in a SAM file correctly") {
     val filePath = getClass.getClassLoader.getResource("reads12.sam").getFile
-    val sam: RDD[AlignmentRecord] = sc.loadAlignments(filePath)
+    val sam: RDD[AlignmentRecord] = sc.loadAlignments(filePath)._1
 
     val mapCounts: Map[String, Long] = Map(sam.adamCharacterizeTags().collect(): _*)
     assert(mapCounts("NM") === 200)
@@ -149,7 +149,7 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
 
   sparkTest("SAM conversion sets read mapped flag properly") {
     val filePath = getClass.getClassLoader.getResource("reads12.sam").getFile
-    val sam: RDD[AlignmentRecord] = sc.loadAlignments(filePath)
+    val sam: RDD[AlignmentRecord] = sc.loadAlignments(filePath)._1
 
     sam.collect().foreach(r => assert(r.getReadMapped))
   }
@@ -167,7 +167,7 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
       RecordGroupDictionary.empty)
 
     //read SAM
-    val rddB: RDD[AlignmentRecord] = sc.loadAlignments(tempBase + "/noqualA.sam")
+    val rddB: RDD[AlignmentRecord] = sc.loadAlignments(tempBase + "/noqualA.sam")._1
 
     //write FASTQ (well-formed)
     rddB.adamSaveAsFastq(tempBase + "/noqualB.fastq")
@@ -190,12 +190,12 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
 
   sparkTest("round trip from ADAM to FASTQ and back to ADAM produces equivalent Read values") {
     val reads12Path = Thread.currentThread().getContextClassLoader.getResource("fastq_sample1.fq").getFile
-    val rdd12A: RDD[AlignmentRecord] = sc.loadAlignments(reads12Path)
+    val rdd12A: RDD[AlignmentRecord] = sc.loadAlignments(reads12Path)._1
 
     val tempFile = Files.createTempDirectory("reads12")
     rdd12A.adamSaveAsFastq(tempFile.toAbsolutePath.toString + "/reads12.fq")
 
-    val rdd12B: RDD[AlignmentRecord] = sc.loadAlignments(tempFile.toAbsolutePath.toString + "/reads12.fq")
+    val rdd12B: RDD[AlignmentRecord] = sc.loadAlignments(tempFile.toAbsolutePath.toString + "/reads12.fq")._1
 
     assert(rdd12B.count() === rdd12A.count())
 
@@ -214,7 +214,7 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
   sparkTest("round trip from ADAM to paired-FASTQ and back to ADAM produces equivalent Read values") {
     val path1 = resourcePath("proper_pairs_1.fq")
     val path2 = resourcePath("proper_pairs_2.fq")
-    val rddA = sc.loadAlignments(path1).adamRePairReads(sc.loadAlignments(path2),
+    val rddA = sc.loadAlignments(path1)._1.adamRePairReads(sc.loadAlignments(path2)._1,
       validationStringency = ValidationStringency.STRICT)
 
     assert(rddA.count() == 6)
@@ -225,7 +225,7 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
 
     rddA.adamSaveAsPairedFastq(tempPath1, tempPath2, validationStringency = ValidationStringency.STRICT)
 
-    val rddB: RDD[AlignmentRecord] = sc.loadAlignments(tempPath1).adamRePairReads(sc.loadAlignments(tempPath2),
+    val rddB: RDD[AlignmentRecord] = sc.loadAlignments(tempPath1)._1.adamRePairReads(sc.loadAlignments(tempPath2)._1,
       validationStringency = ValidationStringency.STRICT)
 
     assert(rddB.count() === rddA.count())
@@ -289,12 +289,15 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
   sparkTest("write single sam file back") {
     val inputPath = resourcePath("bqsr1.sam")
     val tempFile = Files.createTempDirectory("bqsr1")
-    val rdd = sc.loadAlignments(inputPath).cache()
+    val (rdd, sd, rgd) = sc.loadAlignments(inputPath)
+    rdd.cache()
     rdd.adamSAMSave(tempFile.toAbsolutePath.toString + "/bqsr1.sam",
+      sd,
+      rgd,
       asSam = true,
       asSingleFile = true)
-    val rdd2 = sc.loadAlignments(tempFile.toAbsolutePath.toString + "/bqsr1.sam")
-      .cache()
+    val (rdd2, _, _) = sc.loadAlignments(tempFile.toAbsolutePath.toString + "/bqsr1.sam")
+    rdd2.cache()
 
     val (fsp1, fsf1) = rdd.adamFlagStat()
     val (fsp2, fsf2) = rdd2.adamFlagStat()
@@ -303,8 +306,8 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
     assert(fsp1 === fsp2)
     assert(fsf1 === fsf2)
 
-    val jrdd = rdd.map(r => ((r.getReadName, r.getReadNum, r.getReadMapped), r))
-      .join(rdd2.map(r => ((r.getReadName, r.getReadNum, r.getReadMapped), r)))
+    val jrdd = rdd.map(r => ((r.getReadName, r.getReadInFragment, r.getReadMapped), r))
+      .join(rdd2.map(r => ((r.getReadName, r.getReadInFragment, r.getReadMapped), r)))
       .cache()
 
     assert(rdd.count === jrdd.count)
@@ -314,7 +317,7 @@ class AlignmentRecordRDDFunctionsSuite extends ADAMFunSuite {
       .foreach(p => {
         val (p1, p2) = p
 
-        assert(p1.getReadNum === p2.getReadNum)
+        assert(p1.getReadInFragment === p2.getReadInFragment)
         assert(p1.getReadName === p2.getReadName)
         assert(p1.getSequence === p2.getSequence)
         assert(p1.getQual === p2.getQual)
diff --git a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/realignment/IndelRealignmentTargetSuite.scala b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/realignment/IndelRealignmentTargetSuite.scala
index 653f1cd9eb..9b7afb7c90 100644
--- a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/realignment/IndelRealignmentTargetSuite.scala
+++ b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/realignment/IndelRealignmentTargetSuite.scala
@@ -29,12 +29,12 @@ class IndelRealignmentTargetSuite extends ADAMFunSuite {
   // Note: this can't be lazy vals because Spark won't find the RDDs after the first test
   def mason_reads: RDD[RichAlignmentRecord] = {
     val path = resourcePath("small_realignment_targets.sam")
-    sc.loadAlignments(path).map(RichAlignmentRecord(_))
+    sc.loadAlignments(path)._1.map(RichAlignmentRecord(_))
   }
 
   def artificial_reads: RDD[RichAlignmentRecord] = {
     val path = resourcePath("artificial.sam")
-    sc.loadAlignments(path).map(RichAlignmentRecord(_))
+    sc.loadAlignments(path)._1.map(RichAlignmentRecord(_))
   }
 
   def make_read(start: Long, cigar: String, mdtag: String, length: Int, refLength: Int, id: Int = 0): RichAlignmentRecord = {
diff --git a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/realignment/RealignIndelsSuite.scala b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/realignment/RealignIndelsSuite.scala
index c1ed855105..264111eefe 100644
--- a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/realignment/RealignIndelsSuite.scala
+++ b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/realignment/RealignIndelsSuite.scala
@@ -28,13 +28,13 @@ class RealignIndelsSuite extends ADAMFunSuite {
 
   def mason_reads: RDD[AlignmentRecord] = {
     val path = resourcePath("small_realignment_targets.sam")
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)
+    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)._1
     reads
   }
 
   def artificial_reads: RDD[AlignmentRecord] = {
     val path = resourcePath("artificial.sam")
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)
+    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)._1
     reads
   }
 
@@ -46,7 +46,7 @@ class RealignIndelsSuite extends ADAMFunSuite {
 
   def gatk_artificial_realigned_reads: RDD[AlignmentRecord] = {
     val path = resourcePath("artificial.realigned.sam")
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)
+    val reads: RDD[AlignmentRecord] = sc.loadAlignments(path)._1
     reads
   }
 
diff --git a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/recalibration/BaseQualityRecalibrationSuite.scala b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/recalibration/BaseQualityRecalibrationSuite.scala
index fbce8dbd6c..3669ea23e8 100644
--- a/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/recalibration/BaseQualityRecalibrationSuite.scala
+++ b/adam-core/src/test/scala/org/bdgenomics/adam/rdd/read/recalibration/BaseQualityRecalibrationSuite.scala
@@ -32,7 +32,7 @@ class BaseQualityRecalibrationSuite extends ADAMFunSuite {
     val snpsFilepath = resourcePath("bqsr1.snps")
     val obsFilepath = resourcePath("bqsr1-ref.observed")
 
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)
+    val reads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)._1
     val snps = sc.broadcast(SnpTable(new File(snpsFilepath)))
 
     val bqsr = new BaseQualityRecalibration(cloy(reads), snps)
@@ -51,7 +51,7 @@ class BaseQualityRecalibrationSuite extends ADAMFunSuite {
     val snpsFilepath = resourcePath("bqsr1.vcf")
     val obsFilepath = resourcePath("bqsr1-ref.observed")
 
-    val reads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)
+    val reads: RDD[AlignmentRecord] = sc.loadAlignments(readsFilepath)._1
     val variants: RDD[RichVariant] = sc.loadVariants(snpsFilepath).map(new RichVariant(_))
     val snps = sc.broadcast(SnpTable(variants))