fix handling of variable_eltype in stack

JuliaData · bkamins · May 2, 2022 · Apr 28, 2022 · Apr 29, 2022 · Apr 30, 2022
commit 8ad809cd81c0d0ad9d3f798daf92a04488b8c546
diff --git a/src/abstractdataframe/reshape.jl b/src/abstractdataframe/reshape.jl
@@ -164,8 +164,8 @@ function stack(df::AbstractDataFrame,
         # (note that copyto! inserts levels in their order of appearance)
         nms = names(df, ints_measure_vars)
         simnms = similar(nms, variable_eltype)
-        catnms = simnms isa Vector ? PooledArray(catnms) : simnms
-        copyto!(catnms, nms)
+        copyto!(simnms, nms)
+        catnms = simnms isa Vector ? PooledArray(simnms) : simnms
     end
     return DataFrame(AbstractVector[[repeat(df[!, c], outer=N) for c in ints_id_vars]..., # id_var columns
                                     repeat(catnms, inner=nrow(df)),                       # variable

diff --git a/test/reshape.jl b/test/reshape.jl
@@ -845,4 +845,18 @@ end
     end
 end
 
+@testset "variable_eltype in stack tests" begin
+    df = DataFrame(A = 1:3, B = [2.0, -1.1, 2.8], C = ["p","q","r"])
+    @test_throws MethodError stack(df, :C, variable_name=:D, variable_eltype=Int)
+    for T in (AbstractString, Any)
+        sdf = stack(df, [:A, :B], variable_name=:D, variable_eltype=T)
+        @test sdf == DataFrame(C=["p", "q", "r", "p", "q", "r"],
+                            D=["A", "A", "A", "B", "B", "B"],
+                            value=[1.0, 2.0, 3.0, 2.0, -1.1, 2.8])
+        @test sdf.C isa Vector{String}
+        @test sdf.value isa Vector{Float64}
+        @test sdf.D isa PooledVector{T}
+    end
+end
+
 end # module