apache · ayushtkn · Dec 19, 2025 · Dec 19, 2025 · deniskuzZ · Dec 19, 2025
diff --git a/...g/iceberg-handler/src/main/java/org/apache/iceberg/mr/hive/HiveIcebergStorageHandler.java b/...g/iceberg-handler/src/main/java/org/apache/iceberg/mr/hive/HiveIcebergStorageHandler.java
@@ -186,6 +186,7 @@
 import org.apache.iceberg.mr.hive.actions.HiveIcebergDeleteOrphanFiles;
 import org.apache.iceberg.mr.hive.plan.IcebergBucketFunction;
 import org.apache.iceberg.mr.hive.udf.GenericUDFIcebergZorder;
+import org.apache.iceberg.parquet.VariantUtil;
 import org.apache.iceberg.puffin.Blob;
 import org.apache.iceberg.puffin.BlobMetadata;
 import org.apache.iceberg.puffin.Puffin;
@@ -1739,7 +1740,8 @@ private void fallbackToNonVectorizedModeBasedOnProperties(Properties tableProps)
     if (FileFormat.AVRO.name().equalsIgnoreCase(tableProps.getProperty(TableProperties.DEFAULT_FILE_FORMAT)) ||
         isValidMetadataTable(tableProps.getProperty(IcebergAcidUtil.META_TABLE_PROPERTY)) ||
         hasOrcTimeInSchema(tableProps, tableSchema) ||
-        !hasParquetNestedTypeWithinListOrMap(tableProps, tableSchema)) {
+        !hasParquetNestedTypeWithinListOrMap(tableProps, tableSchema) ||
+        VariantUtil.shouldUseVariantShredding(tableProps::getProperty, tableSchema)) {
       // disable vectorization
       SessionStateUtil.getQueryState(conf).ifPresent(queryState ->
           queryState.getConf().setBoolVar(ConfVars.HIVE_VECTORIZATION_ENABLED, false));

diff --git a/...ceberg-handler/src/main/java/org/apache/iceberg/mr/hive/writer/HiveFileWriterFactory.java b/...ceberg-handler/src/main/java/org/apache/iceberg/mr/hive/writer/HiveFileWriterFactory.java
@@ -86,7 +86,7 @@ protected void configurePositionDelete(Avro.DeleteWriteBuilder builder) {
   protected void configureDataWrite(Parquet.DataWriteBuilder builder) {
     builder.createWriterFunc(GenericParquetWriter::create);
     // Configure variant shredding if enabled and a sample record is available
-    if (VariantUtil.shouldUseVariantShredding(properties, dataSchema())) {
+    if (VariantUtil.shouldUseVariantShredding(properties::get, dataSchema())) {
       setVariantShreddingFunc(builder, VariantUtil.variantShreddingFunc(sampleRecord, dataSchema()));
     }
   }

diff --git a/iceberg/iceberg-handler/src/main/java/org/apache/iceberg/parquet/VariantUtil.java b/iceberg/iceberg-handler/src/main/java/org/apache/iceberg/parquet/VariantUtil.java
@@ -21,6 +21,7 @@
 
 import java.util.List;
 import java.util.Map;
+import java.util.function.UnaryOperator;
 import org.apache.iceberg.Accessor;
 import org.apache.iceberg.Schema;
 import org.apache.iceberg.StructLike;
@@ -59,8 +60,8 @@ public record VariantField(int fieldId, Accessor<StructLike> accessor, String[]
   /**
    * Check if variant shredding is enabled via table properties.
    */
-  public static boolean isVariantShreddingEnabled(Map<String, String> properties) {
-    String shreddingEnabled = properties.get(InputFormatConfig.VARIANT_SHREDDING_ENABLED);
+  public static boolean isVariantShreddingEnabled(UnaryOperator<String> propertyLookup) {
+    String shreddingEnabled = propertyLookup.apply(InputFormatConfig.VARIANT_SHREDDING_ENABLED);
     return Boolean.parseBoolean(shreddingEnabled);
   }
 
@@ -73,7 +74,7 @@ public static boolean isShreddable(Object value) {
 
   public static List<VariantField> variantFieldsForShredding(
       Map<String, String> properties, Schema schema) {
-    if (!isVariantShreddingEnabled(properties)) {
+    if (!isVariantShreddingEnabled(properties::get)) {
       return List.of();
     }
     return variantFieldsForShredding(schema);
@@ -89,8 +90,8 @@ private static List<VariantField> variantFieldsForShredding(Schema schema) {
     return results;
   }
 
-  public static boolean shouldUseVariantShredding(Map<String, String> properties, Schema schema) {
-    return isVariantShreddingEnabled(properties) && hasVariantFields(schema);
+  public static boolean shouldUseVariantShredding(UnaryOperator<String> propertyLookup, Schema schema) {
+    return isVariantShreddingEnabled(propertyLookup) && hasVariantFields(schema);
   }
 
   private static boolean hasVariantFields(Schema schema) {

diff --git a/iceberg/iceberg-handler/src/test/queries/positive/variant_type_shredding.q b/iceberg/iceberg-handler/src/test/queries/positive/variant_type_shredding.q
@@ -27,13 +27,30 @@ INSERT INTO tbl_shredded_variant VALUES
 (2, parse_json('{"name": "Bill", "active": false}')),
 (3, parse_json('{"name": "Henry", "age": 20}'));
 
--- Disable vectorized execution until Variant type is supported
-set hive.vectorized.execution.enabled=false;
-
 -- Retrieve and verify
 SELECT id, try_variant_get(data, '$.name') FROM tbl_shredded_variant
 WHERE variant_get(data, '$.age') > 25;
 
 EXPLAIN
 SELECT id, try_variant_get(data, '$.name') FROM tbl_shredded_variant
 WHERE variant_get(data, '$.age') > 25;
+
+CREATE TABLE t (
+  id INT,
+  v VARIANT
+)
+STORED BY ICEBERG
+TBLPROPERTIES (
+  'format-version'='3',
+  'variant.shredding.enabled'='true'
+);
+
+INSERT INTO t VALUES
+(1, parse_json('{"a": 1}')),
+(2, parse_json('{"b": 2}'));
+
+SELECT
+  try_variant_get(v, '$.a'),
+  try_variant_get(v, '$.b')
+FROM t
+ORDER BY id;
diff --git a/iceberg/iceberg-handler/src/test/results/positive/variant_type_shredding.q.out b/iceberg/iceberg-handler/src/test/results/positive/variant_type_shredding.q.out
@@ -99,3 +99,57 @@ STAGE PLANS:
       Processor Tree:
         ListSink
 
+PREHOOK: query: CREATE TABLE t (
+  id INT,
+  v VARIANT
+)
+STORED BY ICEBERG
+TBLPROPERTIES (
+  'format-version'='3',
+  'variant.shredding.enabled'='true'
+)
+PREHOOK: type: CREATETABLE
+PREHOOK: Output: database:default
+PREHOOK: Output: default@t
+POSTHOOK: query: CREATE TABLE t (
+  id INT,
+  v VARIANT
+)
+STORED BY ICEBERG
+TBLPROPERTIES (
+  'format-version'='3',
+  'variant.shredding.enabled'='true'
+)
+POSTHOOK: type: CREATETABLE
+POSTHOOK: Output: database:default
+POSTHOOK: Output: default@t
+PREHOOK: query: INSERT INTO t VALUES
+(1, parse_json('{"a": 1}')),
+(2, parse_json('{"b": 2}'))
+PREHOOK: type: QUERY
+PREHOOK: Input: _dummy_database@_dummy_table
+PREHOOK: Output: default@t
+POSTHOOK: query: INSERT INTO t VALUES
+(1, parse_json('{"a": 1}')),
+(2, parse_json('{"b": 2}'))
+POSTHOOK: type: QUERY
+POSTHOOK: Input: _dummy_database@_dummy_table
+POSTHOOK: Output: default@t
+PREHOOK: query: SELECT
+  try_variant_get(v, '$.a'),
+  try_variant_get(v, '$.b')
+FROM t
+ORDER BY id
+PREHOOK: type: QUERY
+PREHOOK: Input: default@t
+PREHOOK: Output: hdfs://### HDFS PATH ###
+POSTHOOK: query: SELECT
+  try_variant_get(v, '$.a'),
+  try_variant_get(v, '$.b')
+FROM t
+ORDER BY id
+POSTHOOK: type: QUERY
+POSTHOOK: Input: default@t
+POSTHOOK: Output: hdfs://### HDFS PATH ###
+1	NULL
+NULL	2