TouK · arkadius · Jul 15, 2021 · Jun 22, 2021 · Jul 6, 2021 · Jul 14, 2021
diff --git a/docs/Changelog.md b/docs/Changelog.md
@@ -51,6 +51,7 @@ Nussknacker versions
 * [#1772](https://github.com/TouK/nussknacker/pull/1772) Fix for Spel validation when we try use not existing method reference
 * [#1741](https://github.com/TouK/nussknacker/pull/1741) KafkaExceptionConsumer can be configured to send errors to Kafka
 * [#1809](https://github.com/TouK/nussknacker/pull/1809) Performance optimization for aggregates: do not update state if added element is neutral for current state
+* [#1886](https://github.com/TouK/nussknacker/pull/1886) Performance optimization for aggregates: do not save context in state. Added `#AGG` utility for easier switching from simple aggregating functions like `'Sum'` to more complex `#AGG.map()`
 * [#1820](https://github.com/TouK/nussknacker/pull/1820) Added missing support for some logical types (LocalDate, LocalTime, UUID) in json encoding
 * [#1799](https://github.com/TouK/nussknacker/pull/1799) ConfluentAvroToJsonFormatter produces and reads test data in valid json format with full kafka metadata and schema ids.
 * [#1839](https://github.com/TouK/nussknacker/pull/1839) Set up `explicitUidInStatefulOperators` model's flag to `true` by default.

diff --git a/docs/MigrationGuide.md b/docs/MigrationGuide.md
@@ -142,9 +142,15 @@ To see biggest differences please consult the [changelog](Changelog.md).
   ```
   {"keySchemaId":null,"valueSchemaId":1,"consumerRecord":{"key":null,"value":{"first":"Jan","last":"Kowalski"},"topic":"testAvroRecordTopic1","partition":0,"offset":0,"timestamp":1624279687756,"timestampType":"CreateTime","headers":{},"leaderEpoch":0}}
   ```
+* [#1663](https://github.com/TouK/nussknacker/pull/1663) Default `FlinkExceptionHandler` implementations are deprecated, use `ConfigurableExceptionHandler` instead.
+* [#1731](https://github.com/TouK/nussknacker/pull/1731) RockDB config's flag `incrementalCheckpoints` is turned on by default.
 * [#1825](https://github.com/TouK/nussknacker/pull/1825) Default dashboard renamed from `flink-esp` to `nussknacker-scenario`
 * [#1836](https://github.com/TouK/nussknacker/pull/1836) Change default `kafka.consumerGroupNamingStrategy` to `processId-nodeId`.     
 * [#1357](https://github.com/TouK/nussknacker/pull/1357) Run mode added to nodes. `ServiceInvoker` interface was extended with new, implicit `runMode` parameter. 
+* [#1836](https://github.com/TouK/nussknacker/pull/1836) Change default `kafka.consumerGroupNamingStrategy` to `processId-nodeId`.
+* [#1886](https://github.com/TouK/nussknacker/pull/1886) aggregate-sliding with emitWhenEventLeft = true, aggregate-tumbling and aggregate-session components now
+  doesn't emit full context of variables that were before node (because of performance reasons and because that wasn't obvious which one context is emitted).
+  If you want to emit some information other than aggregated value and key (availabled via new `#key` variable), you should use `#AGG.map` expression in `aggregateBy`.
 
 ## In version 0.3.0
 
@@ -173,10 +179,8 @@ that will be hidden before parameter's evaluation
     - Added methods: `cancelJob`, `submitJob`, `listJobs`, `runningJobs` to `FlinkMiniClusterHolder`
     - Deprecated: `runningJobs`, from `MiniClusterExecutionEnvironment`
     - Removed: `getClusterClient` from `FlinkMiniClusterHolder` interface, because of flink compatibility at Flink 1.9 
-    - Renamed: `FlinkStreamingProcessRegistrar` to `FlinkProcessManager` 
+    - Renamed: `FlinkStreamingProcessRegistrar` to `FlinkProcessManager`
 * [#1303](https://github.com/TouK/nussknacker/pull/1303) TypedObjectTypingResult has a new field: additionalInfo
-* [#1663](https://github.com/TouK/nussknacker/pull/1663) Default `FlinkExceptionHandler` implementations are deprecated, use `ConfigurableExceptionHandler` instead.
-* [#1731](https://github.com/TouK/nussknacker/pull/1731) RockDB config's flag `incrementalCheckpoints` is turned on by default.
 
 ## In version 0.2.0
 

diff --git a/docs/designingProcesses/Spel.md b/docs/designingProcesses/Spel.md
@@ -231,3 +231,4 @@ If you need to invoke the same method in many places, probably the best solution
 | `CONV` | General conversion functions |
 | `DATE` | Date operations (parsing, printing) | 
 | `UTIL` | Various utilities (e.g. identifier generation) |
+| `AGG` | Aggregator functions |
diff --git a/engine/api/src/main/scala/pl/touk/nussknacker/engine/api/Context.scala b/engine/api/src/main/scala/pl/touk/nussknacker/engine/api/Context.scala
@@ -1,13 +1,38 @@
 package pl.touk.nussknacker.engine.api
 
+import java.util.UUID
+import scala.util.Random
+
 object Context {
 
+  // prefix is to distinguish between externally provided and internal (initially created) id
+  private val initialContextIdPrefix = "initial-"
+
+  /**
+    * For performance reasons, is used unsecure random - see UUIDBenchmark for details. In this case random correlation id
+    * is used only for internal purpose so is not important in security context.
+    */
+  private val random = new Random()
+
+  /**
+    * Should be used for newly created context - when there is no suitable external correlation / tracing id
+    */
+  def withInitialId: Context = {
+    Context(initialContextIdPrefix + new UUID(random.nextLong(), random.nextLong()).toString)
+  }
+
   def apply(id: String) : Context = Context(id, Map.empty, None)
 
 }
 
 case class ContextId(value: String)
 
+/**
+  * Context is container for variables used in expression evaluation
+  * @param id correlation id/trace id used for tracing (logs, error presentation) and for tests mechanism, it should be always defined
+  * @param variables variables available in evaluation
+  * @param parentContext context used for scopes handling, mainly for subprocess invocation purpose
+  */
 case class Context(id: String, variables: Map[String, Any], parentContext: Option[Context]) {
 
   def apply[T](name: String): T =

diff --git a/engine/api/src/main/scala/pl/touk/nussknacker/engine/api/VariableConstants.scala b/engine/api/src/main/scala/pl/touk/nussknacker/engine/api/VariableConstants.scala
@@ -6,5 +6,6 @@ object VariableConstants {
   final val InputMetaVariableName = "inputMeta"
   final val MetaVariableName = "meta"
   final val OutputVariableName = "output"
+  final val KeyVariableName = "key"
 
 }
diff --git a/engine/api/src/main/scala/pl/touk/nussknacker/engine/api/context/ContextTransformation.scala b/engine/api/src/main/scala/pl/touk/nussknacker/engine/api/context/ContextTransformation.scala
@@ -40,7 +40,7 @@ sealed trait AbstractContextTransformation {
   *   ContextTransformation
   *     .definedBy(_.withVariable("foo", Typed[String])
   *     .implementedBy { () =>
-  *       Future.success(Context("").withVariable("foo", "bar")
+  *       Future.success(Context.withRandomId.withVariable("foo", "bar")
   *     }
   * `
   */
@@ -128,4 +128,4 @@ trait JoinContextTransformationDef extends AbstractContextTransformationDef {
         JoinContextTransformationDef.this.transform(contextByBranchId).andThen(nextTransformation.transform)
     }
 
-}
+}
diff --git a/engine/api/src/main/scala/pl/touk/nussknacker/engine/api/context/ValidationContext.scala b/engine/api/src/main/scala/pl/touk/nussknacker/engine/api/context/ValidationContext.scala
@@ -38,6 +38,12 @@ case class ValidationContext(localVariables: Map[String, TypingResult] = Map.emp
   def withVariable(outputVar: OutputVar, value: TypingResult)(implicit nodeId: NodeId): ValidatedNel[PartSubGraphCompilationError, ValidationContext] =
     withVariable(outputVar.outputName, value, Some(outputVar.fieldName))
 
+  def withVariableOverriden(name: String, value: TypingResult, paramName: Option[String])
+                           (implicit nodeId: NodeId): ValidatedNel[PartSubGraphCompilationError, ValidationContext] = {
+    validateVariableFormat(name, paramName)
+      .map(_ => copy(localVariables = localVariables + (name -> value)))
+  }
+
   private def validateVariableExists(name: String, paramName: Option[String])(implicit nodeId: NodeId): ValidatedNel[PartSubGraphCompilationError, String] =
     if (variables.contains(name)) Invalid(OverwrittenVariable(name, paramName)).toValidatedNel else Valid(name)
 
@@ -90,4 +96,4 @@ object OutputVar {
 
   def customNode(outputName: String): OutputVar =
     OutputVar(CustomNodeFieldName, outputName)
-}
+}
diff --git a/.../benchmarks/src/test/scala/pl/touk/nussknacker/engine/benchmarks/spel/UUIDBenchmark.scala b/.../benchmarks/src/test/scala/pl/touk/nussknacker/engine/benchmarks/spel/UUIDBenchmark.scala
@@ -0,0 +1,33 @@
+package pl.touk.nussknacker.engine.benchmarks.spel
+
+import org.openjdk.jmh.annotations.{Benchmark, BenchmarkMode, Mode, OutputTimeUnit, Scope, State, Threads}
+import pl.touk.nussknacker.engine.api.Context
+
+import java.util.UUID
+import java.util.concurrent.TimeUnit
+
+/**
+  * results:
+  * - UUIDBenchmark.secureUUIDTest    avgt   25  9.873 ± 0.467  us/op
+  * - UUIDBenchmark.unsecureUUIDTest  avgt   25  6.227 ± 0.130  us/op
+  */
+@State(Scope.Benchmark)
+class UUIDBenchmark {
+
+  @Threads(10)
+  @Benchmark
+  @BenchmarkMode(Array(Mode.AverageTime))
+  @OutputTimeUnit(TimeUnit.MICROSECONDS)
+  def unsecureUUIDTest(): AnyRef = {
+    Context.withInitialId
+  }
+
+  @Threads(10)
+  @Benchmark
+  @BenchmarkMode(Array(Mode.AverageTime))
+  @OutputTimeUnit(TimeUnit.MICROSECONDS)
+  def secureUUIDTest(): AnyRef = {
+    Context(UUID.randomUUID().toString)
+  }
+
+}
diff --git a/.../flink/generic/src/main/scala/pl/touk/nussknacker/genericmodel/GenericConfigCreator.scala b/.../flink/generic/src/main/scala/pl/touk/nussknacker/genericmodel/GenericConfigCreator.scala
@@ -10,6 +10,7 @@ import pl.touk.nussknacker.engine.avro.sink.{KafkaAvroSinkFactory, KafkaAvroSink
 import pl.touk.nussknacker.engine.avro.source.KafkaAvroSourceFactory
 import pl.touk.nussknacker.engine.flink.util.exception.ConfigurableExceptionHandlerFactory
 import pl.touk.nussknacker.engine.flink.util.sink.EmptySink
+import pl.touk.nussknacker.engine.flink.util.transformer.aggregate.AggregateHelper
 import pl.touk.nussknacker.engine.flink.util.transformer.aggregate.sampleTransformers.{SessionWindowAggregateTransformer, SlidingAggregateTransformerV2, TumblingAggregateTransformer}
 import pl.touk.nussknacker.engine.flink.util.transformer.outer.OuterJoinTransformer
 import pl.touk.nussknacker.engine.flink.util.transformer.{DelayTransformer, PeriodicSourceFactory, PreviousValueTransformer, UnionTransformer, UnionWithMemoTransformer}
@@ -67,7 +68,8 @@ class GenericConfigCreator extends EmptyProcessConfigCreator {
         "NUMERIC" -> defaultCategory(numeric),
         "CONV" -> defaultCategory(conversion),
         "DATE" -> defaultCategory(date),
-        "UTIL" -> defaultCategory(util)
+        "UTIL" -> defaultCategory(util),
+        "AGG" -> defaultCategory(new AggregateHelper)
       ),
       List()
     )

diff --git a/...ain/java/pl/touk/nussknacker/engine/flink/util/transformer/aggregate/AggregateHelper.java b/...ain/java/pl/touk/nussknacker/engine/flink/util/transformer/aggregate/AggregateHelper.java
@@ -10,21 +10,25 @@
 import pl.touk.nussknacker.engine.api.editor.DualEditorMode;
 import scala.collection.JavaConverters;
 
-// This class is in Java, because constants are used in expressions in editors - see
-// `pl.touk.nussknacker.engine.flink.util.transformer.aggregate.SlidingAggregateTransformerV2`. and scala objects are
-// not good for that. Be aware that. If you add some new aggregator please add it also there to make sure that it will
-// be available in selectbox.
+/**
+ * This class is in Java, because constants are used in expressions in editors - see
+ * `pl.touk.nussknacker.engine.flink.util.transformer.aggregate.SlidingAggregateTransformerV2`. and scala objects are
+ * not good for that. Be aware that. If you add some new aggregator please add it also there to make sure that it will
+ * be available in selectbox.
+ *
+ * You should define `#AGG` global variable, because it is used in editors.
+ */
 public class AggregateHelper {
 
     public static final SimpleParameterEditor SIMPLE_EDITOR = new FixedValuesParameterEditor(JavaConverters.collectionAsScalaIterableConverter(Arrays.asList(
-            new FixedExpressionValue("T(" + AggregateHelper.class.getName() + ").FIRST", "First"),
-            new FixedExpressionValue("T(" + AggregateHelper.class.getName() + ").LAST", "Last"),
-            new FixedExpressionValue("T(" + AggregateHelper.class.getName() + ").MIN", "Min"),
-            new FixedExpressionValue("T(" + AggregateHelper.class.getName() + ").MAX", "Max"),
-            new FixedExpressionValue("T(" + AggregateHelper.class.getName() + ").SUM", "Sum"),
-            new FixedExpressionValue("T(" + AggregateHelper.class.getName() + ").LIST", "List"),
-            new FixedExpressionValue("T(" + AggregateHelper.class.getName() + ").SET", "Set"),
-            new FixedExpressionValue("T(" + AggregateHelper.class.getName() + ").APPROX_CARDINALITY", "ApproximateSetCardinality"))).asScala().toList());
+            new FixedExpressionValue("#AGG.sum", "First"),
+            new FixedExpressionValue("#AGG.last", "Last"),
+            new FixedExpressionValue("#AGG.min", "Min"),
+            new FixedExpressionValue("#AGG.max", "Max"),
+            new FixedExpressionValue("#AGG.sum", "Sum"),
+            new FixedExpressionValue("#AGG.list", "List"),
+            new FixedExpressionValue("#AGG.set", "Set"),
+            new FixedExpressionValue("#AGG.approxCardinality", "ApproximateSetCardinality"))).asScala().toList());
 
     public static final DualParameterEditor DUAL_EDITOR = new DualParameterEditor(SIMPLE_EDITOR, DualEditorMode.SIMPLE);
 
@@ -55,7 +59,7 @@ public class AggregateHelper {
 
     public Aggregator approxCardinality = APPROX_CARDINALITY;
 
-    public Aggregator map(@ParamName("parts" ) Map<String, Aggregator> parts) {
+    public Aggregator map(@ParamName("parts") Map<String, Aggregator> parts) {
         return new aggregates.MapAggregator(parts);
     }
 

diff --git a/.../nussknacker/engine/flink/util/transformer/aggregate/AddedElementContextStateHolder.scala b/.../nussknacker/engine/flink/util/transformer/aggregate/AddedElementContextStateHolder.scala
diff --git a/...c/main/scala/pl/touk/nussknacker/engine/flink/util/transformer/aggregate/Aggregator.scala b/...c/main/scala/pl/touk/nussknacker/engine/flink/util/transformer/aggregate/Aggregator.scala
@@ -6,6 +6,7 @@ import pl.touk.nussknacker.engine.api.LazyParameter
 import pl.touk.nussknacker.engine.api.context.ProcessCompilationError.{CannotCreateObjectError, NodeId}
 import pl.touk.nussknacker.engine.api.context.{ProcessCompilationError, ValidationContext}
 import pl.touk.nussknacker.engine.api.typed.typing.TypingResult
+import pl.touk.nussknacker.engine.flink.util.keyed.KeyEnricher
 
 /*
   This class serves two purposes:
@@ -49,9 +50,14 @@ abstract class Aggregator extends AggregateFunction[AnyRef, AnyRef, AnyRef] {
 
   override final def merge(a: AnyRef, b: AnyRef): AnyRef = mergeAggregates(a.asInstanceOf[Aggregate], b.asInstanceOf[Aggregate])
 
-  final def toContextTransformation(variableName: String, aggregateBy: LazyParameter[_])(implicit nodeId: NodeId):
-    ValidationContext => ValidatedNel[ProcessCompilationError, ValidationContext] = validationCtx => computeOutputType(aggregateBy.returnType)
+  final def toContextTransformation(variableName: String, emitContext: Boolean, aggregateBy: LazyParameter[_])(implicit nodeId: NodeId):
+    ValidationContext => ValidatedNel[ProcessCompilationError, ValidationContext] = validationCtx =>
+    computeOutputType(aggregateBy.returnType)
     //TODO: better error?
       .leftMap(message => NonEmptyList.of(CannotCreateObjectError(message, nodeId.id)))
-      .andThen(validationCtx.withVariable(variableName, _, paramName = None))
+      .andThen { outputType =>
+        val ctx = if (emitContext) validationCtx else ValidationContext.empty
+        ctx.withVariable(variableName, outputType, paramName = None)
+      }.andThen(KeyEnricher.contextTransformation)
+
 }
diff --git a/...cala/pl/touk/nussknacker/engine/flink/util/transformer/aggregate/AggregatorFunction.scala b/...cala/pl/touk/nussknacker/engine/flink/util/transformer/aggregate/AggregatorFunction.scala
@@ -1,7 +1,6 @@
 package pl.touk.nussknacker.engine.flink.util.transformer.aggregate
 
 import java.util.concurrent.TimeUnit
-
 import cats.data.NonEmptyList
 import com.codahale.metrics.{Histogram, SlidingTimeWindowReservoir}
 import org.apache.flink.api.common.functions.RuntimeContext
@@ -17,7 +16,7 @@ import pl.touk.nussknacker.engine.api.context.ProcessCompilationError.NodeId
 import pl.touk.nussknacker.engine.api.typed.typing.TypingResult
 import pl.touk.nussknacker.engine.api.{ValueWithContext, Context => NkContext}
 import pl.touk.nussknacker.engine.flink.api.state.{LatelyEvictableStateFunction, StateHolder}
-import pl.touk.nussknacker.engine.flink.util.keyed.StringKeyedValue
+import pl.touk.nussknacker.engine.flink.util.keyed.{KeyEnricher, StringKeyedValue}
 import pl.touk.nussknacker.engine.flink.util.metrics.MetricUtils
 import pl.touk.nussknacker.engine.flink.util.orderedmap.FlinkRangeMap
 import pl.touk.nussknacker.engine.flink.util.orderedmap.FlinkRangeMap._
@@ -90,7 +89,8 @@ trait AggregatorFunctionMixin[MapT[K,V]] { self: StateHolder[MapT[Long, AnyRef]]
     val newState = addElementToState(value, timestamp, timeService, out)
     val finalVal = computeFinalValue(newState, timestamp)
     timeHistogram.update(System.nanoTime() - start)
-    out.collect(ValueWithContext(finalVal, value.context))
+    out.collect(ValueWithContext(finalVal, KeyEnricher.enrichWithKey(value.context, value.value)))
+
   }
 
   protected def addElementToState(value: ValueWithContext[StringKeyedValue[AnyRef]],