Steps¶

Steps are the individual operations that make up your pipeline. Each step receives a Result and returns a Result.

Step Types¶

SimpleFlow supports any callable object as a step:

1. Lambda/Proc¶

pipeline = SimpleFlow::Pipeline.new do
  step ->(result) do
    new_value = result.value.upcase
    result.continue(new_value)
  end
end

2. Method References¶

def validate_email(result)
  if result.value[:email] =~ /\A[\w+\-.]+@[a-z\d\-]+(\.[a-z\d\-]+)*\.[a-z]+\z/i
    result.continue(result.value)
  else
    result.with_error(:validation, 'Invalid email').halt
  end
end

pipeline = SimpleFlow::Pipeline.new do
  step method(:validate_email)
end

3. Callable Objects¶

class UserValidator
  def call(result)
    user = result.value

    errors = []
    errors << 'Name required' if user[:name].blank?
    errors << 'Email required' if user[:email].blank?

    if errors.any?
      errors.each { |error| result = result.with_error(:validation, error) }
      return result.halt
    end

    result.continue(user)
  end
end

pipeline = SimpleFlow::Pipeline.new do
  step UserValidator.new
end

4. Class Methods¶

class DataTransformer
  def self.call(result)
    transformed = transform_data(result.value)
    result.continue(transformed)
  end

  def self.transform_data(data)
    # Transformation logic
    data.transform_values(&:to_s)
  end
end

pipeline = SimpleFlow::Pipeline.new do
  step DataTransformer
end

Anonymous vs Named Steps¶

Anonymous Steps (Sequential Execution)¶

Anonymous steps execute sequentially with automatic dependencies on the previous step's success.

Each step implicitly depends on the previous step completing successfully (not halting). If any step halts, subsequent steps are skipped.

pipeline = SimpleFlow::Pipeline.new do
  step ->(result) {
    puts "Step 1"
    result.continue(result.value * 2)
  }

  step ->(result) {
    puts "Step 2"
    result.continue(result.value + 10)
  }

  step ->(result) {
    puts "Step 3"
    result.continue(result.value.to_s)
  }
end

result = pipeline.call(SimpleFlow::Result.new(5))
# Output:
# Step 1
# Step 2
# Step 3
# result.value => "20"

Key characteristics: - Execute in the order they were defined - Each step receives the result from the previous step - Pipeline short-circuits if any step halts (returns result.halt) - No need to specify dependencies explicitly - Use pipeline.call(result) to execute

Example with halting:

pipeline = SimpleFlow::Pipeline.new do
  step ->(result) { puts "Step 1"; result.continue(1) }
  step ->(result) { puts "Step 2"; result.halt(2) }     # Halts here
  step ->(result) { puts "Step 3"; result.continue(3) } # Never executes
end

result = pipeline.call(SimpleFlow::Result.new(0))
# Output:
# Step 1
# Step 2
# (Step 3 is skipped)

Named Steps (Parallel Execution)¶

Named steps with explicit dependencies enable parallel execution based on a dependency graph.

Steps with the same satisfied dependencies run concurrently. No implicit ordering - you must specify all dependencies explicitly.

pipeline = SimpleFlow::Pipeline.new do
  step :fetch_user, ->(result) { fetch_user(result) }, depends_on: []

  # These two run in parallel (both depend only on :fetch_user)
  step :fetch_orders, ->(result) { fetch_orders(result) }, depends_on: [:fetch_user]
  step :fetch_products, ->(result) { fetch_products(result) }, depends_on: [:fetch_user]

  # Waits for both parallel steps
  step :merge, ->(result) { merge_data(result) }, depends_on: [:fetch_orders, :fetch_products]
end

result = pipeline.call_parallel(SimpleFlow::Result.new(user_id))

Key characteristics: - Execute based on dependency graph, not definition order - Steps with satisfied dependencies run in parallel - Must explicitly specify all dependencies with depends_on: - Use pipeline.call_parallel(result) to execute - Optimal for I/O-bound operations (API calls, database queries)

Optional Steps (Dynamic Execution)¶

Optional steps are declared with depends_on: :optional and only execute when explicitly activated at runtime.

This enables dynamic pipelines where the execution path is determined by the data being processed.

pipeline = SimpleFlow::Pipeline.new do
  # Router decides which processor to activate
  step :router, ->(result) {
    case result.value[:type]
    when :pdf
      result.continue(result.value).activate(:process_pdf)
    when :image
      result.continue(result.value).activate(:process_image)
    else
      result.continue(result.value).activate(:process_default)
    end
  }, depends_on: :none

  # Optional processors - only the activated one runs
  step :process_pdf, ->(result) {
    result.continue(process_pdf(result.value))
  }, depends_on: :optional

  step :process_image, ->(result) {
    result.continue(process_image(result.value))
  }, depends_on: :optional

  step :process_default, ->(result) {
    result.continue(process_default(result.value))
  }, depends_on: :optional
end

# Only :router and :process_pdf execute
result = pipeline.call_parallel(SimpleFlow::Result.new({ type: :pdf }))

Key characteristics: - Declared with depends_on: :optional - Not executed unless activated with result.activate(:step_name) - Can activate multiple steps: result.activate(:a, :b, :c) - Optional steps can activate other optional steps (chaining) - Idempotent - activating the same step twice is safe - Activating unknown or non-optional steps raises ArgumentError

Common patterns: - Router Pattern - Route to different handlers based on data - Soft Failure Pattern - Activate error handlers instead of halting - Feature Flags - Enable/disable features at runtime

Learn more about optional steps →

Step Contract¶

Every step must:

Accept a Result object as input
Return a Result object as output
Use .continue(value) to proceed
Use .halt(value) to stop the pipeline

# ✅ Good - follows contract
def my_step(result)
  processed = process(result.value)
  result.continue(processed)
end

# ❌ Bad - returns wrong type
def bad_step(result)
  result.value * 2  # Returns a number, not a Result
end

# ❌ Bad - doesn't accept Result
def bad_step(value)
  value * 2
end

Working with Values¶

Transforming Values¶

step ->(result) do
  # Get current value
  data = result.value

  # Transform it
  transformed = data.map { |item| item.upcase }

  # Continue with new value
  result.continue(transformed)
end

Modifying Nested Data¶

step ->(result) do
  user = result.value
  user[:processed_at] = Time.now
  result.continue(user)
end

Adding Context¶

Context persists across steps without modifying the value:

pipeline = SimpleFlow::Pipeline.new do
  step ->(result) {
    result
      .continue(result.value)
      .with_context(:started_at, Time.now)
  }

  step ->(result) {
    result
      .continue(process(result.value))
      .with_context(:processed_at, Time.now)
  }

  step ->(result) {
    duration = result.context[:processed_at] - result.context[:started_at]
    result
      .continue(result.value)
      .with_context(:duration, duration)
  }
end

Error Handling in Steps¶

Collecting Errors¶

step ->(result) do
  user = result.value
  result_with_errors = result

  if user[:email].nil?
    result_with_errors = result_with_errors.with_error(:validation, 'Email required')
  end

  if user[:age] && user[:age] < 18
    result_with_errors = result_with_errors.with_error(:validation, 'Must be 18+')
  end

  # Continue even with errors (they're tracked)
  result_with_errors.continue(user)
end

Halting on Errors¶

step ->(result) do
  if critical_error?(result.value)
    return result
      .with_error(:critical, 'Cannot proceed')
      .halt
  end

  result.continue(result.value)
end

Conditional Logic¶

Early Return¶

step ->(result) do
  return result.halt if should_skip?(result.value)

  result.continue(process(result.value))
end

Branching¶

step ->(result) do
  if result.value[:type] == 'premium'
    result.continue(process_premium(result.value))
  else
    result.continue(process_standard(result.value))
  end
end

Async/External Operations¶

Steps can perform I/O operations:

step ->(result) do
  # API call
  response = HTTParty.get("https://api.example.com/users/#{result.value[:id]}")

  result
    .continue(response.parsed_response)
    .with_context(:api_response_time, response.headers['x-response-time'])
end

Testing Steps¶

Steps are easy to test in isolation:

require 'minitest/autorun'

class StepTest < Minitest::Test
  def test_validation_step
    result = SimpleFlow::Result.new({ email: 'test@example.com' })
    output = validate_email(result)

    assert output.continue?
    assert_empty output.errors
  end

  def test_validation_step_with_invalid_email
    result = SimpleFlow::Result.new({ email: 'invalid' })
    output = validate_email(result)

    refute output.continue?
    assert_includes output.errors[:validation], 'Invalid email'
  end
end

Best Practices¶

Single Responsibility: Each step should do one thing
Pure Functions: Avoid side effects when possible
Explicit Dependencies: Use named steps with depends_on for clarity
Error Context: Include helpful error messages with context
Testability: Design steps to be easily testable in isolation
Immutability: Never modify the input result - always return a new one
Meaningful Names: For named steps, use descriptive names

Performance Considerations¶

I/O-Bound Steps¶

Use parallel execution for independent I/O operations:

pipeline = SimpleFlow::Pipeline.new do
  step :validate, validator, depends_on: []

  # These run in parallel
  step :fetch_user_data, fetch_user, depends_on: [:validate]
  step :fetch_order_data, fetch_orders, depends_on: [:validate]
  step :fetch_product_data, fetch_products, depends_on: [:validate]
end

CPU-Bound Steps¶

Keep CPU-intensive operations sequential (Ruby GIL limitation):

pipeline = SimpleFlow::Pipeline.new do
  step ->(result) { heavy_computation_1(result) }
  step ->(result) { heavy_computation_2(result) }
end

Next Steps¶

Pipeline - Learn how steps are orchestrated
Flow Control - Advanced flow control patterns
Parallel Execution - Concurrent step execution
Optional Steps - Dynamic step activation patterns
Error Handling Guide - Comprehensive error handling