Cats Effect & Http4s

Часть 11. Cats Effect & Http4s

Страничка курса: https://maxcom.github.io/scala-course-2022/

План

Эффекты
IO vs Future
Trampolining
IO API
Resource
Thread Model: Fibers
Http4s

В начале мы познакомимся с понятием эффектов в программировании.

Далее рассмотрим монаду IO, которая предлагается в библиотеке cats-effect как альтернатива для стандартного Future, и сравним их между собой.

Особое внимание уделим приёму trampolining, который используется в этой монаде.

Далее рассмотрим как cats effect предлагает работать с ресурсами, чтобы максимально сохранять безопасность кода.

Обязательно разберём предлагаемую модель потоков и понятие файберов.

В конце лекции сделаем быстрый обзор на минималистичный сервер http4s, который очень прост в использовании и отлично сочетается с cats-effect.

Чистая функция

Является детерминированной
Не обладает побочными эффектами (side-effect)

Побочный эффект

Создание или изменение файла
Запись данных в базу
Изменение глобальной переменной (увеличение счётчика)
Модификация переданной в функцию переменной
Изменение своего дальнейшего поведения
Вызов внешней функции, имеющей любой из перечисленных выше эффектов

Представим, что мы хотим, чтобы в результате каких-то вычислений, в результате получения новой информации или команды программа что-то записала в базу данных, в файл или изменила значение счётчика.

Всё это - изменения каких-то ВНЕШНИХ по отношению к программе "ресурсов".

В частности к изменению таких внешних ресурсов относится и модификация переданной в функцию переменной.

Также к побочным эффектам относится изменение своего ВНУТРЕННЕГО состояния таким образом, что в дальнейшем внешние проявления в поведении программы будут отличаться от предыдущих.

И, наконец, вызов какой-то внешней функции, приводящий к любому из этих последствий, также будет нарушать чистоту нашей функции и считаться side-effect-ом.

Чистые функции - это хорошо?

Так почему же чистые функции - это хорошо?

Как правило, наличие side-effect-а влечёт за собой нарушение детерминированности.

Но бывает и что-то одно: только детерминированные функции без side-эффектов. Например, функция random или функция получения значения из какой-то глобальной переменной. Или функция чтения из базы данных или файла.

И наоборот, функции с side-эффектами, но при этом детерминированные. Например, функция print, которая всегда возвращает 0.

Чистые функции

Делают код более предсказуемым
Решают проблемы многопоточности
Позволяют кешировать результат
Можно менять местами последовательность вызова двух чистых функций

В любом случае функции, не являющиеся чистыми, делают поведение программы труднопредсказуемым и не однозначным.

Начинают вылезать странности при одновременном вызове одной и той же функции в нескольких потоках. Например, когда несколько пользователей запрашивают что-то у сервиса, то могут получить различные результаты в зависимости от порядка выполнения запросов.

Реализовывать асинхронные программы становится сложнее, потому что результаты одного потока могут зависить от выполнения другого потока.

Все эти проблемы решаются чистыми функциями.

Более того, чистые функции позволяют кешировать результат и заменять вызов функции на значение её результата. А ещё можно смело менять последовательность вызова таких функций не опасаясь за результат.

Но что же делать, если почти всегда "полезными результатами" работы программы являются какие-то побочные эффекты? Ведь вся цель написания программы - это выполнить какие-то действия и что-то поменять в окружающем мире!

Resource

Внешний относительно функции объект,
который может меняться со временем

(не обязательно побочными эффектами
данной функции)

Здесь на помощь приходит понятие "ресурса". Это некоторый "внешний" относительно функции объект, который может менять своё состояние с течением времени. Например, это может быть тот же файл на диске, база данных, глобальная переменная, консоль ввода-вывода, какая-нибудь стейт-машина.

В итоге всё сводится к тому, чтобы максимально локализовать работу с ресурсами и обеспечить безопасное использование ресурсов несколькими потоками.

Методы для работы с ресурсами стоит рассматривать как единичное и неделимое действие, а в конце этих действий нужно полностью освобождать ресурс

Методы для работы с ресурсами лучше всего рассматривать как единичное и неделимое действие, а в конце этих действий нужно полностью освобождать ресурс.

Вся остальная программа при этом состоит из чистых функций, из которых разработчик проектирует как из кирпичиков, и обращение к ресурсам становится максимально похоже на эти кирпичики.

При таком подходе работа с ресурсами становится гораздо более предсказуемой и максимально близкой к чистым функциям, с тем лишь исключением, что остаётся некоторый "внешний эффект": Например, записанные в этот ресурс данные или изменённое состояние ресурса.

Заметим, что, текущее состояния объекта можно рассматривать, как некоторую информацию, которую этот объект содержит. Поэтому нет никого смысла рассматривать этот случай отдельно.

Cats Effect

https://typelevel.org/cats-effect

Cats Effect

"Высокопроизводительная асинхронная компонуемая платформа для создания приложений в чистом функциональном стиле"

IO monad

Безопасное использование и управление ресурсами
Типизированность
Параллельность (Fiber - легковесные потоки, управляемые средой выполнения)
Асинхронность (callback-driven) или синхронность
Конечное или бесконечное время выполнения

... который позволяет управлять эффектами и следить за жизненным циклом ресурсов, безопасно выделять и освобождать их.

При этом эффекты могут быть как асинхронными (т.е. вызывать callback-функцию по окончании действия) так и синхронными (т.е. непосредственно возвращающими значения).

Параллелизму здесь способствует понятие "волокон", которые представляют собой легковесные прерываемые потоки, полностью управляемые средой выполнения.

Это вольный перевод, в оригинале они называются: Fiber.

Эти волокна намного дешевле, чем нативные потоки операционной системы, поэтому можно создавать их в огромном количестве.

Интересной особенностью IO-монады является её способность не только выполнить какое-то действие и вернуть результат, но и выпоняться бесконечно. Дальше мы увидим подобные примеры.

Стоит также сказать, что IO-монада является типизированной, но этим уже мало кого удивишь.

IO vs Future

 object Future {
   def apply[A](body: => A): Future[A]
 }

 object IO {
   def apply[A](body: => A): IO[A]
 }

Для начала посмотрим на конструктор. На первый взгляд, они абсолютно одинаковые: в обоих случаях мы передаёт тело функции как by-name параметр. (т.е. оно будет выполнено только в момент непосредственного использования). Но внутри Future сразу запускает вычисление и возвращает некоторую сущность, которая по окончании вычисления будет содержать полученное значение. В дальнейшем мы можем обращаться к ней несколько раз и получать это значение.

IO действует иначе. Возвращается контейнер с функцией, но вычисление ещё не запускалось. Оно будет запущено только когда мы попытаемся получить значение. При этом если мы будем обращаться к значению несколько раз, то оно будет вычисляться заново!

	Eager with Memo	Lazy with Memo	Lazy without Memo
Sync	val A	lazy val () => A	def () => A
Async	Future[A] (A => Unit) => Unit		IO[A] () => (A => Unit) => Unit

Можно провести аналогию с val и def: val сразу вычисляет значение и возвращает его, сколько бы раз мы не обращались. def вычисляет только при обращении, причём делает это каждый раз. В случае future и io происходит тоже самое, но вычисляется в другом потоке.

Таким образом, в отличие от Future, IO представляет собой ОПИСАНИЕ куска программы, а не текущие вычисления. Это дает полный контроль над тем, как и когда будут выполняться эффекты. Простые программы могут быть использованы для составления более сложных программ, сохраняя при этом своё поведение и сложность.

IO evaluated at the "end of the world"

 val addToGauge = IO {
   ???
   println("Added!")
 }

 val program: IO[Unit] =
   for {
      _ <- addToGauge
      _ <- addToGauge
   } yield ()

 program.unsafeRunSync()
 // Added!
 // Added!

Вот как это обычно выглядит на практике. Представьте, что у вас есть какие-то кусочки программы, завёрнутые в IO. Например, кусок кода, который увеличивает счётчик и печатает сообщение об этом.

Воспользуемся тем, что IO - это монада, а значит у неё есть метод flatMap, доступны различные трансформеры, которые позволяют "накручивать" конструкцию и конечно же можно использовать красивый и наглядный синтаксис for.

Когда конструкция будет собрана, то в конце запускается метод run и получается результат.

Обратите внимание, что в данном случае метод print выполнился два раза. Если бы мы использовали Future, то счётчик был бы увеличен только один раз.

Stack Safety

 def fib(n: Int, a: Long = 0, b: Long = 1): IO[Long] =
   IO(a + b).flatMap { b2 =>
     if (n > 0) 
       fib(n - 1, b, b2)
     else 
       IO.pure(a)
 }

IO is trampolined in its flatMap evaluation

Trampolining

Основная идея – сделать, чтобы функция возвращала continuation

Что же такое trampoline и как это вообще работает?

Давайте вспомним, что при каждом вызове функции выделяется дополнительная память (как минимум на переменные, передаваемые в функцию).

При глубокой рекурсии в стеке вызовов оказывается гораздо больше информации, чем он может вместить. В итоге это вызывает "переполнение стека".

Хвостовая рекурсия решает эту проблему за счёт того, что последним действием вызывает сама себя и это позволяет трансформировать её в цикл, а не создавать более глубокий стек.

Здесь идея похожая. Нужно сделать так, чтобы функция в итоге возвращала либо окончательный результат вычислений, либо continuation. Это должна быть функция без аргументов, содержащую оставшуюся часть вычислений.

sealed abstract class IO[A]

case class Pure[A](a: A) extends IO[A]
case class Suspend[A](thunk: () => A) extends IO[A]
case class FlatMap[A, B](io: IO[B], f: B => IO[A]) extends IO[A]

 sealed abstract class IO[A] {
   def flatMap[B](f: A => IO[B]): IO[B] = FlatMap(this, f)

   def unsafeRun(): A = this match {
     case Pure(a) => a
     case Suspend(thunk) => thunk()
     case FlatMap(io, f) => f(io.unsafeRun()).unsafeRun()
   }
 }

 def unsafeRun(): A = this match {
   case Pure(a) => a
   case Suspend(thunk) => thunk()
   case FlatMap(ioA, f) => ioA match {
     case Pure(a) =>
       f(a).unsafeRun()
     case Suspend(thunk) =>
       thunk().flatMap(f).unsafeRun()
     case FlatMap(ioB, g) =>
       ioB.flatMap(g(_) flatMap f).unsafeRun()
   }
 }

Получаем хвостовую рекурсию!

IO API

 object IO {
   //side effect is not thread-blocking:
   def apply[A](thunk: => A): IO[A] //alias for delay
   def delay[A](thunk: => A): IO[A]

   //side effect is thread-blocking:
   def blocking[A](thunk: => A): IO[A]      //uncancelable
   def interruptible[A](thunk: => A): IO[A] //cancelable
   def interruptibleMany[A](thunk: => A): IO[A]
 }

Помимо стандартного конструктора, который принимает by-name параметром отложенное вычисление, существуют и другие способы создать IO.

Например, метод есть метод delay, который имеет чуть более говорящее название, но на самом деле это просто его синоним.

Эти конструкторы подходят только для неблокирующих операций.

Для блокирующих нужно использовать либо конструктор blocking, который является непрерываемым,
либо прерываемый interruptible.

Обратите внимание, что для прерывания interruptable будет предпринята только одна попытка,
в то время как его разновидность interruptibleMany будет получать повторяемые попытки прерывания до тех пор, пока блокирующая операция не завершится или не выйдет.

Все перечисленные конструкторы имеют одинаковую семантику и отличие только в логике работы (и, соответственно, в производительности).
Например, interruptable будет работать заметно медленнее, чем blocking, потому что имеет дополнительный оверхед от координации прерываний.

 object IO {
   //was `async` in Cats Effect 2.x
   def async_[A](
     k: ((Either[Throwable, A]) => Unit) => Unit
   ): IO[A]

   //generalized version for `cancelable` in Cats Effect 2.x
   def async[A](
     k: ((Either[Throwable, A]) => Unit) => IO[Option[IO[Unit]]]
   ): IO[A]
 }

Если обычные IO .apply и .delay описывают операции, которые могут сразу же быть выполнены в том же треде и call-стеке, то для описания операций в других потоках нужно использовать IO.async.

В старых версиях cats-effect для данного метода было необходимо описать последовательность действий, которая может принимать в качестве параметра callback. Сам callback имеет сигнатуру функции, применяемой к "Either Throwable A", но ничего не возвращающей.

Т.е. описывая действия мы можем ещё и вызывать callback-и.

В версии Cats Effect 3 и выше метод был переименован в async с подчёркиванием и предлагается использовать новую сигнатуру.

Теперь описываемая последовательность должна возвращать IO от Option.
В Option содержится необязательный финализатор, который будет запущен в случае отмены файбера, выполняющего метод async.

В версии 2 для этих целей использовался отдельный конструктор cancelable, а теперь их обобщили в один.

Внешний IO здесь нужен для того, чтобы приостановить процесс регистрации самого обратного вызова.

def fromCompletableFuture[A](f: IO[CompletableFuture[A]]):IO[A]=
  f.flatMap { cf =>
    IO.async { cb =>
      IO {
        //Invoke the callback with the result
        //of the completable future
        val stage = cf.handle[Unit] {
          case (a, null) => cb(Right(a))
          case (_, e) => cb(Left(e))
        }

        //Cancel the completable future if the fiber is canceled
        Some(IO(stage.cancel(false)).void)
  }}}

object IO {
  def pure[A](value: A): IO[A]           //already evaluated
  def canceled: IO[Unit]                 //already cancelled
  def raiseError[A](t: Throwable): IO[A] //already throwed

  def stub: IO[Nothing]
  def unit: IO[Unit]                     //alias for IO.pure(())
  def none[A]: IO[Option[A]]             //contains None
  def some[A](a: A): IO[Option[A]]       //contains Some(a)

  def raiseUnless(cond: Boolean)(e: => Throwable): IO[Unit]
  def raiseWhen(cond: Boolean)(e: => Throwable): IO[Unit]

  def never[A]: IO[A]                 //alias for async(_ => ())
}

Разумеется есть и вырожденные варианты для создания IO-шек.

Например, pure, canceled и raiseError создают IO, получая параметр не по имени, а по значению. Таким образом подставляется уже вычисленное значение, ошибка или создаётся изначально прерванную IO.

Конструктор some действует аналогично pure, но дополнительно оборачивает значение в Some. Есть также совсем вырожденные случаи stub, unit и none.

Более интересные варианты: raiseUnless и raiseWhen,
- которые очень часто используются на практике для проверки условий и прерываний последовательности действиу внутри for.

Отдельно стоит обратить внимание на IO.never. Это действие, которое никогда не завершится.
На самом деле это просто алиас для async, который ничего не делает и никогда не вызывает callback,
но он имеет очень интересное практическое значение и способы применения, которые мы увидим дальше.

 object IO {
   def fromEither[A](e: Either[Throwable, A]): IO[A]
   def fromFuture[A](fut: IO[Future[A]]): IO[A]
   def fromOption[A](o: Option[A])(orElse: => Throwable): IO[A]
   def fromTry[A](t: Try[A]): IO[A]
 }

class IO[A] {
  def map[B](f: A => B): IO[B]
  def flatMap[B](f: A => IO[B]): IO[B]

  def redeem[B](recover: Throwable => B, map: A => B): IO[B]
  def redeemWith[B](r: Throwable => IO[B], b: A => IO[B]): IO[B]

  def as[B](newValue: => B): IO[B] = map(_ => newValue)
  def void: IO[Unit] = map(_ => ())
}

 object IO {

   def race[A, B](left: IO[A], right: IO[B]): IO[Either[A, B]]

   def racePair[A, B](left: IO[A], right: IO[B]):
                                IO[Either[
                                    (OutcomeIO[A], FiberIO[B]),
                                    (FiberIO[A], OutcomeIO[B])
                                ]]
 }

Интересные методы: race и racePair.

Первый запускает две IO параллельно и удерживает результат той, что выполнится раньше. Опоздавшую останавливает.

При этом результатом будет Either, а значит мы сохраняем информацию о том, какая из них завершилась раньше: left или right. Также это позволяет иметь разные возвращаемые типы для запускаемых IO-шек.

Второй метод работает аналогично, но он не прерывает "опоздавшую", а возвращает вместо неё Файбер, который польватель может при желании сам прервать или как-то ещё обработать.

В Cats Effect версии 2 для первой завершённой IO возвращался результат как это делается в методе race, но начиная с версии 3 возвращается обёрнутый в Outcome результат.

Через пару слайдов я расскажу что это такое, а пока давайте посмотрим на пример.

 val ioA: IO[A] = ???
 val ioB: IO[String] = IO.sleep(10.seconds).as("Timeout")

 IO.racePair(ioB, ioA).flatMap {
   case Left((err, fiberA)) =>
     fiberA.cancel.as(err)
   case Right((_, a)) =>
     IO.pure(a)
 }

 object IO {

   def both[A, B](left: IO[A], right: IO[B]): IO[(A, B)]

   def bothOutcome[A, B](left: IO[A], right: IO[B]):
                                IO[(OutcomeIO[A], OutcomeIO[B])]
 }

Outcome

 sealed trait Outcome[F[_], E, A]

 case class Succeeded[F[_],E,A](s: F[A]) extends Outcome[F,E,A]
 case class Errored  [F[_],E,A](e: E)    extends Outcome[F,E,A]
 case class Canceled [F[_],E,A]()        extends Outcome[F,E,A]

 sealed trait Outcome[F[_], E, A] {
   def isCanceled: Boolean
   def isError: Boolean
   def isSuccess: Boolean

   def fold[B](onCancel: => B,
               onError: (E) => B,
               onComplete: (F[A]) => B
              ): B
 }

Resource

 def bracket[A, B](acquire: F[A])
                  (use: A => F[B])
                  (release: A => F[Unit]): F[B]

   //acquire & release - uncancelable
   //use - cancelable, but could be masked

Такую логику реализует метод bracket и его разновидности.

Первым параметром он принимает действие получения ресурса, вторым - действие, которое будет выполнено при успешном получении, а третьим освобождает ресурс. При этом последнее будет вызвано при любом Outcome у второго параметра, будь то успех, ошибка или отмена.

Обратите внимание, что действия полуения и освобождения ресурса являются неотменяемыми и гарантируется вызов финализатора ровно один раз.

Само действие над ресурсом изначально отменяемое, но как и на любую IO на неё можно навесить маску неотменяемости.


 IO.bracket(openFile("file1")) { file1 =>
   IO.bracket(openFile("file2")) { file2 =>
     IO.bracket(openFile("file3")) { file3 =>
       for {
         bytes1 <- read(file1)
         bytes2 <- read(file2)
         _ <- write(file3, bytes1 ++ bytes2)
       } yield ()
     }(file3 => close(file3))
   }(file2 => close(file2))
 }(file1 => close(file1))

Однако, комбинация из нескольких подобных вложенных методов быстро становится громоздкой.

Пример можно видеть на данном слайде. Здесь читаются два файла и их объединение записывается в третий файл.

Вторым недостатком данного метода является смешивание логики получения ресурса и работы с ним.

Для решения обоих этих проблем Cats Effect предлагают использовать отдельный класс - Resource.

Туда выносится вся логика получения и освобождения ресурса, оставляя в стороне всю содержательную часть логики.

Объекты типа resource можно легко комбинировать, избегая громоздких вложенных конструкций вроде той, что мы наблюдаем для bracket.

 object Resource {
   def make[F[_], A](acquire: F[A])
                    (release: A => F[Unit]): Resource[F, A]

   def eval[F[_], A](fa: F[A]): Resource[F, A]
 }

 abstract class Resource[F, A] {
   def use[B](f: A => F[B]): F[B]
 }

Самым простым способом создать ресурс является метод make, который принимает всё те же параметры с действиями получения и освобождения ресурса.

Метод для работы с полученным ресурсом вынесен в метод класса.

Можно также построить ресурс из имеющегося аппликатива с помощью метода eval. При этом подразумевается, что финалайзер никакой не требуется, и на функцию создания не вешается маска непрерываемости. Т.е. если они была прерываемой, то при выделении ресурса такой и останется.

 def file(name: String): Resource[IO, File] =
     Resource.make(openFile(name)))(file => close(file))

 ( for { in1 <- file("file1")
         in2 <- file("file2")
         out <- file("file3")
   } yield (in1, in2, out)
 ).use { case (file1, file2, file3) =>
   for { bytes1 <- read(file1)
         bytes2 <- read(file2)
         _ <- write(file3, bytes1 ++ bytes2)
   } yield ()
 }


 open(file1).use(IO.pure).flatMap(readFile)
 // ОШИБКА: файл уже закрыт


 file.use(read) >> file.use(read)
 // дважды открыли и закрыли

 file.use { file => read(file) >> read(file) }
 // один раз открыли и закрыли

Thread Model

Fibers

Логический поток

Асинхронный процесс

Логический поток может быть разбит на две части некоторой асинхронной границей.

Например, часть инструкций может выполняться на каком-то одном узле кластера, потом происходит передача данных по сети и вторая часть инструкций выполняется уже на другом узле.

Можно рассматривать процессы и на более низком уровне. Например, это уже не узлы кластера, а разные потоки операционной системы и часть инструкций шедулятся на одном потоке, а часть на другом.

Асинхронный процесс можно рассматривать как процесс, продолжающий своё выполнение в другом месте по отношению к тому, где он стартовал.

Перемешивание

M:N Threading

Логический поток предоставляет
синхронный интерфейс
к асинхронному процессу

К чему все эти сложности?

Есть такая штука как блокировка.

Представьте, что логический поток А приостановил свою работу и ожидает выполнение В.

За счёт того, что у нас есть шедулер, который это отслеживает, мы не останавливаем выполнение потока на системном уровне, а продолжаем выполнять другие потоки.

Таким образом несмотря на возникновение блокировки на более высоком уровне процессор не "встаёт колом", а продолжает активно работать и выполнять другие задачи.

Уровни

1. Процессы ОС: M:N с процессорами.; Собственное состояние выполнения, собственное пространство памяти
2. ОС/JVM Threads: M:N с процессами.; Собственное состояние выполнения, разделяемое пространство памяти
3. Fibers: M:N c потоками.; Разделяемое состояние выполнение, разделяемое пространство памяти

Таким образом мы приходим к следующей иерархии.

На самом низком уровне у нас лежат процессы операционной системы. Дальше у нас идут потоки JVM и ОС. И наконец мы приходим к так называемым файберам.

Идея в том, что запуск процессов операционной системы достаточно трудоёмкий и дорогостоящий.

Cats Effect реализует создание файберы размером примерно 150 байт каждый.

Процесс создания и запуска нового файбера сам по себе чрезвычайно быстр, что позволяет создавать очень недолговечные, «одноразовые» волокна, когда это удобно.

И вы можете без проблем создавать их миллионами, а вашим основным ограничивающим фактором будет просто память.

Запуск файберов находится на пользовательском уровне и обеспечивает нам дополнительный уровень в иерархии, который позволяет нам на этом уровне осуществлять синхронную блокировку, но при этом не блокировать лежащие в их основе потоки JVM.

Это так называемые семантические блокировки.

Кооперативное планирование

Fiber


trait Fiber[F[_], E, A] {
  def join: F[Outcome[F, E, A]]
  def cancel: F[Unit]
}

abstract class IO[+A] {
  def start[A](): IO[Fiber[IO, Throwable, A]]
  def startOn(ec: ExecutionContext): IO[Fiber[IO, Throwable, A]]
  def blocking[A](thunk: => A): IO[A]
}

В частности у IO-монады есть метод start, который описывает эффект старта этой монады. Получая файбер мы можем к нему заджойниться либо отменить его.

Но не забываем, что этот join является только семантической блокировкой, поэтому он не блокирует JVM-тред и ничего плохого в нём нет.

Данное вычисление будет запущено в текущем ExecutionContext-e. Если необходимо вынести его в отдельный, то можно воспользоваться методом startOn.

На практике чаще всего возникает необходимость выносить только блокирующие операции.
Для этого можно использовать метод blocking.
Он переносит указанное действие в отдельный пул потоков, чтобы избежать блокировки основного, а затем возвращает его обратно.


 IO.println("current pool") >>
   IO.blocking(println("blocking pool")) >>
   IO.println("current pool")

Выполняем действие в блокирующем пуле и возвращаеся обратно

Так было в Cats Effect 2.x


 trait Blocker {
   def blockOn[F[_], A](fa: F[A])
                       (implicit cs: ContextShift[F]): F[A]
 }

 blocker.blockOn(IO(readFile)) >>
   IO(println("Shifted back to the pool that CS represents"))

Blocker убрали в Cats Effect 3.x

Так было в Cats Effect 2.x


 trait ContextShift[F[_]] {
   def evalOn[A](ec: ExecutionContext)(fa: F[A]): F[A]
   def shift: F[Unit]
 }

ContextShift убрали в Cats Effect 3.x

Пример (Cats Effect 2.x)

 CS.evalOn(blockingPool)(
   IO(println("I run on the blocking pool"))
 ) >>
   IO(println("I am shifted onto the pool that CS represents"))

 IO(println("I run on some pool")) >>
   CS.shift >>                 // можно использовать IO.shift
   IO(println("I run on the pool that CS represents"))

IO.shift

Переключение обратно из пула, не управляемого системой (например, при срабатывании callback handler в клиенте Java HTTP)

Автоматизировано Cats Effect 3.x

Перепланировать Fiber в том же ExecutionContext (дать другим Fiber-ам процессорное время)

IO.shift(implicit e: ExecutionContext) заменили на IO.cede

Раньше shift использовался в двух случаях.

Первый - по прямому назначению, для обратного переключения контекста, когда нужно было вернуться из колбека.

Сейчас в этом нет необходимости, т.к. в асинхронных вычислениях теперь это делается автоматически.

Второй случай - это когда есть долгая цепочка операций, находящихся в одном файбере.

Как уже упоминалось ранее, файбер должен сам периодически отдавать процессорное время другим потокам.

Shift как раз являлся такой границей, на которой приостанавливалось выполнение файбера, а дальнейшие вычисления попадали в планировщик и ожидали пока им снова разрешат выполняться.

В таком случае просто делался шифт на тот же самый тред-пул, что и был до этого.

Чтобы сохранить такую функциональность в IO добавили метод cede ("сид").

Только раньше в shift передавался явно или неявно ExecutionContext, а теперь этого не требуется.

Пример

 def fib(n: Int, a: Long = 0, b: Long = 1): IO[Long] =
   IO(a + b).flatMap { b2 =>
     val next =
       if (n > 0) fib(n - 1, b, b2)
       else IO.pure(a)

     // Triggering a logical fork every 100 iterations
     if (n % 100 == 0)
       IO.cede >> next
     else
       next
   }

IOApp

 trait IOApp {

     def run(args: List[String]): IO[ExitCode]

     final def main(args: Array[String]): Unit = {
         //получает IORuntimeConfig
         //создаёт IORuntime
         //запускает выполнение run в "main fiber"
     }

 }

Каждое приложение имеет «main-fiber».

Это очень похоже на понятие «main thread» в том смысле,
что это точка, в которой начинается поток управления программой.

Традиционно в Cats Effect программа создаётся с помощью трейта IOApp, который требует определить единственный метод - run.

Этот метод принимает на вход набор аргументов, а на выходе должен быть определён эффект и код завершения программы.

Внутри скрывается реализация привычного всем метода main.

Когда он вызывается извне (например, с помощью команды java),
он вычитывает настройки и создаёт IORuntime.

Это такой объект, который содержит всю информацию о тредпулах и планировщике.

Затем запускается выполнение метода run в основном файбере.

Файбер работает до тех пор, пока этот он не завершится.

После чего завершается и выполнение программы.

Fiber может

Начать выполнение другого
Инициировать отмену дочернего (метод cancel)
Отслеживать результат дочернего (Outcome)
Продолжать выполнение после завершения дочернего

НО !

Родительский может завершиться раньше

Могут отслеживать собственную отмену,
но не могут восстанавливаться
или продолжать выполнение после неё

Пример

 object Main extends IOApp.Simple {
   val run = IO.println("Hello") >> IO.println("World")
 }

 trait Simple extends IOApp {
   def run: IO[Unit]
   final def run(args: List[String]): IO[ExitCode] =
                                        run.as(ExitCode.Success)
 }

Http4s

https://http4s.org

Может показаться, что таким образом получится писать только программы, которые завершаются после выполнения какого-то набора действий.

То есть это будут всякие вспомогательные скрипты и тому подобное.

А нам хотелось бы запустить какой-то сервис, который будет постоянно существовать и реагировать на внешние запросы.

Например, какой-нибудь вебсервер.

И тут на помощь приходит IO.never, который запускает асинхронный процесс, который сразу же завершается, но никогда не вызовет колбек.

Давайте попробуем создать вебсервер на примере http4s.

import cats.effect._

object Main extends IOApp.Simple {
  val server: ResourceIO[org.http4s.server.Server] = ???

  val run = server.use(_ => IO.never)
}

Для начала создадим IOApp

. Всё очень просто: нужно определить сервера как ресурс, а затем использовать его в бесконечной IO-шке.

Сам запуск сервера будет описан в функции инициализации для ресурса, а остановка в функии release.

Напомнию, что в случае прерывания IO-шки из метода use (т.е., например, когда мы остановим выполнение программы сочетанием ctrl+c), у нас всегда отработает финалайзер.

Таким образом с помощью ресурса можно контролировать запуски и остановки различных сторонных сервисов, сокетов и т.п.

 import com.comcast.ip4s._
 import org.http4s.ember.server.EmberServerBuilder
 import org.http4s._

 val httpApp: HttpApp[IO] = ???

 val server =
   EmberServerBuilder
     .default[IO]
     .withHost(ipv4"0.0.0.0")
     .withPort(port"8080")
     .withHttpApp(httpApp)
     .build


 type HttpApp[F[_]] = Kleisli[F, Request[F], Response[F]]

 // Kleisli[F[_], A, B]
 // is just a wrapper around the function
 // A => F[B]

 import org.http4s.HttpRoutes
 import org.http4s.dsl.io._
 import org.http4s.implicits._

 // Request[IO] => OptionT[IO, Response[IO]]
 val routes: HttpRoutes[IO] =
   HttpRoutes.of[IO] {
     case GET -> Root / "hello" / name =>
       Ok(s"Hello, $name.")
   }

 val app: HttpApp[IO] = httpRoutes.orNotFound

Думаю, все без труда представляют себе логику обработки запроса.

Необходимо последовательно проверить все описанные роуты.

Для перебора всех существующих роутов и их проверки прекрасно подходит Partial Function.

В http4s есть удобная конструкция, которая преобразует partial function в роуты.
Это HttpRoutes.of.

Только нужно обратить внимание, что конструкция не гарантирует, что найдётся подходящий роут, поэтому она возвращает опциональное значение.

Если ничего подходящего не найдётся, то нужно вернуть NotFound.

Опять же, в http4s есть готовый метод, который делает это и заодно трансформирует опциональный типа kleisli в полный.


 val helloWorldService: HttpRoutes[IO] = ???

 val whatsUpService: HttpRoutes[IO] = ???
 val telegramService: HttpRoutes[IO] = ???

 val messengers = whatsUpService <+> telegramService

 val httpApp = Router(
   "/" -> helloWorldService,
   "/mes" -> messengers
 ).orNotFound

Синтаксис для описания роутов мы сейчас не будет рассматривать, вы легко найдёте его в официальной документации.

Стоит, разве что, упомянуть наличие роутеров, которые позволяют разделять описанные роуты на наборы по некоторому префиксу.

Можно и наоборот, объединять два или более наборов роутов в один, который будет последовательно искать подходящий роут в каждом из них.

Для этого достаточно воспользоваться методом combine из cats.

Страничка курса:
https://maxcom.github.io/scala-course-2022/