Динамическое программирование — рюкзак, НВП, НОП

Сайт переезжает. Большинство статей уже перенесено на новую версию.
Скоро добавим автоматические переходы, но пока обновленную версию этой статьи можно найти там.

Предполагается, что вы уже знакомы с базовыми понятиями динамического программирования и помните бинарный поиск.

Задача о рюкзаке

0-1 Рюкзак

В самой простой форме задача о рюкзаке формулируется так: > Даны

n

предметов с весами

a_{1}, \dots, a_{n}

. Определите, на какой максимальный вес можно набрать предметов в рюкзак вместимости

W

Для решения этой задачи воспользуемся динамическим программированием. Обозначим за

d p [i] [j]

состояние, когда мы рассмотрели первые

i

предметов и набрали ими

j

веса.

d p [i] [j] = T r u e

, если такая ситуация возможна, иначе

d p [i] [j] = F a l s e

Для каждого состояния

d p [i] [j]

, которое возможно получить, мы можем либо взять предмет номер

i

и попробовать обновить ответ из состояния

d p [i - 1] [j - a [i]]

, либо не брать его и обновить ответ из

d p [i - 1] [j]

. Очевидно, что мы можем получить 0 веса, рассмотрев 0 предметов.

Ответом будет максимальное

j

, такое что

d p [n] [j] = T r u e

. Таким образом, мы получили решение за

O (n W)

0-1 Рюкзак со стоимостями

Немного усложним задачу. Пусть, теперь предметы имеют не только веса, но и стоимости

c_{1}, \dots, c_{n}

. Соответственно, надо набрать предметов с наибольшей суммарной стоимостью, но весом не превосходящим

W

. Теперь в

d p [i] [j]

будем хранить не просто возможно ли получить из первых

i

предметов набор веса

j

, а максимальную суммарную стоимость такого набора. Если же такой набор получить невозможно, то по-прежнему

d p [i] [j] = 0

. Переходы такие же как и в прошлой задаче. Изначально

d p

заполнено 0, так как для любого непустого набора мы пока не знаем, как его получить, а путой набор имеет стоимость 0.

Ответом на задачу будет максимальное

d p [n] [j]

. Такое решение тоже работает за

O (n W)

Если так получилось, что веса большие, а стоимости маленькие, можно поменять их местами и считать минимальный вес при данной набранной стоимости. Поменять местами значение динамики и параметр — довольно распространенный трюк в динамическом программировании.

Рюкзак с ограниченным числом предметов

Пусть, теперь предметов каждого типа может быть несколько, то есть даны не только веса и стоимости, но и максимальные количества каждого из предметов

k_{1}, \dots, k_{n}

. Тогда для каждого состояния

d p [i] [j]

переберем, сколько мы взяли предметов такого типа и сделаем переход из каждого соответствующего состояния. Понятно, что мы не сможем взять более, чем

⌊ \frac{W}{a_{i}} ⌋

предметов каждого типа.

Такое решение работает за

O (n W^{2})

, так как

k_{i}

могут быть очень большими, а

a_{1} = 1

Можете попробовать решить эту задачу за

O (n W \log K)

, где

K

— максимальное из

k_{i}

Рюкзак с неограниченным числом предметов

Пусть, теперь каждого предмета будет не

k_{i}

, а вообще бесконечно. Оказывается, задача стала только проще. Вернемся к обычному рюкзаку с весами и стоимостями. Единственное отличие будет в том, что теперь мы можем делать второй переход не из предыдущей строки, а прямо из текущей. При этом заметим, что для каждого состояния достаточно рассмотреть взятие только одного предмета данного типа, поскольку взятие двух и более будет рассмотрено одновременно.

Если

W

велико, а

a_{i}

достаточно малы, можно построить решение за

O (n + A^{3})

, где

A

— максимальное из

a_{i}

. Заметим, что если

W

достаточно большое, то большая часть рюкзака будет занята предметами одного и того же типа с максимальной удельной стоимостью. Можно доказать, что одним и тем же предметом будет занято не менее

W - A^{2}

веса. Таким образом, можно за

O (n)

выбрать предмет с максимальным удельным весом, а для оставшихся предметов запустить предыдущий алгоритм, который сработает за

O (A^{3})

, так как имеет смысл рассматривать не более

A

предметов, а максимальный вес

A^{2}

Восстановление ответа

Во всех рассмотренных задачах восстановление ответа делается стандартным образом: нужно из ответа пройтись обратно до начала.

Наибольшая возрастающая подпоследовательность

Пусть, дана последовательность из

n

чисел

a_{1}, \dots, a_{n}

. Требуется найти длину ее наибольшей возрастающей подпоследовательности (НВП), то есть длину такой наибольшей последовательности индексов

i_{1} < i_{2} < \dots < i_{k}

, что

a [i_{1}] < a [i_{2}] < \dots < a [i_{k}]

Пример: в последовательности

100, \underset{―}{20}, \underset{―}{75}, 0, - 40, \underset{―}{80}, - 10, \underset{―}{120}, 110

наибольшей возрастающей подпоследовательность является

20, 75, 80, 120

: она имеет длину

4

. Возрастающих подпоследовательностей длины 5 здесь нет.

НВП за

O (N^{2})

Давайте решать наивно через динамческое программирование - то есть хранить в

d p [i]

ровно то, что нам надо найти - длину НВП для первых

i

чисел.

d p [0] = 0

. Но как найти формулу, выражающую

d p [i]

через предыдущин значения?

Ну, есть два варианта: *

i

-ое число не входит в НВП. Тогда

d p [i] = 1

i

-ое число входит в НВП. Тогда

d p [i] = 1 + d p [k]

, где

k

- индекс предыдущего числа в этой НВП. Так давайте просто его переберем. При этом надо учесть, что

a [k]

должно быть меньше, чем

a [i]

Этот алгоритм работает за

O (N^{2})

: у нас

O (N)

состояний динамики, и каждое из них мы считаем за

O (N)

действий, пока ищем этот максимум.

Ответ восстанавливается тем же способом: для каждого состояния нужно сохранить, где был этот максимум - там и есть предыдущее число в НВП.

НВП за

O (N \log N)

Решим эту задачу чуть более нестандартным динамическим программированием, где

m i n_e n d [i]

будет обозначать минимальное число, на которое может заканчиваться НВП длины

i

. При этом мы будем постепенно обрабатывать числа слева направо, и в этом массиве будет храниться только информация про все НВП в уже обработанном начале последовательности.

Изначально

m i n_e n d [0] = - \infty, m i n_e n d [i] = \infty

для

i > 0

. В качестве

\infty

надо выбрать число, которое заведомо больше любого из

a_{i}

, аналогично с

- \infty

Рассматривая очередной элемент, попробуем продлить им каждую подпоследовательность:

Ответом будет максимальный такой индекс

j

, что

m i n_e n d [j] \neq 0

. Это решение работает за

O (n^{2})

Его можно значительно ускорить, заметив два факта: - На любом шаге

m i n_e n d [i - 1] \leq m i n_e n d [i]

. Это легко доказать от противного. - Из предыдущего факта следует, что любое

a [i]

обновит максимум одно значение динамики, так как попадет максимум в один интервал.

Значит, для поиска

j

, которое обновится можно воспользоваться бинарным поиском. Это решение уже работает за

O (n \log n)

Наибольшая общая подпоследовательность

Даны две последовательности

a_{1}, \dots, a_{n}

b_{1}, \dots, b_{m}

. Требуется найти длину их наибольшей общей подпоследовательности (НОП), то есть длину наибольшей таких последовательностей

i_{1} < \dots < i_{k}

j_{1} < \dots < j_{k}

, что

a [i_{1}] = b [j_{1}], \dots, a [i_{k}] = b [j_{k}]

Решим эту задачу с помощью динамического программирования, где

d p [i] [j]

будет обозначать длину НОП, если мы рассмотрели префиксы последовательностей длины

i

j

Тогда заметим, что есть две ситуации, когда мы считаем

d p [i] [j]

: *

a_{i} \neq b_{j}

, тогда хотя бы один из этиз символов не содержится в НОП, иначе она заканчивается на два разных символа. В этом случае

d p [i] [j] = m a x (d p [i - 1] [j], d p [i] [j - 1])

a_{i} = b_{j}

, тогда несложно доказать, что точно есть максимальная НОП, в которую входят ОБА этих символа, а значит

d p [i] [j] = 1 + d p [i - 1] [j - 1]

Ответом является максимальное число в массиве

d p

. Решение работает за

O (n m)

Ответ при это восстанавливается классическим способом - с конца. Нам все еще нужно просто в каждой ячейке смотреть - если символы в ней равны, то нужно уменьшить

i

j

, иначе только один из них - так, чтобы НОП был максимален.

Задание

Найдите НОП двух перестановок длины

n

за

O (n \log n)

Динамика по префиксу и значению последнего элемента

Пусть, дана последовательность

a_{1}, \dots, a_{n}

, с максимальным значением

A

. Требуется найти длину наибольшей такой подпоследовательности, что ее элементы отличаются на более, чем на 1. Воспользуемся динамическим программированием, где

d p [j]

будет обозначать ответ с последним взятым элементом, равным

j

. Будем обновлять и хранить актуалььным весь массив

d p

целиком, проходясь по массиву

a

слева направо.

Соответственно для каждого

i

переходы можно делать только из таких

j

, что

| a [i] - j | \leq 1

Заметим, что вот эти две идеи встречаются в задачах наиболее часто: * хранить в

d p [i]

ответ для

i

-ого префикса. Как в рюкзаке (где можно пользоваться

i

первыми предметами), НВП(где ответ на префиксе длины

i

) и НОП (где ответ для префиксов длины

i

j

). * хранить в

d p [i]

ответ для последовательностей, заканчивающихся на

i

Ленивая динамика

Если сложно придумать порядок обхода таким образом, чтобы все предыдущие значения уже были посчитаны, то можно вместо циклов использовать рекурсивную функцию и запоминать посчитанный результат, чтобы не считать несколько раз одно и то же.

Решим, например, обычную задачу о рюкзаке таким образом. Изначально все

d p [i] [j] = - 1

, это будет обозначать, что значение еще не посчитано, кроме

d p [0] [j] = 0

Время работы так же составит

O (n W)

, так как каждое значение мы считаем только один раз, но истинное время работы будет в несколько раз больше, потому что константа на вызовы функции значительно выше чем на простой цикл.

Задание

Решите как можно больше задач из этих двух контестов:

https://informatics.msk.ru/mod/statements/view.php?id=33257 ### Дополнительная сложная задача https://csacademy.com/contest/round-61/task/strictly-increasing-array/statement/

Динамическое программирование — рюкзак, НВП, НОП

Задача о рюкзаке

0-1 Рюкзак

0-1 Рюкзак со стоимостями

Рюкзак с ограниченным числом предметов

Рюкзак с неограниченным числом предметов

Восстановление ответа

Наибольшая возрастающая подпоследовательность

НВП за O(N2)

НВП за O(Nlog⁡N)

Наибольшая общая подпоследовательность

Задание

Задание

Динамика по префиксу и значению последнего элемента

Ленивая динамика

Задание

НВП за $O (N^{2})$

НВП за $O (N \log N)$