Обучение LoRA-модели для генерации иллюстраций в стиле Франклина Бута

Иллюстрация Франклина Бута
Франклин Бут — американский иллюстратор 19-20 веков, известный своими детальными работами тушью и пером.
При этом, несмотря на профессиональную востребованность в своё время, его имя сегодня не так широко известно, во многом из-за того, что большая часть его иллюстраций осталась «привязанной» к конкретным журнальным публикациям и не получила большого самостоятельного распространения.
Целью проекта является попытка «заново показать» эти работы, сделать их более видимыми в современном контексте, а также попытаться «воссоздать» своеобразную стилистику Бута.
Стиль Бута формировался как детальная техника, где множество отдельных линий создают ритм и текстуры. Это возникло из-за того, что он тщательно копировал иллюстрации из журналов, думая, что видит рисунки пером и тушью, хотя на самом деле многие из них были гравюрами на дереве. Можно сказать, благодаря этому подходу его работы отличаются очень детальной проработкой и своеобразной плотной штриховкой, которая формирует особый визуальный ритм иллюстраций.

Иллюстрации Франклина Бута
Техника строится на внимании к фактуре, четком разделении света и тени, а также на тщательно выстроенной линейной структуре изображения. Еще одна характерная черта — большие масштабы и пространства, нависшие над маленькими фигурками, большой контраст в размерах объектов, что делает многие иллюстрации величественными и грандиозными.
Фрагмент иллюстрации Франклина Бута
Сгенерированная серия иллюстраций
На примере иллюстраций можно увидеть, что модели удалось отобразить характерные Франклину Буту контраст масштабов, большое пространство и воздух, несмотря на большое количество деталей, а также соблюдение линейного построения.
Можно заметить, что многие объекты, например здания и колонны очень сильно вытянуты вверх, что придает им масштабность в контексте композиции.
Однако модели не удалось полностью отобразить штриховку оригинальных иллюстраций: изображения хоть и состоят из характерных Буту линий, но они не имеют достаточной степени четкости.
И все же лучше всего логика штриховки прослеживается на зданиях, фоне и облаках.
Интересно, что даже в закрытых помещениях вся композиция выглядит вытянутой вверх: на иллюстрации с мастерской окно и потолки достаточно высокие, а по стене располагаются полки, которые еще больше работают на ощущение вытянутой композиции. Такой же эффект достигается и в изображениях с деревьями, которые кажутся довольно высокими, обрамляя кадр по бокам.
Также модель лучше всего изображает здания и постройки, что закономерно вытекает из изначального датасета с работами Бута.
Ноутбук с кодом для обучения
При написании одной части кода (совмещение в одну ячейку импорта оригинального датасета с подготовкой изображения к дальнейшей обработке) был использован ChatGPT для помощи с возникшей проблемой.
Также был использован AI-увеличитель изображений Upscayl для улучшения качества кадрированной картинки.




