Archive of Our Own (AO3) — это некоммерческое хранилище фанфикшена с открытым исходным кодом, которое непрерывно работает уже почти 20 лет.
В марте 2021 года администраторы сайта разрешили своим пользователям изучить данные, которые они собирали в течение многих лет. Давайте посмотрим, что мы можем найти в этих данных!
Сначала мы импортируем нашу библиотеку и данные, выведем имена столбцов и типы данных с помощью команды print (df1.dtypes), чтобы узнать, какие типы данных доступны.
Имена столбцов и типы данных: creation date object language object restricted bool complete bool word_count float64 tags object
Frances Jones Bannerman, In the Conservatory, 1883
Существует распространенное заблуждение, что фанфикшн — это некачественная форма письма, и что как чтение, так и написание фанфиков ассоциируется с незрелостью, самовнушением, дешевизной и отсутствием фантазии, потому что сама сфера является вторичной.
Если бы это было правдой, было бы разумно предположить, что авторы фанфиков чаще бросают свои текущие проекты, рассеивая их по разным областям фэндома. Поддерживает ли наша база данных эту идею?
Увы, большинство писателей, использующих AO3, заканчивают свои творения. В их защиту можно сказать, что у них было более 10 лет!
Давайте посмотрим, есть ли какие-нибудь всплески в первые годы работы сайта?
Мне очень трудно определить разницу между 0,5% и чуть больше 1% как значительную.
Основываясь только на этой статистике, можно сказать, что авторы фанфиков кажутся довольно целеустремленными и хорошо организованными.
Возможно, такие черты характера можно определить по длине их произведений? Давайте разделим все фанфики по количеству слов и подсчитаем процент от общего числа произведений, представленных на сайте.
Наконец, я хотела бы проверить, подтверждается ли фактами идея о том, что фанфикшн — это самовнушение и в основном эротика для женщин.
Однако процентное соотношение, которое я получил в результате этого анализа, показывает, что только около 5% произведений получили рейтинг «R», который включает в себя не только эротику, но и графическое насилие и чрезмерную ругань, и эта тенденция снижается с годами, едва превысив 1% в 2021 году.
Study, Frank Moss Bennett, 1874-1952
В конце концов, если судить исключительно по данным, которые я проанализировала на ao3, тенденции писателей не так уж сильно меняются с годами и кажутся довольно устойчивыми и стабильными.
Для этого проекта были использованы: База данных AO3 для анализа, ChatGPT-4 для написания и редактирования кода, DeepLWrite для вычитки и редактирования написанного.
Файл ipynb: https://drive.google.com/file/d/1-AzyXPzX-73dSRwXwPmK9bFFNJdKWEG1/view?usp=sharing



