Youtube, Аналитика | Альбина Анисимова, Олег Брагинский
Записав обучающие видео по навыкам сверхэффективных людей, столкнулись с лавиной отзывов и рекомендаций, которые не посмели оставить без внимания. Основатель «Школы траблшутеров» Олег Брагинский и ученица Альбина Анисимова расскажут о том, как автоматизировали процесс.
Для начала выкачали с Youtube-канала первого соавтора 4’547 ссылок на ролики…
…собрали под ними 13’098 комментариев, обнаружив наличие 4’299 лайков и 4’427 ответов:
Тексты суммарно насчитывают 12’168 слов и содержат полезные для классификации строки:
- «Спасибо» – возможно, отзыв положителен, и как правило краток
- «?» – вероятно, задан интересный вопрос, требующий ответа
- «:» – шанс временной ссылки на конкретный фрагмент
- «,» – может быть пояснение сложного смысла
- «!» – восклицание согласия или противления.
Построили таблицу частотности типовых фраз, чтобы сформулировать правила генерации ответов:
Обратили внимание, что 2’318 текстов или 19,08% от общего количества неотвеченных встречаются более пяти раз, не требуют осмысления и могут обрабатываться автоматически.
С другой стороны, 9’559 комментариев или 78,66%, встречаемые единожды, имеющие длину более 120 символов требуют вдумчивого анализа и неспешного сочинения адекватной реакции:
Оставшиеся 275 текстов или 2,26% попали в серую зону и были отнесены к ручной обработке. Приступили к проектированию адресной модульной коммуникации, создав четыре группы шаблонных ответов:
- фраза благодарности предшествует имени пользователя – строки 2–4 в таблице ниже
- заготовка оценки конструктора завершается никнеймом – строки 5–7
- имя предшествует выражению признательности – строки 8–10
- нейтральные строки для кратких реакций – строки 11–13:
Запустили генерацию формальных ответов, что позволило отреагировать без участия владельца канала почти на 20% комментариев в течение суток. Гораздо больше времени Альбина собирала таблицу ссылок на тексты пользователей, учитывая медлительность YouTube образца 2023 года.
Аппроксимировав ручную обработку 100 реакций пользователей, установили, что разработанный механистический подход сэкономил 12,25 часов, которые потребовались бы для непрерывного написания текстов под 2’593 комментариями. Осталось научиться проставлять лайки под текстами.
Для заинтересовавшихся приведём формулы по которым генерировали автоматические ответы:
А также фрагмент кода на Python с использованием библиотек Selenium и BeautifulSoup с помощью которого собирали и анализировали комментарии под роликами на Youtube:
Таблицы комментариев, отфильтрованные по наличию вопроса, двоеточия, запятой и восклицания не приводим, т.к. гипотеза оказалась слабой. Такое случается часто.