Практически ни одно расследование не обходится без сбора данных. Не всегда данные представлены в виде готовых таблиц. Иногда они сверстаны в виде HTML-страниц. Собирать такие данные вручную тяжело и долго.
Решить задачу помогает веб-скрейпинг – автоматический сбор данных со страниц сайта. Собирать данные можно с помощью сторонних сервисов или программирования.
Команда фонда n-ost, Теплица социальных технологий, медиапроект «Четвертый сектор» приглашают поговорить об этих способах на курсе «Веб-скрейпинг для журналистов. С программированием и без».
Ведущие:
- Алеся Мароховская, редактор
- Андрей Дорожный, дата-журналист, эксперт по визуализации данных
- Михаил Данилович, журналист медиапроекта «Четвертый сектор»
Курс состоит из четырех вебинаров. Начало онлайн-встреч — в 13.00 (по московскому времени).
18 января — «Веб-скрейпинг для журналиста»
Алеся Мароховская, Андрей Дорожный и Михаил Данилович расскажут о журналистских кейсах, которые получились только благодаря веб-скрейпингу. Первый вводный вебинар поможет определить, насколько вам необходимо использовать программирование или вы можете обойтись инструментами, о которых будет рассказывать и показывать Андрей Дорожный на втором вебинаре.
19 января — «Скрейпинг данных без программирования»
Андрей Дорожный расскажет о сервисах, которые помогут журналисту собирать данные с сайтов автоматически и без программирования. Для занятия понадобится браузер Google Chrome или Яндекс браузер. Также необходимо скачать расширения для браузера: первое, второе, третье, четвертое.
20 января — «Скрейпинг с Python. Часть 1»
Алеся Мароховская расскажет, как использовать библиотеки BeautifulSoup и Requests, чтобы скрейпить сайты с помощью Python. Для участия нужно иметь хотя бы базовые знания языка программирования Python. Также нужно установить Anaconda, чтобы использовать Jupyter Notebook (идет в комплекте Анаконды). Ссылка для скачивания. Можно использовать любой другой редактор кода, если он кажется более удобным, но на занятии будет использоваться Jupyter Notebook.
22 января — «Скрейпинг с Python. Часть 2»
Алеся Мароховская расскажет, как использовать библиотеку Selenium для более сложных случаев скрейпинга с помощью Python. Для участия понадобится Jupyter Notebook (или другой редактор кода). Также нужно скачать или обновиться до последней версии браузера Chrome. И скачать такую же версию Chrome Driver по ссылке. Обязательно убедитесь, что у браузера и Driver одинаковые версии.
Онлайн-курс будет полезен всем журналистам и тем, кто занимается расследованиями и исследованиями на основе данных, вне зависимости от уровня навыков в программировании.
Онлайн-встречи будут проходить на платформе Zoom.
Для получения ссылки на трансляцию необходимо зарегистрироваться.
Контакты
е-mail: alisetsvetkova@te-st.ru (Теплица социальных технологий)