Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 6 сообщений
Cообщения с меткой

urllib - Самое интересное в блогах

Следующие 30  »
rss_habr

Банкрот или не банкрот? Вот в чем вопрос

Четверг, 07 Апреля 2022 г. 12:47 (ссылка)

Сталкиваетесь ли Вы с необходимостью использовать внешние источники данных? Если да, то Вам пригодится алгоритм автоматизированного сбора информации с сайта – парсер. Разберём процесс создания такого алгоритма на примере сайта ЕФРСБ.

Перед Data Science специалистами регулярно встают задачи, для решения которых необходима информация из внешних источников, и часто её объёмы такие, что ручной поиск занимает непозволительно много времени. Автоматизированный сбор данных с сайта (парсинг) позволяет получить необходимые для задачи сведения, экономя время.

Одна из таких задач встала перед нашей командой: понадобились данные о процедуре признания физических лиц банкротами. Для этого был разработан алгоритм парсинга сайта Единого федерального реестра сведений о банкротстве (ЕФРСБ) с использованием библиотек requests и bs4. В настоящей статье предлагаю рассмотреть процесс создания этого парсера и познакомить Вас с решениями некоторых проблем, с которыми мы столкнулись.

Разработку алгоритма мы решили разбить на 2 части:

Читать далее

https://habr.com/ru/post/659569/?utm_source=habrahabr&utm_medium=rss&utm_campaign=659569

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<urllib - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda