Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 53 сообщений
Cообщения с меткой

datascience - Самое интересное в блогах

Следующие 30  »
rss_habr

Десять важных вопросов перед трудоустройством в Data Science

Понедельник, 23 Января 2023 г. 10:10 (ссылка)

Переход на мою текущую позицию занял около четырёх месяцев: с мая по сентябрь я проходил HR, будущего руководителя, его команду, руководителя руководителя и руководителя руководителя руководителя. Почти всё это время я задавал вопросы, чтобы понять подходит мне эта позиция или нет. В итоге, когда ответы меня удовлетворили — я согласился на предложение, и сейчас я Head of Machine Learning Laboratory в Альфа-Банке.

Но мой кейс не такой распространённый — чаще всего собеседования затягиваются «всего» до 5 часов в виде увлекательного квеста проверки хард и софт скиллов. Но и на собеседование ещё надо попасть — ведь отклик на позицию не гарантирует приглашение на интервью или даже формального ответа на заявку, потому что желающих обычно порядка 100 человек на одно место даже с учётом огромного количества предложений от всевозможных работодателей.

Как вы понимаете, нанимающая сторона на рынке вакансий Data Science проводит очень тщательный отбор в свою команду. К сожалению, дата сайентист не может поступать аналогичным образом и прособеседовать своего работодателя, но может задать интересующие его вопросы после интервью и найти много полезной информации самостоятельно в сети. В этой статье расскажу о 10 ключевых вопросах, на которые крайне желательно получить ответ до вашего трудоустройства. Ведь от них будет зависеть не только как вы проведёте несколько часов на собеседовании, но и как скоро будете искать новую работу, когда поймёте, что надо было вопросы всё-таки задавать.

Простым перечислением не ограничусь — попытаюсь донести, почему считаю их крайне важными. Более того, под капотом вы сможете узнать мои ответы на эти вопросы.

Читать далее

https://habr.com/ru/post/709416/?utm_source=habrahabr&utm_medium=rss&utm_campaign=709416

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как определять объекты на пересыпе — кейс rdl by red_mad_robot с «Еврохим» и ERG

Четверг, 19 Января 2023 г. 11:50 (ссылка)

Другими словами, как распознавать негабарит в реальном времени, ещё до того, как он попал на конвейер.

Читать далее

https://habr.com/ru/post/711534/?utm_source=habrahabr&utm_medium=rss&utm_campaign=711534

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Polars: библиотека для работы с данными, написанная на RUST

Четверг, 12 Января 2023 г. 11:26 (ссылка)

Настоящий хреновый программист всегда находится на гребне волны новых технологий. Зачем ему это? Чтобы при случае можно было повыделоваться багажом своих знаний, и заработать немного очков уважения в окружении своих менее осведомлённых коллег. Stay toxic, brothers. Я с вами.

Когда-то давно мне нужно было обработать чуть больше тысячи жирнейших excel-таблиц и сделать это нужно было быстро. Буквально за час я вкатился в Python и Pandas, а за второй час выполнил все необходимые манипуляции. Так я и познакомился с этими двумя. С тех самых пор приходилось выполнять самые разные задачи по анализу данных и всё бы ничего, но хотелось бы, чтобы Pandas работал побыстрее. Оказывается хотелось не одному мне, а целой команде разработчиков, на Rust.

Как и полагается, всё что на Rust то Blazingly-Fast, и Polars не стала исключением. За счёт чего Polars быстрее Pandas? Что это за библиотека и стоит ли на неё переходить? Давайте попробуем разобраться в этой статье.

Читать далее

https://habr.com/ru/post/710240/?utm_source=habrahabr&utm_medium=rss&utm_campaign=710240

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Третья жизнь пет-проекта по распознаванию рукописных цифр

Пятница, 23 Декабря 2022 г. 14:23 (ссылка)

В этом блогпосте я поделюсь историей о том, как я обновлял свой старенький пет-проект по распознаванию цифр, как делал разметку для него, и почему модель предсказывает 12 классов, хотя цифр всего 10.
Вот ссылка на само приложение, если хочется интерактива сразу.

Читать далее

https://habr.com/ru/post/707046/?utm_source=habrahabr&utm_medium=rss&utm_campaign=707046

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Mainstream или миф: децентрализация облаков

Четверг, 06 Октября 2022 г. 16:09 (ссылка)

Продолжаем копать дальше и разбираться что же происходит интересного в мире web 3.0: стоит ли овчинка выделки, чтобы туда вообще погружаться. Сегодня мы попытаемся разобраться, что такое децентрализованное облако и причем там blockchain. Но начнем как всегда сначала с классического облака и рассмотрим историю его трансформации в децентрализованное.

Также в статье мы немного покритикуем AWS, Google Cloud и Azure. Как же без этого. Поговорим о применении контейниризации в децентрализованных облаках. Ведь одназначно мы выступает не за количество, а за качество, то есть стремимся к повышению эффективности использования оборудования. Затронем тему токенов и для чего они нужны проектам из web 3.0

Читать далее

https://habr.com/ru/post/691884/?utm_source=habrahabr&utm_medium=rss&utm_campaign=691884

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Особое мнение: предугадываем фрод без дата-сайнса

Среда, 05 Октября 2022 г. 14:08 (ссылка)

Каждая компания, принимающая платежи на своем сайте или в магазине, рано или поздно сталкивается с фродом (fraud) и несет убытки. Есть разные методы борьбы с ними. 80% всех задач обычно решаются скриптами, а потом к ним уже докручивается дата-сайнс. Правда не всегда понятно для чего. Но давайте пока не будем останавливаться на этом, а попробуем решить типичные проблемы. Такие, как сбор данных, долгий этап оценки гипотез и снижение нагрузки на внешние системы.

Меня зовут Александр Сальков. Я разработчик в Sportmaster Lab. Руковожу направлением дата инженерии и больше 10 лет разрабатываю базы данных и все системы, которые так или иначе с ними связаны. Когда я был молод, написал свой вариант Кафки, который делал то же самое, что делает Кафка, только между инстансами Oracle. Участвовал во всяких разных датасаентистских вещах. В частности, делал систему идентификации людей по венам на ладонях. И много всякого интересного.

Читать далее

https://habr.com/ru/post/691486/?utm_source=habrahabr&utm_medium=rss&utm_campaign=691486

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Регрессионный анализ в DataScience. Простая линейная регрессия. Библиотека statsmodels

Вторник, 27 Сентября 2022 г. 16:05 (ссылка)

Обзор построения и анализа парной линейной регрессионной модели с использованием библиотеки statsmodels

Вперед

https://habr.com/ru/post/690414/?utm_source=habrahabr&utm_medium=rss&utm_campaign=690414

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Проверка нормальности распределения с использованием критерия Эппса-Палли средствами Python

Среда, 31 Августа 2022 г. 11:00 (ссылка)

Методический разбор для специалистов DataScience по применению критерия Эппса-Палли для проверки нормальности распределения средствами python

Читать далее

https://habr.com/ru/post/685582/?utm_source=habrahabr&utm_medium=rss&utm_campaign=685582

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Pycon Russia-2022: программа докладов, пиксель-мерч и песни у костра

Пятница, 08 Июля 2022 г. 12:55 (ссылка)

Всем привет! Три недели осталось до старта нашей конференции. Мы нашли самых огненных спикеров и собрали 25 докладов, так или иначе связанных с python-разработкой. Придумали классную идею для афтерпати и пошили самые красивые (по версии девочек из IT-People) футболки. Пора познакомить вас со всем этим.

И что же там такое?

https://habr.com/ru/post/675872/?utm_source=habrahabr&utm_medium=rss&utm_campaign=675872

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Простым языком о языковых моделях и цепи Маркова (Markov Chain)

Вторник, 05 Июля 2022 г. 17:04 (ссылка)

N-граммы

N-граммы – это статистические модели, которые предсказывают следующее слово после N-1 слов на основе вероятности их сочетания. Например, сочетание I want to в английском языке имеет высокую вероятностью, а want I to – низкую. Говоря простым языком, N-грамма – это последовательность n слов. Например, биграммы – это последовательности из двух слов (I want, want to, to, go, go to, to the…), триграммы – последовательности из трех слов (I want to, want to go, to go to…) и так далее.

Такие распределения вероятностей имеют широкое применение в машинном переводе, автоматической проверке орфографии, распознавании речи и умном вводе. Например, при распознавании речи, по сравнению с фразой eyes awe of an, последовательность I saw a van будет иметь большую вероятность. Во всех этих случаях мы подсчитываем вероятность следующего слова или последовательности слов. Такие подсчеты называются языковыми моделями.

Как же рассчитать P(w)? Например, вероятность предложения P(I, found, two, pounds, in, the, library). Для этого нам понадобится цепное правило, которое определяется так:

Читать далее

https://habr.com/ru/post/675218/?utm_source=habrahabr&utm_medium=rss&utm_campaign=675218

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<datascience - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda