|
rss_habr
Десять важных вопросов перед трудоустройством в Data ScienceПонедельник, 23 Января 2023 г. 10:10 (ссылка)
Переход на мою текущую позицию занял около четырёх месяцев: с мая по сентябрь я проходил HR, будущего руководителя, его команду, руководителя руководителя и руководителя руководителя руководителя. Почти всё это время я задавал вопросы, чтобы понять подходит мне эта позиция или нет. В итоге, когда ответы меня удовлетворили — я согласился на предложение, и сейчас я Head of Machine Learning Laboratory в Альфа-Банке. Но мой кейс не такой распространённый — чаще всего собеседования затягиваются «всего» до 5 часов в виде увлекательного квеста проверки хард и софт скиллов. Но и на собеседование ещё надо попасть — ведь отклик на позицию не гарантирует приглашение на интервью или даже формального ответа на заявку, потому что желающих обычно порядка 100 человек на одно место даже с учётом огромного количества предложений от всевозможных работодателей. Как вы понимаете, нанимающая сторона на рынке вакансий Data Science проводит очень тщательный отбор в свою команду. К сожалению, дата сайентист не может поступать аналогичным образом и прособеседовать своего работодателя, но может задать интересующие его вопросы после интервью и найти много полезной информации самостоятельно в сети. В этой статье расскажу о 10 ключевых вопросах, на которые крайне желательно получить ответ до вашего трудоустройства. Ведь от них будет зависеть не только как вы проведёте несколько часов на собеседовании, но и как скоро будете искать новую работу, когда поймёте, что надо было вопросы всё-таки задавать. Простым перечислением не ограничусь — попытаюсь донести, почему считаю их крайне важными. Более того, под капотом вы сможете узнать мои ответы на эти вопросы. Читать далееhttps://habr.com/ru/post/709416/?utm_source=habrahabr&utm_medium=rss&utm_campaign=709416
rss_habr
Как определять объекты на пересыпе — кейс rdl by red_mad_robot с «Еврохим» и ERGЧетверг, 19 Января 2023 г. 11:50 (ссылка)
Другими словами, как распознавать негабарит в реальном времени, ещё до того, как он попал на конвейер. Читать далееhttps://habr.com/ru/post/711534/?utm_source=habrahabr&utm_medium=rss&utm_campaign=711534
rss_habr
Polars: библиотека для работы с данными, написанная на RUSTЧетверг, 12 Января 2023 г. 11:26 (ссылка)
Настоящий хреновый программист всегда находится на гребне волны новых технологий. Зачем ему это? Чтобы при случае можно было повыделоваться багажом своих знаний, и заработать немного очков уважения в окружении своих менее осведомлённых коллег. Stay toxic, brothers. Я с вами. Когда-то давно мне нужно было обработать чуть больше тысячи жирнейших excel-таблиц и сделать это нужно было быстро. Буквально за час я вкатился в Python и Pandas, а за второй час выполнил все необходимые манипуляции. Так я и познакомился с этими двумя. С тех самых пор приходилось выполнять самые разные задачи по анализу данных и всё бы ничего, но хотелось бы, чтобы Pandas работал побыстрее. Оказывается хотелось не одному мне, а целой команде разработчиков, на Rust. Как и полагается, всё что на Rust то Blazingly-Fast, и Polars не стала исключением. За счёт чего Polars быстрее Pandas? Что это за библиотека и стоит ли на неё переходить? Давайте попробуем разобраться в этой статье. Читать далееhttps://habr.com/ru/post/710240/?utm_source=habrahabr&utm_medium=rss&utm_campaign=710240
rss_habr
Третья жизнь пет-проекта по распознаванию рукописных цифрПятница, 23 Декабря 2022 г. 14:23 (ссылка)
В этом блогпосте я поделюсь историей о том, как я обновлял свой старенький пет-проект по распознаванию цифр, как делал разметку для него, и почему модель предсказывает 12 классов, хотя цифр всего 10. https://habr.com/ru/post/707046/?utm_source=habrahabr&utm_medium=rss&utm_campaign=707046
rss_habr
[Перевод] Mainstream или миф: децентрализация облаковЧетверг, 06 Октября 2022 г. 16:09 (ссылка)
Продолжаем копать дальше и разбираться что же происходит интересного в мире web 3.0: стоит ли овчинка выделки, чтобы туда вообще погружаться. Сегодня мы попытаемся разобраться, что такое децентрализованное облако и причем там blockchain. Но начнем как всегда сначала с классического облака и рассмотрим историю его трансформации в децентрализованное. Также в статье мы немного покритикуем AWS, Google Cloud и Azure. Как же без этого. Поговорим о применении контейниризации в децентрализованных облаках. Ведь одназначно мы выступает не за количество, а за качество, то есть стремимся к повышению эффективности использования оборудования. Затронем тему токенов и для чего они нужны проектам из web 3.0 Читать далееhttps://habr.com/ru/post/691884/?utm_source=habrahabr&utm_medium=rss&utm_campaign=691884
rss_habr
Особое мнение: предугадываем фрод без дата-сайнсаСреда, 05 Октября 2022 г. 14:08 (ссылка)
Каждая компания, принимающая платежи на своем сайте или в магазине, рано или поздно сталкивается с фродом (fraud) и несет убытки. Есть разные методы борьбы с ними. 80% всех задач обычно решаются скриптами, а потом к ним уже докручивается дата-сайнс. Правда не всегда понятно для чего. Но давайте пока не будем останавливаться на этом, а попробуем решить типичные проблемы. Такие, как сбор данных, долгий этап оценки гипотез и снижение нагрузки на внешние системы. Меня зовут Александр Сальков. Я разработчик в Sportmaster Lab. Руковожу направлением дата инженерии и больше 10 лет разрабатываю базы данных и все системы, которые так или иначе с ними связаны. Когда я был молод, написал свой вариант Кафки, который делал то же самое, что делает Кафка, только между инстансами Oracle. Участвовал во всяких разных датасаентистских вещах. В частности, делал систему идентификации людей по венам на ладонях. И много всякого интересного. Читать далееhttps://habr.com/ru/post/691486/?utm_source=habrahabr&utm_medium=rss&utm_campaign=691486
rss_habr
Регрессионный анализ в DataScience. Простая линейная регрессия. Библиотека statsmodelsВторник, 27 Сентября 2022 г. 16:05 (ссылка)
Обзор построения и анализа парной линейной регрессионной модели с использованием библиотеки statsmodels Впередhttps://habr.com/ru/post/690414/?utm_source=habrahabr&utm_medium=rss&utm_campaign=690414
rss_habr
Проверка нормальности распределения с использованием критерия Эппса-Палли средствами PythonСреда, 31 Августа 2022 г. 11:00 (ссылка)
Методический разбор для специалистов DataScience по применению критерия Эппса-Палли для проверки нормальности распределения средствами python Читать далееhttps://habr.com/ru/post/685582/?utm_source=habrahabr&utm_medium=rss&utm_campaign=685582
rss_habr
Pycon Russia-2022: программа докладов, пиксель-мерч и песни у костраПятница, 08 Июля 2022 г. 12:55 (ссылка)
Всем привет! Три недели осталось до старта нашей конференции. Мы нашли самых огненных спикеров и собрали 25 докладов, так или иначе связанных с python-разработкой. Придумали классную идею для афтерпати и пошили самые красивые (по версии девочек из IT-People) футболки. Пора познакомить вас со всем этим. И что же там такое?https://habr.com/ru/post/675872/?utm_source=habrahabr&utm_medium=rss&utm_campaign=675872
rss_habr
Простым языком о языковых моделях и цепи Маркова (Markov Chain)Вторник, 05 Июля 2022 г. 17:04 (ссылка)
N-граммы N-граммы – это статистические модели, которые предсказывают следующее слово после N-1 слов на основе вероятности их сочетания. Например, сочетание I want to в английском языке имеет высокую вероятностью, а want I to – низкую. Говоря простым языком, N-грамма – это последовательность n слов. Например, биграммы – это последовательности из двух слов (I want, want to, to, go, go to, to the…), триграммы – последовательности из трех слов (I want to, want to go, to go to…) и так далее. Такие распределения вероятностей имеют широкое применение в машинном переводе, автоматической проверке орфографии, распознавании речи и умном вводе. Например, при распознавании речи, по сравнению с фразой eyes awe of an, последовательность I saw a van будет иметь большую вероятность. Во всех этих случаях мы подсчитываем вероятность следующего слова или последовательности слов. Такие подсчеты называются языковыми моделями. Как же рассчитать P(w)? Например, вероятность предложения P(I, found, two, pounds, in, the, library). Для этого нам понадобится цепное правило, которое определяется так: Читать далееhttps://habr.com/ru/post/675218/?utm_source=habrahabr&utm_medium=rss&utm_campaign=675218
|
LiveInternet.Ru |
Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат О проекте: помощь|контакты|разместить рекламу|версия для pda |