Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 899 сообщений
Cообщения с меткой

поисковые технологии - Самое интересное в блогах

Следующие 30  »
rss_habr

SEO Выводы из утечки кода поисковика Яндекс

Понедельник, 30 Января 2023 г. 14:17 (ссылка)

Я был в восторге, когда узнал об утечке проприетарного исходного кода Яндекса. И после анализа данных я должен сказать, что выводы оказались весьма интересными! Итак, без лишних слов, давайте окунемся в основные выводы, которые я сделал.

Читать далее

https://habr.com/ru/post/713666/?utm_source=habrahabr&utm_medium=rss&utm_campaign=713666

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Вот что я нагуглила за неделю в качестве старшего инженера-программиста

Четверг, 26 Января 2023 г. 15:43 (ссылка)

Три года назад разработчик Софи Кунин* опубликовала пост под названием «Вот что я нагуглила за неделю в качестве профессионального инженера-программиста», и он явно нашел отклик у читателей, поскольку стал довольно вирусным. За эти три года многое произошло. Софи повысили, теперь она старший инженер-программист и руководитель направления веб-разработок в Monzo. Но одно не изменилось: она по-прежнему много гуглит, каждый божий день. Вот что она нагуглила за неделю, версия 2022 года.

Очевидный дисклеймер: эта статья слегка отредактирована, поскольку автор удалила большую часть того, что не относится к работе.

*Обращаем ваше внимание, что позиция автора может не всегда совпадать с мнением МойОфис.

Читать далее

https://habr.com/ru/post/713028/?utm_source=habrahabr&utm_medium=rss&utm_campaign=713028

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Алгоритм поиска «одинаковых» геометрий

Четверг, 26 Января 2023 г. 12:19 (ссылка)

Привет! Меня зовут Мацкевич Евгений, я бекэнд-разработчик 3D-движка компании «Бимейстер». Хоть это и не очевидно на первый взгляд, но элементы загружаемых пользователями 3D-моделей зачастую повторяются, имея при этом различные положение в пространстве, масштабирование и вращение. Я расскажу о том, как мы научили нашу систему распознавать такие элементы как «одинаковые», выделять из них уникальный, а для остальных – вычислять матрицы трансформации. Это дало возможность однократно загружать уникальный элемент, а вместо прочих одинаковых – их матрицы, что сократило трафик и объем занимаемой оперативной памяти.

Читать далее

https://habr.com/ru/post/712968/?utm_source=habrahabr&utm_medium=rss&utm_campaign=712968

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Цепи Маркова: как использовать силу анализа ссылок в SEO

Четверг, 26 Января 2023 г. 10:58 (ссылка)

Как SEO-эксперт, я знаю, насколько важно определить важные страницы сайта и спрогнозировать потенциальные возможности для размещения ссылок. Именно поэтому в своей работе я использую мощный метод: цепи Маркова. В этой статье я объясню, что это такое, как это работает и как вы можете использовать этот метод для улучшения вашей стратегии построения ссылок в рамках SEO.

Читать далее

https://habr.com/ru/post/712942/?utm_source=habrahabr&utm_medium=rss&utm_campaign=712942

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как мы внедряли полнотекстовый поиск

Понедельник, 27 Декабря 2022 г. 02:58 (ссылка)

Раньше я работала на проекте N, где главной бизнесовой сущностью было событие. Это событие имеет свое название и еще несколько полей.
Когда-то нам пришел запрос от юзеров: событие у нас в системе называется, например, "событие от Ивана Ивановича", а они пытаются вбить в поиск "иван иванович рассказал про X" и не получают никаких результатов.
Данная проблема решается с помощью полнотекстового поиска. Вопрос в том, как его реализовать.

Читать далее

https://habr.com/ru/post/707832/?utm_source=habrahabr&utm_medium=rss&utm_campaign=707832

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как я написал свою поисковую систему для быстрого поиска личной информации

Воскресенье, 26 Декабря 2022 г. 00:20 (ссылка)

Предыстория

Все началось с того, что мне стало трудно находить нужную информацию, файлы. Чем больше файлов и папок у меня образовывалось, тем больше времени уходило на поиски нужного. Я понял, что каждый раз искать в бесконечных списках файлов и папок, особенно с условием вложенности это не вариант для больших объемов данных.

Что касается поиска по названию файла, то количество символов, указанных в названии ограниченно и слова при поиске должны быть в строго определенной последовательности. Тем более, если система индексирует другие, не нужные для поиска файла (системные файлы, файлы проектов), то поиск выдает много "мусора".

Поиск по содержанию файла даёт не самый релевантный результат. Может выдать бесполезные результаты с содержанием содержащие ключевые слова, но не относящиеся к тому, что действительно необходимо найти.

Более того по содержанию можно искать только текстовые файлы.

Структура содержания информации

Структура папок представляется собой в виде дерева. Мне это не нравится, потому что каждая папка может содержать только определенные файлы, если не учитывать копирование и ссылки.

Так же это можно представить с примером из реальной жизни, для того, чтобы найти зелёное свежее яблоко сорт "девственный". Необходимо найти отдел с фруктами, затем отдел с яблоками, затем ищем зеленные, затем сорт, ну там ещё их на свежие, не свежие фасуют в этом воображаемом примере и наконец найти нужное apple.

Усложняется ещё все и тем, что я не помню, есть ли там вообще яблоки, и если есть, то хранятся ли они в отделе фрукты или там продаются.

Читать далее

https://habr.com/ru/post/707594/?utm_source=habrahabr&utm_medium=rss&utm_campaign=707594

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как мы затащили MoscowCityHack2022

Понедельник, 19 Декабря 2022 г. 15:59 (ссылка)

10-13 июня 2022 года прошел MoscowCityHack2022. Наша команда NorthShine заняла на нем первое место в первом кейсе. Задача была написать "сервис проверки поддельных новостей (fake news) в сфере технологий и инноваций".

Мы провели небольшой ресерч и определились с тем, как в принципе будем писать сервис по определению фейковых новостей. Сначала нам надо было решить какую новость считать правдивой, а какую - нет...

Читать далее

https://habr.com/ru/post/706374/?utm_source=habrahabr&utm_medium=rss&utm_campaign=706374

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как добавить свой интернет-магазин в Яндекс.Маркет? Правила размещения для магазинов

Суббота, 17 Декабря 2022 г. 19:13 (ссылка)

Яндекс.Маркет – это крупнейший агрегатор товаров разных категорий. Он содержит более 100 млн. предложений от различных магазинов. Посетители площадки имеют возможность просматривать товары в удобном виде, ознакомляться с отзывами и совершать покупки.

Использование Яндекс.Маркета имеет множество плюсов. Во-первых, он имеет достаточно большую аудиторию и даже начинающие интернет-магазины смогут значительно увеличить свои продажи с ЯМ. Также, к положительным сторонам можно отнести:

Читать далее

https://habr.com/ru/post/706132/?utm_source=habrahabr&utm_medium=rss&utm_campaign=706132

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Поиск данных в инструментах Data Governance: вызовы и решения

Среда, 14 Декабря 2022 г. 11:29 (ссылка)

Добрый день!

Меня зовут Никита, я работаю ведущим системным аналитиком в Департаменте управления данными компании Ростелеком.

В данной статье я опишу наш опыт использования Реестра отчетов и Бизнес-глоссария, подводные камни, с которыми мы столкнулись, а также планы по оптимизации рабочих процессов в инструментах Data Governance (далее – DG).

Три года назад ИТ-команда Ростелекома разработала Реестр отчетов и Бизнес-глоссарий на базе Open-Source технологий, и данные модули впоследствии получили широкое распространение в периметре компании. Также была создана Единая точка входа, позволяющая сотрудникам получать быстрый доступ ко всем отчетам и бизнес-терминам, существующим в компании. За два года количество постоянных пользователей Единой точки входа увеличилось с 200 до 2300 человек, при этом количество уникальных посетителей Единой точки входа составляет порядка 400 пользователей еженедельно, и данная цифра постоянно растет.

Инструментарий для работы с данными покрывает значительный объем запросов Ростелекома в разрезе таких сегментов как B2B, B2C, БТИ и т.д. Подробнее можно прочитать здесь и здесь.

Департамент по управлению данными заинтересован не только в оптимизации процессов работы с данными во всей компании, но и в улучшении показателей пользовательского опыта в разрезе DG продуктов. Для этого необходимо модернизировать функционал существующих систем путем поиска точек роста и выпуска обновлений по их устранению. Искать точки роста мы решили при помощи интервьюирования пользователей и сбора обратной связи от них. По результатам были отрисованы карты пользовательских путей (cjm – "customer journey map") в разрезе DG инструментов, а также сформирован бэклог, описывающий основные зоны роста в части систем по управлению данными. В связи с этим, в скором времени планируется ряд обновлений с целью внедрения доработок и увеличения эффективности продуктов.

Читать далее

https://habr.com/ru/post/704870/?utm_source=habrahabr&utm_medium=rss&utm_campaign=704870

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[recovery mode] Пример использования API поиска Algolia на примере телеграм бота

Понедельник, 21 Ноября 2022 г. 22:11 (ссылка)

В данном примере разберем, как пользоваться API поиска в известеом поисковом сервисе Algolia.

Читать далее

https://habr.com/ru/post/700724/?utm_source=habrahabr&utm_medium=rss&utm_campaign=700724

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Децентрализованный поиск для свободного веба

Понедельник, 26 Сентября 2022 г. 20:53 (ссылка)

Возможно ли создать поисковую систему, которую тяжело подвергнуть цензуре, влиянию и блокировке?

Говоря техническим языком, возможно ли выполнять полнотекстовый поиск не имея удаленного сервера, удобным для пользователя способом, одновременно храня поисковый индекс в peer-to-peer системе и имея возможность быстро обновлять поисковый индекс?

Да, это возможно!

Под катом описание архитектуры поискового движка Summa на Rust и набора приемов, позволивших ответить утвердительно на все вопрос

Читать далее

https://habr.com/ru/post/690252/?utm_source=habrahabr&utm_medium=rss&utm_campaign=690252

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Способ представления числовых ключей для обратного поискового индекса

Среда, 21 Сентября 2022 г. 12:31 (ссылка)

Числа — совершенно особенная категория текстовых объектов. Они могут быть представлены разными способами: от зачастую многословного и не всегда согласованного между собой ряда убывающих числительных до записи арабскими или римскими цифрами, с разбивкой запятыми или точками, с пробелами или без них.

Не проще обстоят дела и с программным представлением таких объектов.

Читать далее

https://habr.com/ru/post/688230/?utm_source=habrahabr&utm_medium=rss&utm_campaign=688230

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

150+ хакерских поисковых систем и инструментов

Вторник, 20 Сентября 2022 г. 12:00 (ссылка)

Все таргетированные хакерские атаки начинаются с разведки. Социальные инженеры, красные команды и отдельные пентестеры также собирают информацию о своих целях перед тем, как перейти к активным действиям. Им помогают десятки инструментов и хаков. Под катом ссылки на некоторые из них.

Пост состоит из 8 объемных разделов:

1. метапоисковики и поисковые комбайны;

2. инструменты для работы с дорками;

3. поиск по электронной почте и логинам;

4. поиск по номерам телефонов;

5. поиск в сети TOR;

6. поиск по интернету вещей, IP, доменам и поддоменам;

7. поиск данных об уязвимостях и индикаторов компрометации;

8. поиск по исходному коду.

В этом списке собраны инструменты, которые члены нашей команды используют в работе. И все же, эта подборка пригодится не только пентестерам, но и разработчикам, журналистам, HR, маркетологам и всем, кто много ищет в интернете. Знания — это сила. Используйте их во благо.

Читать далее

https://habr.com/ru/post/688972/?utm_source=habrahabr&utm_medium=rss&utm_campaign=688972

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Часть 4. Ищем матчи в Dota 2 по названиям роликов на YouTube с помощью BERT и OpenDota

Пятница, 19 Августа 2022 г. 19:20 (ссылка)

Представьте, что с одной стороны у вас есть видео на YouTube с интересными моментами из матча по Dota 2. А с другой стороны база данных всех матчей. Как для видео найти соответствующую запись в БД? Этой задачей мы сегодня и займемся.

Читать далее

https://habr.com/ru/post/682480/?utm_source=habrahabr&utm_medium=rss&utm_campaign=682480

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<поисковые технологии - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda