Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 1317 сообщений
Cообщения с меткой

nosql - Самое интересное в блогах

Следующие 30  »
rss_habr

Как жили наши предки 400 лет назад? Создание базы данных населения XVII века по южным уездам России

Понедельник, 30 Января 2023 г. 18:07 (ссылка)

Можно ли найти конкретного человека, жившего в XVII веке? Выражаясь современным языком «пробить по базам». Оказывается, архивные документы хранят массу информации об обычных людях того периода. Однако существует ряд сложностей, не позволяющих обычному исследователю добраться до этой информации. Во-первых, нужно пройти определённую процедуру по получению доступа в архив. Во-вторых, не всегда можно выйти на нужный документ, используя так называемый научно-справочный аппарат – различные описи и реестры документов, имеющиеся в архиве. Наконец, не имея навыков чтения документов XVII века, которые написаны скорописью, почти нереально ознакомиться с его содержанием.

Данные проблемы предполагается решить с помощью создания базы данных служилых людей XVII века. Об этом небольшая история.

Как всё начиналось.

Привет! Меня зовут Дмитрий и вот уже более 10 лет я изучаю историю южных уездов России XVII века. Территориально – это современные Белгородская, а также соседние Воронежская, Курская, Липецкая и другие области. Населены они были тогда так называемыми служилыми людьми – они получали здесь в качестве служебного жалования земельные наделы, которые сами и обрабатывали. В XVIII веке их потомки стали однодворцами, а затем государственными крестьянами. Большая часть населения Курской, Воронежской и соседних губерний XIX века происходят из тех самых служилых людей XVI–XVII веков.

Продолжим?

https://habr.com/ru/post/713736/?utm_source=habrahabr&utm_medium=rss&utm_campaign=713736

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Neo4j. Вместо тысячи join-ов…

Четверг, 19 Января 2023 г. 17:05 (ссылка)

Если вы столкнулись с задачей хранения сильно связанных данных, то отличным вариантом будет использовать графовую модель данных. Мы в Текфорс сделали именно так. Почему - разберем в этой статье.

Читать далее

https://habr.com/ru/post/711646/?utm_source=habrahabr&utm_medium=rss&utm_campaign=711646

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Boson — разработка СУБД «с нуля» (часть I)

Воскресенье, 01 Января 2023 г. 06:47 (ссылка)

После разработки виртуальной машины и компилятора в рамках хобби прошел год и захотелось попробовать реализовать ёмкий по алгоритмам проект по системному программированию.

Каждый разработчик "кровавого" enterprise в своей работе использует СУБД (SQL/NoSQL) и меня всегда искренне интересовало как они устроены в самом сердце, на самом низком уровне. Почитав документацию и исходный код SQLite и MongoDB, про используемые в индексах и интерпретаторах запросов алгоритмы, осознал, что несмотря на широкую распространенность и некую привычность, системы управления базами данных (СУБД) - это сложные программные продукты, реализация которых не всем под силу. Отлично - как раз то, что мне надо. С мотивацией разобрались, перейдем к делу.

Итак, для начала хорошо бы сформулировать высокоуровневую спецификацию требований. Boson - это легкая, встраиваемая документоориентированная база данных на С/С++

Читать далее

https://habr.com/ru/post/708768/?utm_source=habrahabr&utm_medium=rss&utm_campaign=708768

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Postgresso 12 (49)

Суббота, 31 Декабря 2022 г. 13:59 (ссылка)

В этом, 12-м номере мы собрали интересные ссылки со всех Постгрессо, начиная с январского.

Читать далее

https://habr.com/ru/post/707670/?utm_source=habrahabr&utm_medium=rss&utm_campaign=707670

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Об инновациях. Или Neo4J на страже Telco

Понедельник, 26 Декабря 2022 г. 19:19 (ссылка)

Всем добрый день.

В своей предыдущей статье я уже упомянул о разрабатываемой нами системе, которая решает, казалось бы, не решаемую задачу - а именно автодискавери сетевых элементов в сетях телеком операторов, построение топологий, поиск путей прохождения трафика на основе информации, полученной из самих сетевых элементов. При этом стоит уточнить, что система не нуждается в интеграции со сторонними системами управления, такими как NCE (бывший Huawei u2000 TN), SoEM (СУ Ericsson), Aviat Provision, NFM-P (Nokia), и любыми другими. Т.е. система самодостаточна и способна работать в полностью автономном режиме.

Начну с той проблемы, которая возникла много десятилетий тому назад - и название этой проблемы - актуальная информация о состоянии сетей в режиме он-лайн. Дело в том, что мультисервисные сети давно стали мультивендорными - т.е. в каком-то филиале N любого провайдера связи, с течением времени скопилось множество разновендорного оборудования - сети MEN построены на Cisco, Huawei, Nokia. РРЛ - NEC, Huawei, Nokia и т.д. до бесконечности и в разных последовательностях. И т.к. каждый вендор не стремится создать универсальную СУ, которая могла хотя бы нарисовать топологию мультивендорной сети, приходится изобретать велосипед раз за разом.

Чаще всего велосипеды получались не далеко едущими, одноколесными, неудобными, без сидения или колес. Даже в системах управления крупных вендоров, функциональность не блистала. Более менее вменяемое я увидел в СУ Huawei - NCE. Но опять таки - каждый домен типов оборудования на своих вкладках, и единую топологию не получить - т.е. нельзя отобразить единовременно и на одной подложке сеть MBH (MEN+RRL). Не говоря уже о единовременном отображении специфических проблем, за которыми следят операторы связи - высокая утилизация интерфейсов, BBE/ES/SES/UAS, FCS, RSL Low, QoS Drop по очередям и пр.

Читать далее

https://habr.com/ru/post/707800/?utm_source=habrahabr&utm_medium=rss&utm_campaign=707800

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Миллион записей для змеи

Суббота, 18 Декабря 2022 г. 03:01 (ссылка)

Загрузить миллион записей в питон за секунду?
Нет. Получилось еще быстрее!

У меня есть небольшое хобби - я экспериментирую с машинным обучением применительно к торговле на бирже, в частности, с криптовалютами. После различных наколенных экспериментов я захотел создать удобный инструмент - базу торговых котировок. В процессе работы необходима быстрая загрузка достаточно большого количества данных. Это необходимо для расчетов, генерации данных для обучения, бэк-тестинга и других задач. Количество записей, которые нужно загрузить в питон довольно велико - речь может идти о миллионах и более записей.

Читать далее

https://habr.com/ru/post/706074/?utm_source=habrahabr&utm_medium=rss&utm_campaign=706074

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Автоматизируем Telegram-канал с AWS Lambda и DynamoDB

Пятница, 16 Декабря 2022 г. 17:34 (ссылка)

В этом материале вы узнаете, как создать Telegram-канал, который будет сам обновляться, получая данные из открытых источников. Используем Python, AWS Lambda, DynamoDB и BeautifulSoup.

Читать далее

https://habr.com/ru/post/706020/?utm_source=habrahabr&utm_medium=rss&utm_campaign=706020

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] CAP двенадцать лет спустя: как изменились «правила»

Пятница, 25 Ноября 2022 г. 17:01 (ссылка)



Эта статья впервые появилась в журнале Computer и подготовлена InfoQ & IEEE Computer Society.



Теорема CAP гласит, что любая сетевая система с общими данными может иметь только два из трех желаемых свойств. Однако, работая непосредственно с разделениями, разработчики могут оптимизировать согласованность и доступность, тем самым достигая некоторого компромисса между всеми тремя.



За десятилетие, прошедшее с появления теоремы, разработчики и исследователи использовали теорему CAP (а иногда и злоупотребляли ею) как повод для изучения широкого спектра новых распределенных систем. Движение NoSQL также использовало её в качестве аргумента против традиционных баз данных.



В теореме CAP говорится, что любая сетевая система с общими данными может иметь не более двух из трех желаемых свойств:




  • согласованность (С), эквивалентная наличию единственной актуальной копии данных;

  • высокая доступность (A) этих данных (для обновлений); и

  • устойчивость к сетевым разделениям (P).



Такое толкование CAP помогало разработчикам быть открытыми для более широкого диапазона систем и компромиссов; действительно, за последнее десятилетие возникло множество новых систем и много споров об относительных достоинствах согласованности и доступности. Формулировка «2 из 3» всегда вводила в заблуждение, поскольку имела тенденцию чрезмерно упрощать противоречия между свойствами. Но сейчас такие тонкости имеют значение. CAP запрещает лишь крошечную часть проектного пространства: идеальная доступность и согласованность при наличии разделений, которые встречаются редко.

Читать дальше →

https://habr.com/ru/post/701492/?utm_source=habrahabr&utm_medium=rss&utm_campaign=701492

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Apache Cassandra: механизмы репликации и поддержания согласованности

Воскресенье, 14 Ноября 2022 г. 00:00 (ссылка)

Apache Cassandra - это распределенная NoSQL база данных. В этой статье будут описаны основные механизмы передачи, репликации и поддержания согласованности данных внутри сети.

Читать далее

https://habr.com/ru/post/699104/?utm_source=habrahabr&utm_medium=rss&utm_campaign=699104

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Apache Cassandra: механизмы репликации и поддержания согласованности

Воскресенье, 14 Ноября 2022 г. 00:00 (ссылка)

Apache Cassandra - это распределенная NoSQL база данных. В этой статье будут описаны основные механизмы передачи, репликации и поддержания согласованности данных внутри сети.

Читать далее

https://habr.com/ru/post/699104/?utm_source=habrahabr&utm_medium=rss&utm_campaign=699104

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Как ускорить базу данных при помощи шардирования

Среда, 02 Ноября 2022 г. 11:31 (ссылка)

image



Шардирование было одним из первых механизмов, позволяющих распределять базы данных для повышения их производительности. Последние инновации превратили шардирование в один из лучших механизмов в своем роде.



Сегодня базам данных уделяется особое внимание, так как через них компания управляет своим самым ценным архивом: информацией. Всего 30 лет назад большинство данных хранилось на бумаге, магнитной ленте или каких-либо дисках. Поскольку мы производили и потребляли гораздо меньше данных на душу населения, даже на таких носителях нам удавалось эффективно хранить их, управлять ими и обращаться к ним.



Но сегодня с данными складывается совершенно иная ситуация. Смартфоны распространились повсеместно и превратились в необходимую вещь. Вместе со смартфонами увеличилось количество мобильных приложений, и сегодня через них производятся и потребляются такие объемы данных, какие были просто немыслимы 15 лет назад. В такой ситуации серьезно возрастает нагрузка на кластеры баз данных, поскольку им приходится обрабатывать все более серьезные объемы трафика. Некоторые из топовых веб-сайтов и веб-сервисов обрабатывают миллиарды посещений в неделю.



Как справиться с таким невероятным объемом трафика, поступающим в кластер базы данных?

Можно попробовать шардирование. Возможно, вы никогда и не слышали о таком подходе, либо по-быстрому отбраковывали его как старомодное решение, не отвечающее современным вызовам. Сам феномен «шардирования баз данных» едва ли сулит полный набор примочек, какими могли бы похвастаться другие решения, но этот подход определенно эффективен и практичен.
Читать дальше →

https://habr.com/ru/post/696784/?utm_source=habrahabr&utm_medium=rss&utm_campaign=696784

Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<nosql - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda