|
rss_habr
Как жили наши предки 400 лет назад? Создание базы данных населения XVII века по южным уездам РоссииПонедельник, 30 Января 2023 г. 18:07 (ссылка)
Можно ли найти конкретного человека, жившего в XVII веке? Выражаясь современным языком «пробить по базам». Оказывается, архивные документы хранят массу информации об обычных людях того периода. Однако существует ряд сложностей, не позволяющих обычному исследователю добраться до этой информации. Во-первых, нужно пройти определённую процедуру по получению доступа в архив. Во-вторых, не всегда можно выйти на нужный документ, используя так называемый научно-справочный аппарат – различные описи и реестры документов, имеющиеся в архиве. Наконец, не имея навыков чтения документов XVII века, которые написаны скорописью, почти нереально ознакомиться с его содержанием. Данные проблемы предполагается решить с помощью создания базы данных служилых людей XVII века. Об этом небольшая история. Как всё начиналось. Привет! Меня зовут Дмитрий и вот уже более 10 лет я изучаю историю южных уездов России XVII века. Территориально – это современные Белгородская, а также соседние Воронежская, Курская, Липецкая и другие области. Населены они были тогда так называемыми служилыми людьми – они получали здесь в качестве служебного жалования земельные наделы, которые сами и обрабатывали. В XVIII веке их потомки стали однодворцами, а затем государственными крестьянами. Большая часть населения Курской, Воронежской и соседних губерний XIX века происходят из тех самых служилых людей XVI–XVII веков. Продолжим?https://habr.com/ru/post/713736/?utm_source=habrahabr&utm_medium=rss&utm_campaign=713736
rss_habr
Neo4j. Вместо тысячи join-ов…Четверг, 19 Января 2023 г. 17:05 (ссылка)
Если вы столкнулись с задачей хранения сильно связанных данных, то отличным вариантом будет использовать графовую модель данных. Мы в Текфорс сделали именно так. Почему - разберем в этой статье. Читать далееhttps://habr.com/ru/post/711646/?utm_source=habrahabr&utm_medium=rss&utm_campaign=711646
rss_habr
Boson — разработка СУБД «с нуля» (часть I)Воскресенье, 01 Января 2023 г. 06:47 (ссылка)
После разработки виртуальной машины и компилятора в рамках хобби прошел год и захотелось попробовать реализовать ёмкий по алгоритмам проект по системному программированию. Каждый разработчик "кровавого" enterprise в своей работе использует СУБД (SQL/NoSQL) и меня всегда искренне интересовало как они устроены в самом сердце, на самом низком уровне. Почитав документацию и исходный код SQLite и MongoDB, про используемые в индексах и интерпретаторах запросов алгоритмы, осознал, что несмотря на широкую распространенность и некую привычность, системы управления базами данных (СУБД) - это сложные программные продукты, реализация которых не всем под силу. Отлично - как раз то, что мне надо. С мотивацией разобрались, перейдем к делу. Итак, для начала хорошо бы сформулировать высокоуровневую спецификацию требований. Boson - это легкая, встраиваемая документоориентированная база данных на С/С++ Читать далееhttps://habr.com/ru/post/708768/?utm_source=habrahabr&utm_medium=rss&utm_campaign=708768
rss_habr
Postgresso 12 (49)Суббота, 31 Декабря 2022 г. 13:59 (ссылка)
В этом, 12-м номере мы собрали интересные ссылки со всех Постгрессо, начиная с январского. Читать далееhttps://habr.com/ru/post/707670/?utm_source=habrahabr&utm_medium=rss&utm_campaign=707670
rss_habr
Об инновациях. Или Neo4J на страже TelcoПонедельник, 26 Декабря 2022 г. 19:19 (ссылка)
Всем добрый день. В своей предыдущей статье я уже упомянул о разрабатываемой нами системе, которая решает, казалось бы, не решаемую задачу - а именно автодискавери сетевых элементов в сетях телеком операторов, построение топологий, поиск путей прохождения трафика на основе информации, полученной из самих сетевых элементов. При этом стоит уточнить, что система не нуждается в интеграции со сторонними системами управления, такими как NCE (бывший Huawei u2000 TN), SoEM (СУ Ericsson), Aviat Provision, NFM-P (Nokia), и любыми другими. Т.е. система самодостаточна и способна работать в полностью автономном режиме. Начну с той проблемы, которая возникла много десятилетий тому назад - и название этой проблемы - актуальная информация о состоянии сетей в режиме он-лайн. Дело в том, что мультисервисные сети давно стали мультивендорными - т.е. в каком-то филиале N любого провайдера связи, с течением времени скопилось множество разновендорного оборудования - сети MEN построены на Cisco, Huawei, Nokia. РРЛ - NEC, Huawei, Nokia и т.д. до бесконечности и в разных последовательностях. И т.к. каждый вендор не стремится создать универсальную СУ, которая могла хотя бы нарисовать топологию мультивендорной сети, приходится изобретать велосипед раз за разом. Чаще всего велосипеды получались не далеко едущими, одноколесными, неудобными, без сидения или колес. Даже в системах управления крупных вендоров, функциональность не блистала. Более менее вменяемое я увидел в СУ Huawei - NCE. Но опять таки - каждый домен типов оборудования на своих вкладках, и единую топологию не получить - т.е. нельзя отобразить единовременно и на одной подложке сеть MBH (MEN+RRL). Не говоря уже о единовременном отображении специфических проблем, за которыми следят операторы связи - высокая утилизация интерфейсов, BBE/ES/SES/UAS, FCS, RSL Low, QoS Drop по очередям и пр. Читать далееhttps://habr.com/ru/post/707800/?utm_source=habrahabr&utm_medium=rss&utm_campaign=707800
rss_habr
Миллион записей для змеиСуббота, 18 Декабря 2022 г. 03:01 (ссылка)
Загрузить миллион записей в питон за секунду? У меня есть небольшое хобби - я экспериментирую с машинным обучением применительно к торговле на бирже, в частности, с криптовалютами. После различных наколенных экспериментов я захотел создать удобный инструмент - базу торговых котировок. В процессе работы необходима быстрая загрузка достаточно большого количества данных. Это необходимо для расчетов, генерации данных для обучения, бэк-тестинга и других задач. Количество записей, которые нужно загрузить в питон довольно велико - речь может идти о миллионах и более записей. Читать далееhttps://habr.com/ru/post/706074/?utm_source=habrahabr&utm_medium=rss&utm_campaign=706074
rss_habr
Автоматизируем Telegram-канал с AWS Lambda и DynamoDBПятница, 16 Декабря 2022 г. 17:34 (ссылка)
В этом материале вы узнаете, как создать Telegram-канал, который будет сам обновляться, получая данные из открытых источников. Используем Python, AWS Lambda, DynamoDB и BeautifulSoup. Читать далееhttps://habr.com/ru/post/706020/?utm_source=habrahabr&utm_medium=rss&utm_campaign=706020
rss_habr
[Перевод] CAP двенадцать лет спустя: как изменились «правила»Пятница, 25 Ноября 2022 г. 17:01 (ссылка)
Эта статья впервые появилась в журнале Computer и подготовлена InfoQ & IEEE Computer Society. Теорема CAP гласит, что любая сетевая система с общими данными может иметь только два из трех желаемых свойств. Однако, работая непосредственно с разделениями, разработчики могут оптимизировать согласованность и доступность, тем самым достигая некоторого компромисса между всеми тремя. За десятилетие, прошедшее с появления теоремы, разработчики и исследователи использовали теорему CAP (а иногда и злоупотребляли ею) как повод для изучения широкого спектра новых распределенных систем. Движение NoSQL также использовало её в качестве аргумента против традиционных баз данных. В теореме CAP говорится, что любая сетевая система с общими данными может иметь не более двух из трех желаемых свойств:
Такое толкование CAP помогало разработчикам быть открытыми для более широкого диапазона систем и компромиссов; действительно, за последнее десятилетие возникло множество новых систем и много споров об относительных достоинствах согласованности и доступности. Формулировка «2 из 3» всегда вводила в заблуждение, поскольку имела тенденцию чрезмерно упрощать противоречия между свойствами. Но сейчас такие тонкости имеют значение. CAP запрещает лишь крошечную часть проектного пространства: идеальная доступность и согласованность при наличии разделений, которые встречаются редко. Читать дальше →https://habr.com/ru/post/701492/?utm_source=habrahabr&utm_medium=rss&utm_campaign=701492
rss_habr
Apache Cassandra: механизмы репликации и поддержания согласованностиВоскресенье, 14 Ноября 2022 г. 00:00 (ссылка)
Apache Cassandra - это распределенная NoSQL база данных. В этой статье будут описаны основные механизмы передачи, репликации и поддержания согласованности данных внутри сети. Читать далееhttps://habr.com/ru/post/699104/?utm_source=habrahabr&utm_medium=rss&utm_campaign=699104
rss_habr
Apache Cassandra: механизмы репликации и поддержания согласованностиВоскресенье, 14 Ноября 2022 г. 00:00 (ссылка)
Apache Cassandra - это распределенная NoSQL база данных. В этой статье будут описаны основные механизмы передачи, репликации и поддержания согласованности данных внутри сети. Читать далееhttps://habr.com/ru/post/699104/?utm_source=habrahabr&utm_medium=rss&utm_campaign=699104
rss_habr
[Перевод] Как ускорить базу данных при помощи шардированияСреда, 02 Ноября 2022 г. 11:31 (ссылка)
https://habr.com/ru/post/696784/?utm_source=habrahabr&utm_medium=rss&utm_campaign=696784
|
LiveInternet.Ru |
Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат О проекте: помощь|контакты|разместить рекламу|версия для pda |