Что такое база данных

62

База данных – это упорядоченный набор структурированной информации или данных, которые обычно хранятся в электронном виде в компьютерной системе. База данных обычно управляется системой управления базами данных (СУБД). Данные вместе с СУБД, а также приложения, которые с ними связаны, называются системой баз данных, или, для краткости, просто базой данных. Узнайте больше о базах данных на ПингвинКапитал.

Что такое база данных

База данных – это упорядоченный набор структурированной информации или данных, которые обычно хранятся в электронном виде в компьютерной системе. База данных обычно управляется системой управления базами данных (СУБД). Данные вместе с СУБД, а также приложения, которые с ними связаны, называются системой баз данных, или, для краткости, просто базой данных.

Данные в наиболее распространенных типах современных баз данных обычно хранятся в виде строк и столбцов, формирующих таблицу. Этими данными можно легко управлять, изменять, обновлять, контролировать и упорядочивать. В большинстве баз данных для записи и запросов данных используется язык структурированных запросов (SQL).

Определение базы данных

База данных – совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных. Многие специалисты указывают на распространенную ошибку, состоящую в некорректном использовании термина "база данных" вместо термина "система управления базами данных", и указывают на необходимость различения этих понятий.

Проблемы определения

В литературе предлагается множество определений понятия "база данных", отражающих скорее субъективное мнение тех или иных авторов, однако общепризнанная единая формулировка отсутствует. Определения из нормативных документов, в том числе стандартов, и определения из авторитетных монографий предлагают различные подходы к определению базы данных.

В определениях наиболее часто присутствуют следующие отличительные признаки:

  1. Совокупность данных, хранимых в соответствии со схемой данных.
  2. Манипулирование данными в соответствии с правилами средств моделирования данных.

Из перечисленных признаков только первый является строгим, а другие допускают различные трактовки и различные степени оценки. В соответствии с общепринятой практикой, не называют базами данных файловые архивы, интернет-порталы или электронные таблицы, несмотря на то, что они в некоторой степени обладают признаками базы данных.

История баз данных

История возникновения и развития технологий баз данных рассматривается как в широком, так и в узком аспекте.

В широком смысле понятие истории баз данных обобщается до истории любых средств, с помощью которых человечество хранило и обрабатывало данные. В таком контексте упоминаются различные средства учета, хранения и обработки данных, используемые в разные эпохи и культурах, например, учет царской казны и налогов в древнем Шумере, узелковая письменность инков, клинопись, содержащая документы Ассирийского царства и т.д.

История баз данных в узком смысле рассматривает базы данных в традиционном (современном) понимании. Эта история начинается с 1955 года, когда появилось программируемое оборудование обработки записей. Программное обеспечение этого времени поддерживало модель обработки записей на основе файлов и использовало перфокарты для хранения данных.

Свойства базы данных

Из определения базы данных следует, что в ней:

  • Содержится упорядоченный набор структурированной информации или данных.
  • Данные хранятся в электронном виде в компьютерной системе.
  • Управление базой данных осуществляется при помощи системы управления базами данных (СУБД).
  • База данных может включать приложения, связанные с данными.

Важной характерной чертой базы данных является ее постоянство. Оно проявляется в нескольких контекстах:

  1. Постоянство данных в базе данных – данные сохраняются длительное время и доступны для последующей обработки и использования.
  2. Постоянство структуры базы данных – схема данных определяет структуру и организацию данных.
  3. Постоянство программного обеспечения – СУБД и связанные с ней приложения обеспечивают стабильность работы с данными.

Отличия баз данных от электронных таблиц

Электронные таблицы и базы данных имеют некоторые сходства, но также и отличия. Важно понимать эти различия, чтобы выбрать наиболее подходящее решение для управления и обработки данных.

Электронные таблицы изначально создавались как однопользовательские инструменты, предназначенные для ограниченного объема данных и простых вычислений. Базы данных же предназначены для работы с большим объемом упорядоченной информации и множества пользователей, которые могут одновременно вносить изменения в данные.

Также электронные таблицы и базы данных используют различные модели данных. В электронных таблицах данные организованы в виде ячеек, строки и столбцы, а в базах данных данные хранятся в виде таблиц и связей между ними.

Типы баз данных

Существует множество критериев определения видов баз данных:

  • Форма представления информации.
  • Тип используемой модели данных.
  • Топология хранения данных.

В зависимости от формы представления информации, базы данных могут быть текстовыми, графическими, мультимедийными и другими.

По типу модели данных, базы данных могут быть реляционными, иерархическими, сетевыми, объектно-ориентированными и др.

Топология хранения данных определяет, как данные физически организованы на диске или в памяти компьютера. Базы данных могут быть централизованными или распределенными.

Популярные системы управления базами данных

Система управления базами данных (СУБД) – это программное обеспечение, которое необходимо для создания, редактирования и обслуживания файлов баз данных. С помощью СУБД можно упростить процесс работы с данными – от ввода данных до отчетности. СУБД также позволяет выполнять резервное копирование, обеспечивать безопасность и предоставлять общий доступ к базе данных.

Наиболее популярные системы управления базами данных включают:

  • MySQL.
  • Oracle Database.
  • Microsoft SQL Server.
  • PostgreSQL.
  • SQLite.

Эти СУБД предоставляют мощные инструменты для работы с данными и широко используются в различных сферах деятельности.

Что такое База Данных (БД) / Хабр
Источник изображения: habr.com

Что нам скажет Википедия?

Ба́за да́нных — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных.

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

Проблемы определения

В литературе предлагается множество определений понятия «база данных», отражающих скорее субъективное мнение тех или иных авторов, однако общепризнанная единая формулировка отсутствует.

Определения из нормативных документов, в том числе стандартов:

  • Определения из авторитетных монографий:

В определениях наиболее часто (явно или неявно) присутствуют следующие отличительные признаки:

  • Из перечисленных признаков только первый является строгим, а другие допускают различные трактовки и различные степени оценки. Можно лишь установить некоторую степень соответствия требованиям к БД.

В такой ситуации не последнюю роль играет общепринятая практика. В соответствии с ней, например, не называют базами данных файловые архивы, Интернет-порталы или электронные таблицы, несмотря на то, что они в некоторой степени обладают признаками БД. Принято считать, что эта степень в большинстве случаев недостаточна (хотя могут быть исключения).

История

История возникновения и развития технологий баз данных может рассматриваться как в широком, так и в узком аспекте.

В широком смысле понятие истории баз данных обобщается до истории любых средств, с помощью которых человечество хранило и обрабатывало данные. В таком контексте упоминаются, например, средства учёта царской казны и налогов в древнем Шумере (4-e тысячелетие до н.э.), узелковая письменность инков — кипу, клинописи, содержащие документы Ассирийского царства и т. п. Следует помнить, что недостатком этого подхода является размывание понятия «база данных» и фактическое его слияние с понятиями «архив» и даже «письменность».

История баз данных в узком смысле рассматривает базы данных в традиционном (современном) понимании. Эта история начинается с 1955 года, когда появилось программируемое оборудование обработки записей. Программное обеспечение этого времени поддерживало модель обработки записей на основе файлов. Для хранения данных использовались перфокарты.

Оперативные сетевые базы данных появились в середине 1960-х. Операции над оперативными базами данных обрабатывались в интерактивном режиме с помощью терминалов. Простые индексно-последовательные организации записей быстро развились к более мощной модели записей, ориентированной на наборы. За руководство работой Data Base Task Group (DBTG), разработавшей стандартный язык описания данных и манипулирования данными, Чарльз Бахман получил Тьюринговскую премию.

В это же время в сообществе баз данных Кобол была проработана концепция схем баз данных и концепция независимости данных.

Следующий важный этап связан с появлением в начале 1970-х реляционной модели данных, благодаря работам Эдгара Кодда.

Работы Кодда открыли путь к тесной связи прикладной технологии баз данных с математикой и логикой. За свой вклад в теорию и практику Эдгар Ф. Кодд также получил премию Тьюринга.

Сам термин база данных (англ. database) появился в начале 1960-х годов, и был введён в употребление на симпозиумах, организованных компанией SDC в 1964 и 1965 годах, хотя понимался сначала в довольно узком смысле, в контексте систем искусственного интеллекта. В широкое употребление в современном понимании термин вошёл лишь в 1970-е годы.

Виды баз данных

Существует огромное количество разновидностей баз данных, различающихся по различным критериям. Например, в «Энциклопедии технологий баз данных», по материалам которой написан данный раздел, определяются свыше 50 видов БД.

В классификацию по модели данных обычно включают:

  • Классификация по среде хранения различает базы данных, хранящие данные во вторичной памяти («традиционные», англ. conventional database), резидентные (все данные на стадии исполнения находятся в оперативной памяти) и третичные (англ. tertiary database), хранящие данные на отсоединяемых устройствах массового хранения — на основе магнитных лент или оптических дисков. При этом во всех классах так или иначе используются все среды хранения, например, для резидентных баз данных СУБД записывает в постоянную память журналы предзаписи, а для традиционных баз используется кэш в оперативной памяти.

Также базы данных могут классифицироваться по содержимому, например, могут быть географическими, историческими, научными, мультимедийными. Для некоторых форм содержания строятся специализированные СУБД, либо добавляются специализированные возможности в СУБД общего назначения, среди таковых баз данных:

  • По степени распределённости базы данных подразделяются на следующие классы:

Среди распределённых баз данных выделяют:

Возможны смешанные варианты, например, для одной и той же распределённой базы для больших объектов используется сегментирование, а для небольших — репликация.

По способам организации хранения могут выделяться циклические базы данных (записывают новые данные вместо устаревших), потоковые базы данных.

Сверхбольшие базы данных

Сверхбольшая база данных (англ. Very Large Database, VLDB) — это база данных, которая занимает чрезвычайно большой объём на устройстве физического хранения. Термин подразумевает максимально возможные объёмы БД, которые определяются последними достижениями в технологиях физического хранения данных и в технологиях программного оперирования данными.

Количественное определение понятия «чрезвычайно большой объём» меняется во времени. Так, в 1997 году самой большой в мире была текстовая база данных Knight Ridder’s DIALOG объёмом 7 терабайт. В 2001 году самой большой считалась база данных объёмом 10,5 терабайт, в 2003 году — объёмом 25 терабайт. В 2005 году самыми крупными в мире считались базы данных с объёмом хранилища порядка сотни терабайт. В 2006 году поисковая машина Google использовала базу данных объёмом 850 терабайт.

К 2010 году считалось, что объём сверхбольшой базы данных должен измеряться по меньшей мере петабайтами.

В 2011 году компания Facebook хранила данные в кластере из 2 тысяч узлов суммарной ёмкостью 21 петабайт; к концу 2012 года объём данных Facebook достиг 100 петабайт, а в 2014 году — 300 петабайт.

К 2014 году по косвенным оценкам компания Google хранила на своих серверах до 10—15 эксабайт данных в совокупности.

По некоторым оценкам, к 2025 году генетики будут располагать данными о геномах от 100 миллионов до 2 миллиардов человек, и для хранения подобного объёма данных потребуется от 2 до 40 эксабайт.

В целом, по оценкам компании IDC в 2018 году, суммарный объём данных «цифровой вселенной» удваивается каждые два года и изменится от 4,4 зеттабайта в 2013 году до 44 зеттабайт в 2020 году.

Исследования в области хранения и обработки сверхбольших баз данных VLDB всегда находятся на острие теории и практики баз данных. В частности, с 1975 года проходит ежегодная конференция International Conference on Very Large Data Bases («Международная конференция по сверхбольшим базам данных»). Большинство исследований проводится под эгидой некоммерческой организации VLDB Endowment (Фонд целевого капитала «VLDB»), которая обеспечивает продвижение научных работ и обмен информацией в области сверхбольших БД и смежных областях.

См. также

Примечания

Литература

Ссылки

Видео

Что такое база данных [основные понятия]

Что такое база данных

Что такое База Данных? - простыми словами Практическое Программирование

Что такое база данных?

Что такое база данных (БД)

Что такое базы данных, СУБД и язык SQL

Что такое база данных веб саита и зачем это нужно

УРОК 13. Понятие базы данных. Система управления базами данных (10 класс)