База даних (database) – це сукупність описів об’єктів реального світу, певним чином структурованих та пов’язаних між собою, актуальних для конкретної прикладної області та представлених на машиночитаних носіях у формі, придатній для застосування в інформаційних технологіях.
База даних – організована відповідно до певних правил і підтримувана в пам’яті комп’ютера сукупність даних, що характеризує актуальний стан деякої предметної області та використовується для задоволення інформаційних потреб користувачів.
Організація даних у базі даних вимагає попереднього вибору та побудови моделі даних, призначення якої – систематизація інформації та відображення її властивостей (за змістом, структурою, обсягом, зв’язками, динамікою, джерелами тощо).
База даних характеризується такими відмітними ознаками:
- База даних зберігається та обробляється в обчислювальній системі. Отже, будь-які позакомп’ютерні сховища інформації (архіви, бібліотеки, картотеки тощо) базами даних є.
- Дані в базі даних логічно структуровані (систематизовані) з метою забезпечення можливості їх ефективного пошуку та обробки обчислювальної системи. Структурованість має на увазі явне виділення складових частин (елементів), зв’язків між ними, а також типізацію елементів та зв’язків, при якій з типом елемента (зв’язку) співвідноситься певна семантика та допустимі операції.
- База даних включає схему, або метадані, що описують логічну структуру бази даних у формальному вигляді (відповідно до деякої метамоделі). Зокрема, постійні дані в середовищі бази даних включають схему і базу даних. Схема включає описи змісту, структури та обмежень цілісності, що використовуються для створення і підтримки бази даних. База даних включає набір постійних даних, визначених за допомогою схеми. Система управління даними використовує визначення даних у схемі для забезпечення доступу та управління доступом до даних у базі даних.
Бази даних нерозривно пов’язані з усіма інформаційними ресурсами суспільства, створюються на їх основі, а багато з них можуть використовуватися тільки разом з документальними джерелами інформації. p align=”justify”> Інформаційні ресурси розглядаються як важлива частина національних ресурсів, а проблеми їх розвитку – як частина загальних проблем інформатизації суспільства. Побудова такої моделі здійснюється в кілька етапів з послідовним наближенням до оптимального варіанту, який найбільш адекватно відображає предметну область, що моделюється.
Для створення бази даних насамперед визначають об’єкти, що цікавлять (наприклад, постачальники, споживачі, підприємства, працівники та ін), а потім виділяють для кожного об’єкта набір характеризуючих його властивостей – мінімально можливу смислову одиницю («реквізит»). Наприклад, властивостями підприємства можуть бути: його назва, адреса, розрахунковий рахунок у банку, тип продукції і т.п.
Об’єкти реального світу, відомості про які зберігаються у базі даних, називають «сутностями», які актуальні ознаки – «атрибутами». Питання інформаційному змісті бази даних вирішується як шляхом визначення предметної області, а й з урахуванням інтенсивності роботи з різними видами інформації, їх динамічними характеристиками, частотою коригувань, ступенем їх взаємозв’язку.
Як правило, користувач цікавиться не всією інформацією, що міститься в базі даних, тому необхідно забезпечити можливість виділення окремої частини (підмоделі, локальної моделі). Структура організації даних у базі даних повинна враховувати зв’язок між різними видами даних та забезпечувати швидкий доступ до них.
Існує три основні типи логічної організації даних:
- ієрархічна модель (має структуру як графа і висловлює лише вертикальні зв’язку типу підпорядкування нижнього рівня верхнему);
- мережева модель (представляється у вигляді графа загального виду, де присутні горизонтальні та зворотні зв’язки);
- реляційна модель (Сукупність таблиць, званих «відносинами», над якими виконуються операції, що формулюються в термінах реляційної алгебри, для реалізації автоматизованої відповіді на запити користувачів системи).
Найбільшого поширення нині мають реляційні бази даних. Різновид реляційної моделі – постріляційна модель данихщо дозволяє будувати високоефективні інформаційні системи, щоб забезпечити одночасний доступом до інформації великому числу користувачів.
За видом даних виділяють бази даних:
- документографічні (документальні) з підрозділом їх на бібліографічні та реферативні;
- фактографічні;
- числові;
- повнотекстові;
- лексикографічні;
- змішані (гібридні).
За призначенням інформації розрізняють бази даних:
- ділової інформації (соціальна інформація, кадастри, регістри, статистична, комерційна, фінансова, управлінська інформація; дані про продукцію тощо);
- інформації для спеціалістів (науково-технічна, економічна, маркетингова, правоохоронна, дослідницька, виробнича, конструкторська, технологічна інформація тощо);
- масової інформації (правова, бібліотечно-бібліографічна, архівна, навчальна, довідкова, суспільно-політична, словниково-енциклопедична інформація, інформація про культуру, спорт, дозвілля тощо).
За способом доступу бази даних поділяють на:
- розміщені на хостузлах (доступні через обчислювальні мережі);
- тиражовані у комунікативних форматах;
- тиражовані програмними засобами (включаючи CD-ROM);
- локальні.
Стандартні форми баз даних доповнюються сьогодні мультимедійними документами, графічними образами, хронологічними рядами, процедурними чи активними даними та іншими складними інформаційними формами.
Джерела на формування баз даних – первинні документи: технічна документація, звіти, форми статистичної звітності, спеціальні журнали, монографії, аналітичні огляди, інформаційні листки, матеріали конференцій, виставок, проспекти видань та послуг тощо. Все більше використовуються також вторинні джерела інформації: ЗМІ (статті з газет та журналів, реферати, ліцензії, каталоги вітчизняних та зарубіжних фірм, теле- та радіоінформація, рекламні оголошення, адресні та спеціалізовані довідники, реєстраційні картки, публіковані баланси підприємств та банків, листи, анкети, паспорти підприємств, статистичні публікації, договори, прейскуранти тощо).
Найважливіші характеристики бази даних – тематичний склад (база даних законодавчої інформації, інформації про персоналії, адресно-довідкові, комерційні інформації тощо); повнота інформаційних ресурсів (охоплення різних тематичних предметних областей (наявність прогалин) та повнота їх відображення в оригінальних базах даних, а також міра задоволення відповідних користувачів пропонованими формами та режимами надання інформації).
БД повинна відображати об’єкти реального світу однозначно і несуперечливо (умова цілісності бази даних – database integrity). Для підтримки інформаційної бази у робочому стані застосовують комплекс програмних та мовних засобів – систему управління базою даних (СУБД).
СУБД – це пакет програм, що забезпечує введення, зберігання, коригування, збереження та переміщення даних, формування відповідей на запити, зв’язок з іншими програмними засобами. Сукупність однієї або декількох баз даних, довідника бази даних, СУБД, бібліотеки запитів та прикладних програм називають банком даних (Англ. Databank).
Вибір керуючих програм визначається типом логічної моделі, наявними програмними та технічними засобами. Основні критерії вибору СУБД: мінімізація складності освоєння системи, її застосування та використання; якість технічної документації та рівень супроводу.
Зручність роботи користувача визначається інтерфейсом користувача – частиною СУБД, орієнтованої на взаємодію користувача з комп’ютером.
Доступ до даних здійснюється у вигляді запитів, які формулюються стандартною мовою запитів. Дія, що здійснюється над базою даних, називається транзакцією.
Особливість сучасних реляційних баз даних – їх розподіленого характеру (distributed databank), тобто. зміст фрагментів з кількох баз даних, які розташовуються на різних вузлах мережі комп’ютерів та, можливо, керуються різними СУБД.
Потреби більш зручних і потужних засобах моделювання предметної області, ніж реляційні бази даних, задовольняє напрям семантичних, або об’єктно-орієнтованих, СУБД, що повніше забезпечують можливості вираження семантики даних. З’являються СУБД нових поколінь – об’єктно-реляційні та дедуктивно-об’єктно-орієнтовані.
Найбільш ефективний засіб представлення відомостей про бази даних – їх електронні каталоги, або бази метаданих. За допомогою баз метаданих можуть вирішуватися такі завдання:
- організація навчання баз даних;
- планування розвитку інформаційних ресурсів;
- інформаційне забезпечення процесів формування науково-технічної політики у різних галузях економіки та соціальної сфери для визначення перспектив та шляхів їх інформатизації.
Складовою частиною інтелектуальних, зокрема експертних, систем, що застосовуються в управлінні, економіці, фінансово-кредитній сфері, освіті тощо, є бази знань (knowledge base) (бази даних на основі семантичної мережі, процедурної, фреймової та інших моделей, організовані способом, що дозволяє системі відповідати на питання, відповіді на які у явному вигляді в базі відсутні).
Експертні системи, що містять бази знань, алгоритми вирішення конкретних завдань та програмно-технічні засоби, дають можливість користувачеві на основі даних, що вводяться, про поточний стан об’єкта управління або аналізованої ситуації отримувати варіанти рекомендацій для вибору управлінських дій.