Eine Datenbank ist die elektronische Form eines Karteikastens bzw. eines Systems zusammengehöriger Karteikästen. Es handelt sich um eine Sammlung von Daten, die aus der Sicht des Benutzers zusammengehören, z. B. eine Personaldatenbank oder eine Lagerinventardatenbank. Die Datenbank wird üblicherweise von einem Datenbankverwaltungssystem (engl. database management system, DBMS) verwaltet. Ein DBMS zusammen mit einer oder mehreren Datenbanken nennt man Datenbanksystem (DBS). Es gibt hierarchische, relationale (RDBMS), multidimensionale und objektorientierte Datenbanken.
In der Praxis wird der Begriff "Datenbank" mehrdeutig verwendet. Er kann sowohl die gesamte Anwendung (DBMS, zugehörige Programme und Dateninhalte) im Sinne einer "Daten-Bank" bezeichnen (engl. databank), als auch den reinen Datenspeicher als technische Daten-Basis (engl. database). Ferner verwenden die einzelnen DBMS-Hersteller geringfügig voneinander abweichende Begrifflichkeiten dafür, was man genau unter einer Datenbank versteht: entweder alle Daten, die von einer DBMS-Installation bzw. -Instanz verwaltet werden, oder nur die jeweils inhaltlich zusammengehörigen Daten.
Das grundlegende Element einer Datenbank ist der Datensatz. Jeder Datensatz besteht wiederum aus einer festen Anzahl von Datenelementen, den Attributen. Vergleicht man eine Datenbank mit einem Karteikasten-System, so entspricht ein Datensatz einer Karteikarte. Die Attribute sind dann Einträge innerhalb der Karte.
Datensätze werden in den meisten Datenbanken in einer Tabelle gespeichert. Mehrere Tabellen können wiederum in einer inhaltlichen Beziehung zueinander stehen. So kann eine Tabelle, die Kundendaten speichert, in Zusammenhang mit einer Tabelle von gekauften Produkten stehen. Eine Firma kann so ermitteln, welcher Kunde welche Produkte gekauft hat.
Datenbanken sind heute ein zentraler Bestandteil fast jedes Softwaresystems. Sie verwalten Lagerbestände eines Unternehmens, Patienteninformationen in Krankenhäusern, Telefondaten in der Auskunft, Finanztransaktionen in der Bank. Damit stellen sie einen kritischen Teil jedes Unternehmens und jeder Behörde dar. Von der Verfügbarkeit, Vollständigkeit und Richtigkeit der Daten hängt die Aktionsfähigkeit eines Unternehmens ab. Die vollständige Automatisierung von Lagerbeständen macht eine manuelle Verwaltung heute unmöglich. Der Verlust einer Lagerdatenbank kann somit das Unternehmen in sehr kurzer Zeit finanziell ruinieren, da georderte Produkte nicht ausgeliefert werden können oder gar die Aufträge selbst verloren sind. Die Datensicherheit ist daher ein wichtiger und gesetzlich vorgeschriebener Bestandteil der IT eines Unternehmens oder einer Behörde.
Datenbankmanagementsysteme übernehmen somit eine wichtige Funktion eines Softwaresystems. Sie garantieren den schnellen und dauerhaften Zugriff auf die Daten sowie den Schutz gegen unerlaubten Zugriff und Systemfehler. Aus diesem Grunde sind Datenbankmanagementsysteme selbst hochkomplexe Softwaresysteme.
Die erste Generation von Datenbanken bestand aus Lochkarten. Ein Nachteil war, dass die Lochkarten hintereinander (sequentiell) gelesen werden mussten, was zur Folge hatte, dass alle Informationen, die vor der gesuchten standen, ausgelesen und verarbeitet werden mussten. Eine ähnliche Verarbeitungsform hatten Magnetbänder, auf denen Daten nur sequentiell gespeichert werden konnten.
Die zweite Generation der Datenbanken wurde ca. 1960 entwickelt. Zu diesem Zeitpunkt begann man die Daten auf Festplatten zu halten. Deren Eigenschaft des wahlfreien Zugriffs führte zu einem erheblichen Performance-Vorteil. Weiterhin erlaubte der Mehrbenutzerbetrieb vielen Benutzern den gleichzeitigen Zugriff auf die Datenbank.
Zwischen 1965 und 1975 wurde die dritte Generation der Datenbanken entwickelt. In dieser Zeit entstanden das hierarchische Datenbankmodell und die Netzwerkdatenbank.
Im Gegensatz zu hierarchischen Datenbanken können in Netzwerkdatenbanken die Datensätze auf mehreren Wegen verknüpft sein und nicht nur entlang einfacher Eltern-Kind-Beziehungen. Eine heute noch häufig eingesetzte Netzwerkdatenbank ist IDMS der Firma Computer Associates.
Einen wesentlichen Fortschritt erzielte in den 1960er und 1970er Jahren Edgar F. Codd mit seiner Forschungsarbeit am IBM Almaden Research Center. Codd entwickelte die Grundlagen der ersten experimentellen relationalen Datenbank System R. Die Firma Oracle entwickelte das erste kommerzielle Datenbankmanagementsystem.
Relationale Datenbanken sind heute am weitesten verbreitet. In ihnen werden Daten (Texte, Zahlen und Binärdaten) in Tabellen abgespeichert. Die Bezeichnung relational entstammt dem zugrunde liegenden mathematischen Modell, auf dem diese Datenbanken beruhen, der relationalen Algebra.
Eine neuere Entwicklung sind objektorientierte Datenbanken (OODBMS). Bei relationalen Datenbanken geht es zuerst um die Struktur, in der die jeweiligen Daten gespeichert werden sollen. Objektorientierte Datenbanken dagegen folgen der objektorientierten Programmiermethode, d. h. es kommen erst die Daten, an denen sich die Datenbankstruktur dann orientiert. Eine hervorgehobene Eigenschaft von OODBMS ist die Möglichkeit, die Objekte der OO-Programmierungswelt mit wenig Programmieraufwand persistent zu machen, also zwischen Programmläufen abzuspeichern. Ein Beispiel für ein objektorientiertes Datenbankverwaltungssystem ist Caché von Intersystems. |