Free Essay

Comparison of Relational Databases in the Cloud

In:

Submitted By ultimaweapon
Words 7070
Pages 29
I

BIS5401 - Advanced Software Engineering SS 2014

Thema: Vergleich relationaler Datenbankdienste in der Cloud

II

Inhaltsverzeichnis
Inhaltsverzeichnis ................................................................................................... II Abbildungsverzeichnis .......................................................................................... III Anlagenverzeichnis................................................................................................. V 1 Einleitung ............................................................................................................ 1 2 Relationale Datenbankmanagementsysteme in der Cloud .................................. 2 3 Vorstellung ausgewählter Anbieter..................................................................... 4 3.1 Microsoft SQL Azure .................................................................................. 4 3.2 Amazon RDS ............................................................................................... 5 3.3 Oracle Database Cloud Service ................................................................... 5 4 Vergleich der relationalen Cloud Datenbankdienste .......................................... 7 4.1 Vergleich 1: Einrichtung und Verwaltung ................................................... 7 4.2 Vergleich 2: Kompatibilität ......................................................................... 9 4.3 Vergleich 3: Datenbankgröße .................................................................... 10 4.4 Vergleich 4: Kosten ................................................................................... 11 4.5 Vergleich 5: Skalierbarkeit ........................................................................ 16 4.6 Vergleich 6: Performance .......................................................................... 17 4.7 Vergleich 7: Verfügbarkeit, Replizierung und Backup ............................. 21 4.8 Vergleich 8: Sicherheit .............................................................................. 24 5 Zusammenfassende Bewertung ........................................................................ 26 Literaturverzeichnis ............................................................................................... 29 Anhang................................................................................................................... 32

III

Abbildungsverzeichnis
Abbildung 1: Kalkulationsbeispiel Kosten alle Anbieter Vergleich ..................... 15 Abbildung 2: Tabellen in der Amazon RDS Beispieldatenbank ........................... 18 Abbildung 3: Tabelle "Gebaeude der Beispieldatenbank ...................................... 18 Abbildung 4: Oracle Fehlermeldung bei mehr als 32.000 Zeichen ....................... 19 Abbildung 5: Dauer inserts in "ms" ....................................................................... 20 Abbildung 6: Dauer Selects in "ms" ...................................................................... 20 Abbildung 7: Dauer Updates in "ms" .................................................................... 21

IV

Tabellenverzeichnis
Tabelle 1: Vor- und Nachteile Cloud-basierter Datenbanken ................................. 3 Tabelle 2: On-Premise Datenbanken und Cloud Datenbanken im Vergleich ......... 3 Tabelle 3: Vorstellung Microsoft SQL Azure ......................................................... 4 Tabelle 4: Vorstellung Amazon RDS ...................................................................... 5 Tabelle 5: Vorstellung Oracle Database Cloud Service .......................................... 5 Tabelle 6: Vergleich der maximalen Datenbankgrößen ........................................ 11 Tabelle 7: SQL Azure – Kostenübersicht (Region Europa West) ......................... 12 Tabelle 8: Oracle Database Cloud Service - Kosten ............................................. 13 Tabelle 9: Amazon RDS– Kostenübersicht (Region Europa West) ...................... 14 Tabelle 10: Gesamtvergleich – Replikation, Verfügbarkeit und Backup .............. 24 Tabelle 11: Gesamtvergleich – Sicherheit ............................................................. 26

V

Anlagenverzeichnis
Anhang 1: SQL Azure Datenbankinstanz.............................................................. 32 Anhang 2: SQL Azure Firewall Konfiguration ..................................................... 32 Anhang 3: SQL Azure Entwicklungsumgebung ................................................... 33 Anhang 4: SQL Azure – manuell Tabellen erstellen ............................................. 33 Anhang 5: SQL Azure - Tabellen mit SQL Anweisung erstellen ......................... 33 Anhang 6: SQL Azure - Importfunktion Excel ..................................................... 34 Anhang 7: Amazon RDS - Datenbankinstanz ....................................................... 34 Anhang 8: Amazon RDS - Entwicklungsumgebung mit HEIDI SQL .................. 34 Anhang 9: Amazon RDS – Konfiguration der Security Groups ........................... 35 Anhang 10: Oracle Database Cloud Service - Datenbankinstanz ......................... 35 Anhang 11: Oracle Database Cloud Service - Entwicklungsumgebung ............... 36 Anhang 12: Oracle Database Cloud Service - Tabellen anlegen ........................... 36 Anhang 13: Oracle Database Cloud Service - Team Development ...................... 36

1

1 Einleitung
Es lässt sich ohne Zweifel feststellen, dass ungezügeltes und kontinuierliches Datenwachstum längst zu einer großen Herausforderung von Unternehmen geworden ist. Statistiken besagen, dass sich das weltweite Wachstum von Daten bereits alle 18 Monate verdoppelt. 1 Das gilt sowohl für den privaten, als auch für den gewerblichen Sektor. Ein Grund für das drastische Wachstum der Datenmengen in Unternehmen, liegt in der zunehmenden Wertigkeit und Bedeutung von Daten.

Die meisten Daten in Unternehmen werden meist durch verschiedene und komplexe Geschäftsanwendungen (z.B. CRM-Systeme) generiert. Diese Geschäftsanwendungen bauen logisch auf Datenbanksystemen auf. Diese (meist relational) werden eingesetzt, um die Daten strukturiert 2 anlegen, pflegen, speichern, auswerten und verwalten zu können. Solche Systeme wurden durch namhafte Anbieter wie IBM (z.B. DB2), Microsoft (MS SQL Server) oder Oracle (Oracle Database) kontinuierlich weiterentwickelt und es wurde die hierfür verwendete Sprache „SQL“ 3 größtenteils standardisiert. 4 Seitens der Bereitstellung werden Datenbanksysteme in der Regel „On-Premise“ 5 genutzt. Das bedeutet, dass die physischen Datenbankserver und die Verwaltung im eigenen Rechenzentrum betrieben werden. 6

In Zeiten von Cloud Computing und dessen Möglichkeiten, geht der aktuelle Trend jedoch in die Richtung, ganze Datenbanksysteme vom traditionellen „OnPremise“- Bereitstellungsmodell abzulösen und auf ein (fremd-) gehostetes „OnDemand-Modell“ umzustellen. Dabei wird die notwendige Infrastruktur eines Datenbankmanagementsystems durch einen Cloud-Drittanbieter zur Verfügung gestellt und verwaltet. 7

1 2

Vgl. Quantum (URL). Aber auch unstrukturierte Daten wie Text- oder Binärdaten. 3 Structured Query Language 4 Vgl. Steiner (2014), S. 1. 5 Nutzungsmodell. 6 Vgl. Marinescu (2013), S.1. 7 Vgl. Schaffner (2014), S. 1.

2 Es gibt bereits unterschiedliche Anbieter die Datenbankservices aus der Cloud anbieten. Die „Big-Player“ in diesem Umfeld sind Amazon, Microsoft, Google und Oracle. In dieser Arbeit wird der Fokus auf die Lösungen von Amazon, Microsoft und Oracle gelegt. Ziel dieser Arbeit ist es, sinnvolle Vergleichskriterien für Datenbankservices aus der Cloud aufzustellen und für die ausgewählten Anbieter gegenüberzustellen.

2 Relationale Datenbankmanagementsysteme in der Cloud
Wie bereits in der Einleitung beschrieben, verwenden Unternehmen relationale Datenbankmanagementsysteme (kurz: RDBMS) als zentrale Speicher- und Verwaltungsinstanz generierter Daten unterschiedlicher Anwendungsquellen. Das gesamte Datenbankmanagementsystem ist dabei physisch auf den Datenbankservern im Rechenzentrum eines Unternehmens vorhanden. Der Betrieb und die Wartung dieser Systeme werden meist durch Datenbankspezialisten übernommen. Diese sind (u.a.) für die Konfiguration der Hardware(-Server), der Installation und Konfigurieren der Datenbanken sowie dem Planen und Einrichten notwendiger Backup-Systeme zuständig. Aus Kostensicht fallen beim Betrieb einer eigenen Datenbankumgebung hohe Aufwände für die Verwaltung und dem Ausbau notwendiger Rechner-/ und Speicherkapazitäten an. Der größte Kostenblock wird dabei nicht durch die Hardwarekosten erzeugt, sondern durch die Facharbeiter, die für einen reibungslosen Betrieb zuständig sind.

Im Vergleich zu dieser „On-Premise“-Bereitstellung steht das neuartige „Data as a Service“-Konzept, bei dem das Datenbankmanagementsystem als CloudDienstleistung eingekauft werden kann. Dabei kann die gesamte IT-Infrastruktur eines Datenbanksystems als Cloud-Dienst angemietet werden. Hierdurch können beschriebene administrative Aufgaben einer „On-Premise“- Datenbankumgebung nahezu abgelöst werden. Lediglich die Rechteverwaltung und das Monitoring der Ereignisse auf der Umgebung müssen übernommen werden. Nachfolgende Tabelle 1 zeigt die wichtigsten Vor- und Nachteile von Cloud-basierten Datenbanken auf.

3 Tabelle 1: Vor- und Nachteile Cloud-basierter Datenbanken 8 Vorteile
Einfaches Datenmodell Geringe Hardware- und Administrationskosten

Nachteile
Relativ neues Modell Datenkonsistenz/-integrität nicht immer gewährleistet

Einfache Skalierbarkeit Konzept zukunftssicher und ausbaufähig

Zugang über das Internet (Angreifbar) Komplexe Datensicherung durch verteilte

Datenhaltung Häufig sehr spezialisierte Systeme Geteilte Ressourcen

Wenn Datenbanken in der Cloud untersucht werden, sollten weiter die wichtigsten technischen Unterschiede zu lokalen Datenbanken aufgezeigt werden. Nachfolgende Tabelle 2 zeigt die wichtigsten Unterschiede anhand unterschiedlicher Merkmale von „On-Premise“-Datenbanken zu Datenbanken in einer Cloud: Tabelle 2: On-Premise Datenbanken und Cloud Datenbanken im Vergleich 9 Merkmal
Zugang Schnittstellen Sicherheit Apps Skalierung Updates Backup

„On-Premise“ Datenbanken „Cloud“ Datenbanken
LAN ODBC/JDBC „self-build“ Security Desktop Apps Enterprise Scale Manual Upgrades Manual Tuning & Backups WAN Open Web Protocols Zentralisiert, „built-in security“ Mobile Apps Internet Scale Automated Upgrades Automatic Tuning & Backups

8 9

Grönwald, Küwen (URL). Vgl. Dimovski (2013), S.20.

4

3 Vorstellung ausgewählter Anbieter
In diesem Kapitel werden die für diese Arbeit ausgewählten Anbieter von Cloud Datenbankservices kurz vorgestellt, bevor diese anhand unterschiedlicher Kriterien in Kapitel 4 miteinander verglichen werden.

3.1

Microsoft SQL Azure

Tabelle 3: Vorstellung Microsoft SQL Azure Name Standorte Website Microsoft SQL Azure USA, Asia, Europa http://azure.microsoft.com/dede/services/sql-database/ Gründung 01. Februar 2010 (Microsoft Azure)

Die SQL Azure von Microsoft (kurz: MS) ist dabei eine der drei Hauptkomponenten der Windows Azure Plattform und versteht sich laut Internetauftritt von MS als „vollständig verwalteteter, relationaler Datenbankdienst, der flexible Verwaltbarkeit, integrierte hohe Verfügbarkeit und vorhersagbare Leistung bietet und eine umfassende horizontale Skalierung unterstützt“. 10 Die SQL Azure ist funktional gesehen ein Derivat des SQL Servers 2008 R2 und wird von MS gehostet. Dadurch können ein großer Teil der Funktionalitäten des bewährten MS SQL Servers genutzt werden. 11

10 11

Microsoft (URL1). Vgl. Microsoft (URL1).

5 3.2 Amazon RDS

Tabelle 4: Vorstellung Amazon RDS Name Standorte Amazon Relational Database Service USA (3), Europa (1), Asien (3), Südamerika (1) Website Gründung http://aws.amazon.com/de/rds/ 1.März 2006 (Amazon Web Services)

RDS ist ein Cloud-Datenbankservice von Amazon und ein Bestandteil seiner Web Services. Bei RDS wird ein MySQL-basierte Cloud-Datenbankservice angeboten, der einen ähnlichen Funktionsumfang eines „On-Premise“ MySQL-

Datenbankservers darstellt. Neben dem Bereitstellen der relevanten Infrastruktur für das Betreiben der MySQL-Datenbankinstanz wirbt Amazon bei seinem Service mit Übernahme von vielen Administrations- und Verwaltungsaufwänden des Datenbankmanagementsystems. Weiter wird eine sehr hohe Verfügbarkeit, flexible Skalierbarkeit und Datensicherheit versprochen. 12

3.3

Oracle Database Cloud Service

Tabelle 5: Vorstellung Oracle Database Cloud Service Name Standorte Website Gründung Oracle Database Cloud Service USA, Europa, Asien https://cloud.oracle.com/database 2011

Oracle bietet mit seiner Oracle Datenbank Cloud Service einen leistungsstarken und flexiblen Datenbankdienst an. Vor allem wird die Vielfalt an Wahlmöglichkeiten die der Nutzer bzgl. der Datenbankversion; Verwaltungsoptionen (selbstoder fremdverwaltet) und Zugriffsmethoden (virtuelle Maschine oder in einer vollständigen Entwicklungsumgebung) hat. Die Services basieren auf Oracles

12

Vgl. Amazon (URL1).

6 Database 11g Release 2 Enterprise Edition, welche auf einer Exadata Appliance von Oracle gehostet wird. Wie auch bei Amazon und Microsoft kümmert sich Oracle um die Distribution der Daten in die verschiedenen Rechenzentren und übernimmt außerdem das Backup der Daten. 13

13

Vgl. Grönwald/Küwen (2013).

7

4 Vergleich der relationalen Cloud Datenbankdienste
Dieses Kapitel bildet den Schwerpunkt dieser Arbeit und stellt einen Vergleich der ausgewählten Anbieter anhand verschiedener Vergleichskriterien dar. Dabei wurde versucht anhand von Merkmalen (lokaler) relationaler Datenbanksysteme eine sinnvolle Adaption auf Anforderungen von Datenbanken in der Cloud zu finden.

4.1

Vergleich 1: Einrichtung und Verwaltung

Das Einrichten und Konfigurieren einer Microsoft SQL Azure lässt sich in wenigen Schritten realisieren. Hierfür stellt Microsoft eine logische, webbasierte Administrationsoberfläche (SQL Azure Web-Verwaltungsportal) mit HTML5Unterstützung zur Verfügung. Microsoft stellt Kunden für die Einrichtung eine detaillierte „Erste Schritte“- Dokumentation inklusive eines Datenbankschemas zur Verfügung, mit dem entsprechende Tabellen angelegt und auch populiert werden können. Bevor eine Datenbank eingerichtet werden kann, muss eine virtuelle MS SQL-Serverinstanz im Verwaltungsportal erstellt werden. Um eine erfolgreiche Verbindung zum angelegten Windows Azure SQL-Server gewährleisten zu können (Port: 1433), müssen benötigte IP-Adressen freigeschaltet und für alle „Client IPs“ Firewall Regeln eingerichtet werden. Es können sowohl IP-Adressen als auch ganze Adressbereiche freigeschaltet werden. Nach erfolgreicher Verbindung kann eine Datenbank im Portal angelegt und verwaltet werden. Beim Anlegen weiterer Datenbanken (insg. 149 Datenbanken möglich) kann entweder der bestehende Server genutzt oder eine neue Serverinstanz angelegt werden. Es können neben dem Portal auch andere Tools wie z.B. das SQL Server Management Studio 2008, Visual Studio 2010, Power Shells oder REST-Apis verwendet werden, um Datenbanken einzurichten und zu verwalten. Mit dem SQL Server Management Studio 2008 R2 kann der Nutzer auf eine große Anzahl von Prozessen (z.B. Erstellen und Warten unterschiedlicher Indexprozesse) und umfassenden Funktionen wie z.B. Syntax Check, IntelliSense oder Templates zurückgreifen. 14

14

Microsoft (URL2).

8 Auch bei Amazon RDS ist die Einrichtung einer Datenbank(-instanz) benutzerfreundlich gestaltet. Wie bei MS SQL Azure wird dem Nutzer eine adäquate Benutzeranleitung angeboten. Mit der „AWM Management Console“ bietet Amazon ebenfalls eine anschauliche und webbasierte Administrationsoberfläche. Eine Datenbankinstanz 15 in der RDS kann entweder durch die AWS Management Console, der Amazon RDS-API (Befehl: „CreateDBInstance“) oder durch Befehlszeilen-Tools (Befehl: „rds-create-db-instance“) erstellt werden. Um Zugriff auf die Datenbank bzw. den Tabellen zu erhalten, muss sich der Benutzer mit dem Hostname / der IP-Adresse über eine entsprechende Datenbankverwaltungssoftware (z.B. Heidi SQL, Microsoft SQL Server Management Studio) mit der Datenbankinstanz verbinden. Wie bei der SQL Azure, müssen auch bei der Amazon RDS sogenannte Security Groups konfiguriert werden um entsprechende IP-Adressen freizuschalten und die Verbindung zur Datenbankverwaltungssoftware herzustellen. 16 Danach besteht die Möglichkeit erstellte Instanzen anzuzeigen, zu löschen, Infrastrukturattribute der Instanz zu definiert und den Zugriff zu kontrollieren.

Im Gegensatz zur Azure SQL und Amazon RDS wird bei der Oracle Cloud Database eine Datenbank bereits automatisch mit dem Bereitstellen des Testzugangs generiert. Auch hier steht ein webbasiertes Managementportal („Oracle Enterprise Manager Database Control“) sowie eine Entwicklungsumgebung („Oracle Application Express“ (kurz: APEX)) zur Verfügung. Wie bei den anderen zwei Anbietern, kann Oracle mit einer benutzerfreundlichen Vorgehensweise und ausführlichen Dokumentation punkten. Benötigte Tabellen können sehr schnell in der Datenbank angelegt werden. Anders als bei den anderen beiden Anbietern Azure und RDS kann bei Oracle beispielsweise eine bestehende (Excel)-Tabelle mit „Copy Paste“ in die Datenbank importiert werden. Für die Migration von Daten bietet Oracle den Oracle SQL Developer und sonstige Tools an. Mit diesem grafischen Java-Tool kann die Migration der Daten zwischen zwei Oracle-Datenbanken oder aus anderen Datenbanken wie z.B. MySQL problemlos erfolgen. Zusätzlich wird Oracle „Data Pump“ und der Oracle „SQL Loader“ für einen reibungslosen Export/- und Import der Daten als Dienstprogramm zur Verfügung gestellt. Jedoch

15

Bildet eine Datenbank-Umgebung in der Cloud ab (mit festgelegten Rechen- und Speicherressourcen). 16 Amazon (URL1).

9 unterscheidet sich die Oracle Cloud von den zwei anderen Anbietern: Beim Oracle Database Cloud Service wird lediglich ein Datenbankschema der bewährten Oracle Database (Version: Enterprise Edition 11.2) zur Verfügung gestellt. Dabei werden Datenbanken als Schema in eine gemeinsame DB zusammengeführt. Durch die Kombination der RAC 17-Technik ist es dann möglich, dass die Datenbank viele (virtuelle) Server nutzen kann und somit ein enorm hohes Potential für eine Skalierung offeriert wird. 18 Bei Oracle kann eine zusätzliche Entwicklungsumgebung mit der Installation des SQL Developers oder dem Oracle Enterprise Manager bereitgestellt werden. Im Vergleich zur Lösung von MS und Amazon bietet Oracle außerdem eine Kollaborationsplattform an, welche im Verwaltungsportal unter dem Namen „Team Development“ erscheint. Hier können Meilensteine gesetzt, To-Do-Listen angelegt und kommuniziert werden.

4.2

Vergleich 2: Kompatibilität

Wenn ein lokales Datenbanksystem auf eine virtuelle Datenbankumgebung portiert werden soll, muss eine hohe Kompatibilität gewährleistet werden. Ohne Unterstützungsfunktionen können ansonsten hohe Migrationsaufwände entstehen.

Amazon bietet mit seiner Lösung RDS einen nativen „Zugriff auf den Funktionsumfang einer vertrauten MySQL-, Oracle-, Microsoft SQL Server- oder PostgreSQL-Datenbank-Engine“. 19 Hierdurch wird der Migrationsaufwand deutlich reduziert, da existierende Geschäftsanwendungen, die auf einer dieser Engines aufbauen, nahtlos in die RDS von Amazon integriert werden können. Hierfür stehen DBA-Tools und gemeinsame MySQL Entwicklertools wie z.B. die MySQL Workbench zur Verfügung. Bei der SQL Azure Lösung wird der MS SQL Server ab Version 2008 R2 als unterstütztes Engine angeboten. Dieser besitzt jedoch nicht den kompletten Funktionsumfang eines SQL Servers 2008 R2. Hier könnte der Migrationsaufwand aufgrund der Inkompatibilitäten (wenn das Quellsystem nicht gleich ist) deutlich höher ausfallen wie bei den anderen Lösungen. Jedoch lässt sich durch den SQL Azure Migrationsassistenten und manuellen Anpassungen für eine erfolgreiche Migration bewältigen. Weiter ist es möglich das Daten17 18

Hochverfügbarkeits-Technologie. Oracle (URL). 19 Amazon (URL1).

10 bankschema als Transact-SQL-Skript zu exportieren und auf der SQL Azure Datenbank auszuführen. Zusätzlich bietet Microsoft „SQL Azure Compatibility Assessment“ als Service an, um vorab die Kompatibilität von SQLServerdatenbanken mit SQL Azure zu testen. 20

4.3

Vergleich 3: Datenbankgröße

Microsoft bietet bei ihrer SQL Azure Lösung unterschiedliche Datenbankgrößen anhand der ausgewählten Datenbankedition. Hierfür steht eine Web- und Businessedition zur Verfügung. Die Webedition hat einer Maximalgröße von 5GB. Hierbei kann die Größe auch nur entweder auf 1GB oder 5GB gesetzt werden. Die Business Edition hat eine Maximalgröße von 150GB. Hierbei gibt es folgende Staffelungen die gesetzt werden können: 10GB, 20GB, 30GB, 40GB, 50GB, 100GB und 150GB. Wenn die Datenbank ihr Limit erreicht hat, ist es nicht mehr möglich Daten einzufügen, zu updaten oder eine neue Datenbank zu erstellen. Das Lesen, Löschen, Abschneiden von Tabellen und Indizes sowie die Neuerstellung ist jedoch weiterhin möglich. 21 SQL Azure kann durch Partitionstechniken außerdem Speicherplatz im Terabyte-Bereich erreichen. Ähnlichen Speicherplatz bietet die Oracle Database Cloud an, wobei hier die Maximalkapazität bei 50GB liegt. Das Oracle Speicherplatzangebot gibt es in drei Staffelungen: Bis zu 5GB, 20GB und 50GB. Nur das Angebot von Amazon hebt sich im direkten Vergleich deutlich ab. Hierbei besteht die Möglichkeit bis zu 1 TB Speicherplatz pro Datenbank anzumieten. Außerdem besteht eine flexible Auswahl der Größen ohne zwingende Staffelung. Nachteil bei der Lösung von Amazon betrifft die Reduzierung des Speicherplatzes. Diese ist sehr unflexibel, da keine Reduzierung vorgehsehen wird. Nachfolgende Tabelle 6 stellt die wichtigsten Zahlen zur Größe nochmal im Überblick dar:

20 21

Vgl. Microsoft (URL3). Vgl. Dimovski (2013), S.28.

11 Tabelle 6: Vergleich der maximalen Datenbankgrößen 22 Merkmal
Datenbankgröße

Amazon RDS
Von 100 GB bis 1 TB (pro Datenbank)

SQL Azure
Von 1 GB bis 150 GB (50GB max. pro Datenbank) In Web-Edition: 1GB oder 5GB In Business-Edition: Staffelung: 10,20,30,40,50,100 und 150GB

Oracle DB
Von 5GB bis 50 GB Auswahl von nur 3 Leistungsklassen

Einschränkung

Keine Reduzierung des Speicherplatzes

Mögl. DB-Anzahl

z.B. beim SQL Server: 30 DB pro Instanz

Bis zu 149

1

4.4

Vergleich 4: Kosten

In der Regel erfolgt eine Abrechnung von Services aus der Cloud in Abhängigkeit der Nutzung (auch: „Pay-per-use“-Konzept genannt). Im Bereich von Speicherservices zahlt der Nutzer z.B. den tatsächlich von ihm belegten Speicherplatz auf der Datenbank, den ein- und ausgehenden Datenverkehr pro GB, die Speichertransaktionen (pro Mio. Reqests) und ggf. die verbrauchte Rechenleistung (z.B. CPU- und Speicherressourcen pro Stunde). Kosten durch Zusatzfunktionen wie Backup können natürlich zusätzlich entstehen. Das „Pay-per-use“-Konzept hat den klaren Vorteil, dass effektiv nur so viel bezahlt wird, wie es die Nachfrage erfordert. 23 Im weiteren Verlauf werden alle drei Anbieter anhand ihrer Kosten untersucht und gegenübergestellt.

Bei der SQL Azure erhebt Microsoft den monatlichen Betrag anhand zweier Berechnungsfaktoren: Die Kosten für den tatsächlich belegten Speicherplatz auf der Datenbank pro Tag und den Kosten für die ausgehende Datenübertragung 24 (siehe Tabelle 7), wobei hier die ersten 5GB kostenlos sind. Ausgehende Datenübertragungen werden auf Basis der Gesamtmenge berechnet, die vom Internet transferiert werden. 25

22 23

Microsoft (URL1), Amazon (URL1) und Oracle (URL). Vgl. BSI (URL). 24 Standortabhängig. 25 Aus den Azure-Datencentern.

12 Auf der anderen Seite sind alle eingehenden Datenübertragungen an die SQL Azure sowie der Support kostenlos.

Tabelle 7: SQL Azure – Kostenübersicht (Region Europa West) 26 Kosten Speicherplatzbelegung (Datenbank)
Bei Datenbankgrösse 0 bis 100 MB 100 MB bis 1 GB 1 GB bis 10 GB 10 GB bis 50 GB 50 GB bis 150 GB Preis pro GB $4,995 $9,99 $9,99 27 $45,96 28 $125,88 29 $3,996 $1,996 $0,999 Jedes weitere GB

Kosten ausgehender Datenverkehr:
Erste 5 GB pro Monat 5 GB – 10 TB pro Monat Für nächsten 40 TB pro Monat Für nächsten 100 TB pro Monat Für nächsten 500 TB pro Monat $0,000 / GB $0.090 / GB $0.070 / GB $0.060 / GB $0.040 / GB

Oracle hingegen bietet nur drei Pakete mit jeweiliger Limitierung der Datenbankgröße und des Datenverkehrs zum Pauschalpreis an (siehe Tabelle 8). Zwar ist hier der Datenverkehr inklusive, jedoch wird nicht nutzungsabhängig, sondern nach gewähltem Paket bezahlt. Das hat zum großen Nachteil, dass der Kunde bei einem kontinuierlichen Wachstum des Speichers automatisch in die nächste Leistungsklasse eingestuft wird: Wurde beispielsweise das S5 Paket (5GB Volumen) gebucht, um den aktuellen Speicherplatzbedarf von ca. 4GB zu decken und der Kunde benötigt auf Grund von kontinuierlichem Wachstum 6GB Speichervolumen, müsste theoretisch auf das S20 Paket umgestiegen werden. Dies zieht jedoch eine fünffache Erhöhung der monatlichen Kosten nach sich und ist somit absolut unrentabel.

26 27

Werte aus den Internetauftritten von: Amazon (2014), Microsoft (2014), Oracle (2014). Für das erste GB. 28 Für die ersten 10 GB. 29 Für die ersten 50 GB.

13 Tabelle 8: Oracle Database Cloud Service - Kosten 30 Leistung
Speicherplatz Verfügbarer Datentraffic Anzahl Datenbanken Kosten

Database S5
5 GB Storage 30 GB 1 175$ pro Monat

Database S20
20 GB Storage 120 GB 1 900$ pro Monat

Database S50
50 GB Storage 300 1 2000$ pro Monat

Bei der Amazon RDS „On-Demand-Instanz“ 31 wird nur das gezahlt, was auch genutzt wird. Es wird nach Rechenkapazität pro Stunde abgerechnet und keine Mindest- oder Einrichtungsgebühr erhoben. Die Kosten für die Nutzung setzen sich jedoch aus vier Bereichen zusammen: Amazon EC2 Service (Compute), Amazon RDS Service (Storage), Amazon RDS Support (Backup) und Amazon RDS Bandwith (AWS Data Transfer). Von „RDS Compute“ werden die benötigten Rechen- und Speicheressourcen (CPU, Arbeitsspeicher) zur Verfügung gestellt. Amazon nutzt für seinen RDS-Dienst eine modifizierte Version einer EC²Instanz. Dabei stehen unterschiedliche Klassen von Rechenleistungen zur Verfügung. Die Leistungen erstrecken sich von „t1.micro“ (1vCPU und 0,6GB Ram) bis „hi.large“ (32vCPUs und 60,5GB Ram). Zusätzlich ist es möglich, ein für sich abgestimmtes Betriebssystem für die Instanz auszuwählen (z.B. Linux, Windows, Red Hat etc.) Die benötigten Speicherressourcen (Speicherplatz pro GB und Monat) werden durch die Bereiche „Amazon RDS Storage“ und „RDS Support Backup“ verrechnet. Der genutzte Traffic für den Datentransfer zwischen der Datenbankinstanz und der Anwendung und dem Datenbankzugriff selbst wird durch den Bereich „RDS Bandwidths“ verrechnet. Bei den Kosten für den Datentransfer kann eingespart werden, wenn die eigene Anwendung auf einer Datenbank in der gleichen Region (Availability Zone) betrieben wird. In nachfolgender Tabelle 9 sollen die wichtigsten Kosten kurz aufgelistet werden.

30 31

Vgl. Oracle (2013). Es gibt noch die Reserved-Instanzen. Diese werden in dieser Arbeit jedoch nicht betrachtet, da diese den Umfang dieser Arbeit sprengen würden.

14 Tabelle 9: Amazon RDS– Kostenübersicht (Region Europa West) 32 Kostenübersicht
DB-Instanz-Klasse Small DB Instance Large DB Instance Extra Large DB Instance Double Extra Large DB Instance Quadruple Extra Large DB Instance RAM 1,7 GB 7,5 GB 15 GB 34 GB 68 GB CPU 1 ECU 33 4 ECU 8 ECU 13 ECU 26 ECU Plattform 32-Bit Linux 64-Bit Linux 64-Bit Linux 64-Bit Linux 64-Bit Linux Preis/h $0,11$ $0,44$ $0,88$ $1,55$ $3,10$

Sonstige Kosten
Speicherplatzbelegung 5GB bis 1 TB I/O-Zugriffe Backup Aktive DB Inaktive DB Ausgehende Datenübertragung Erstes GB pro Monat Bis zu 10 TB pro Monat Nächste 40 TB pro Monat Nächste 100 TB pro Monat Nächste 350 TB pro Monat 0,10$ pro GB/Monat 0,10$ pro Mio. Requests Kostenlos 0,15$ pro GB/Monat $0,000 / GB $0.120 / GB $0.090 / GB $0.070 / GB $0.050 / GB

32 33

Vgl. Amazon (URL3). 1 ECU entspricht der virtuellen CPU Leistung eines 1,0 – 1,2 GHz Opteron/Xenon (Amazon 2014).

15 Beispielkalkulation: Um einen adäquaten Kostenvergleich aller drei Datenbankservices vornehmen zu können, wurde in dieser Arbeit ein einfacher Case mit folgenden Annahmen berechnet:  Die Datenbank der Firma XYZ benötigt eine Datenbanksystem mit einer Speicherkapazität von 20 GB.  Der ausgehende Datentransfer beläuft sich auf ca. 15GB pro Monat.

Abbildung 1: Kalkulationsbeispiel Kosten alle Anbieter Vergleich 34

Quelle: Eigene Darstellung

34

Bei der Amazon RDS wurde eine DB-Instance in einer einzelnen Availability Zone gewählt sowie eine Standard Instance der aktuellen Generation gewählt (db3.m3.small). Diese hat folgende Leistungsparameter: 1vCPU, 3.75GB Arbeitsspeicher und Netzwerkauslastung mittel.

16 Durch den vorhergehenden Preisvergleich wird deutlich, welche Kosten bei den einzelnen Anbieter im Vergleich anfallen. Die billigste Variante stellt der Dienst von Amazon RDS dar. Dieser kann durch niedrige Speicherkosten und im Vergleich zur SQL Azure durch eine kostengünstige DB-Small-Instanz punkten. Diese Instanz reicht Leistungstechnisch für obige Annahme aus. Schlusslicht bildet Oracle mit einer sehr hohen Pauschale. Diese rechnet sich für diesen Anwendungsfall absolut nicht.

4.5

Vergleich 5: Skalierbarkeit

Die Skalierbarkeit stellt für Datenbankservices aus der Cloud einen wichtigen Faktor dar und wird auch von allen drei Anbietern im Besonderen hervorgehoben. Es geht um die flexible Bereitstellung zusätzlicher Ressourcen im Fall von steigenden Nutzerzahlen. Hier gilt zu prüfen, welche Skalierungsmethoden seitens der Anbieter zur Verfügung stehen. Klare Vorteile von Skalierung sind: Die Verteilung von Lastspitzen und stetig wachsender Bedarf nach Ressourcen (CPU und Speicher) kann befriedigt werden. 35

Amazon RDS bietet eine flexible (vertikale) Skalierung der Rechenressourcen oder der Speicherkapazität für die einzelnen Datenbankinstanzen an. Über die API „ModifyDBInstance“ oder direkt über die AWS Management Console kann dies dementsprechend angepasst werden. Dabei muss lediglich eine Änderung der DBInstance-Klasse vorgenommen werden. 36

Microsofts Produkt SQL Azure wird auf den gleichen Servern wie die Microsoft Azure Plattform betrieben. Diese werden alle von Microsoft gehostet und stetig gewartet. Die Hardware auf den riesigen Azure-Plattform-Farmen ist standardisiert. Bei der SQL Azure werden, falls eine Zunahme der Arbeitsauslastung besteht und zusätzliche Ressourcen erforderlich sind, die Daten horizontal über mehrere Datenbanken partitioniert. In diesem Modell werden Datenbanken als

35 36

Vgl. Zühlke (URL). Vgl. Amazon (URL1).

17 „Sharding“ bezeichnet. 37 Die Azure SQL-Datenbank unterstützt zwei Methoden zum Implementieren von Sharding: 

Beim benutzerdefiniertem Sharding wird der Anwendungscode über mehrere Datenbanken verwendet.



„Durch die Verbundfunktion werden Daten automatisch horizontal über einen Verbundverteilungsschlüssel horizontal partitioniert.“ 38

Die Oracle Database Cloud Service bietet im Vergleich zu den beiden anderen Services die gleiche Skalierungsmöglichkeit wie Microsofts SQL Azure Lösung auf Basis horizontaler Partitionierung der Datenbankcluster von Oracle an.

4.6

Vergleich 6: Performance

Um eine gute Vergleichbarkeit zu erreichen soll für alle drei Anbieter dieselbe Datenbank aufgesetzt werden. In diesen werden dann wiederum dieselben Daten geschrieben (INSERT) gelesen (SELECT), aktualisiert (UPDATE) und die jeweiligen Zugriffszeiten verglichen.

Um die Testdatenbank mit Daten zu füllen, wurde ein MySQL-Skript der FU Berlin 39 ausgeführt. Dies wurde zunächst mit Hilfe von Heidi-SQL auf der zuvor angelegten Amazon MySQL-Datenbank ausgeführt. Um die Daten auf die in Azure angelegter MSSQL-Testdatenbank zu übertragen, wurde das Tool „Microsoft SQL Server Migration Assistant for MySQL“ 40 verwendet. Mit diesem ist es möglich sich auf zwei Datenbankserver zu verbinden und einzelne Tabellen, Views oder eine komplette Datenbank von einer MySQL Datenbank auf einem beliebigen Server, auf eine Azure Datenbank zu migrieren (oder umgekehrt).

Da in Oracle bereits eine (MySQL-) Testdatenbank angelegt ist, wurde das Skript direkt in der Browseranwendung ausgeführt. Dazu mussten die Hochkommata des Basisskripts entfernt werden, da es ansonsten nicht ausgeführt wurde.

37 38

Vgl. Microsoft (URL3). Microsoft (URL3). 39 http://www.mi.fu-berlin.de/wiki/pub/SE/ThesisInstituteMapEntwurf/InstMap_DB.sql 40 http://www.microsoft.com/en-us/download/details.aspx?id=42657

18 In allen drei Datenbanken ist nun eine Datenbank mit sieben Tabellen (vgl. Abbildung 2).

Abbildung 2: Tabellen in der Amazon RDS Beispieldatenbank

Quelle: Eigene Darstellung

Um die Performance für das Schreiben zu testen wurden die Beispieldaten aus dem Skript für die „Gebaeude“-Tabelle in Notepad vervielfacht. Abbildung 3 zeigt diese Tabelle mit einigen Beispieldaten.

Abbildung 3: Tabelle "Gebaeude der Beispieldatenbank

Quelle: Eigene Darstellung

Der Test zur Einfügegeschwindigkeit (INSERT) wurde mit jeweils 50, 100, 200 und 400 Zeilen in die Tabelle „Gebaeude“ durchgeführt.

Der Lesetest (SELECT * FROM Gebaeude;) jeweils für die Tabelle mit 50, 100 und 200 und 400 enthaltenen Datensätzen.

Der Test zur Geschwindigkeit des Aktualisierungsvorgangs (UPDATE Gebaeude SET GebaeudeBEZ='neues Gebaeude', Strasse ='neue Strasse' WHERE PLZ='14195';)

19 wurde ebenfalls jeweils auf der Tabelle mit 50, 100, 200 und 400 Zeilen Inhalt durchgeführt.

Da mit der Desktopanwendung von Oracle (SQL Developer) keine Abfragen auf der Oracle Datenbank durchgeführt werden konnten und die OracleBrowserverwaltung nur Abfragen bis 32000 Zeichen (ca. 200 Zeilen INSERT) (siehe Abbildung 4) zulässt, wurde der Performancetest zur Schreibgeschwindigkeit für die Oracle Datenbank mit lediglich 50, 100 und 200 Zeilen durchgeführt. Die Lese- und Updatetests dann jeweils für die Tabelle mit 50, 100 und 200 und 400 enthaltenen Datensätzen.

Abbildung 4: Oracle Fehlermeldung bei mehr als 32.000 Zeichen

Quelle: Eigene Darstellung

Für die Abfragen in Oracle wurde, wie bereits erwähnt, die Browserverwaltung von Oracle genutzt. Die Abfragen für die Azure-Datenbank wurden sowohl im Browser als auch mit dem Desktopanwendung Microsoft SQL Server Management Studio (MS SQL SMS) erstellt. Mit dem Tool Heidi SQL wurden die Abfragen auf der Amazon RDS Datenbank durchgeführt.

In nachfolgenden Abbildungen sind die Ergebnisse der Tests in Diagrammen dargestellt. In Abbildung 5 der Einfügestest in Abbildung 6 der Lesetest und in Ab-

20 bildung 7 der Aktualisierungstest. Alle Diagramme sind zur besseren Anschaulichkeit logarithmisch skaliert.

Abbildung 5: Dauer inserts in "ms"
1000000 100000 10000 Zeit in ms 1000 100 10 1 50 100 Inserts Quelle: Eigene Darstellung 200 400 38 5 6 92 1113 170 2531 94 62 7050 15165 113694 34596

Oracle Browser Azure Browser MS SQL SMS HeidiSQL für AWS RDS

Abbildung 6: Dauer Selects in "ms"
10000 1162

1000 Zeit in ms 172 100 11 3 1 50 100 Selects 4 5 318

625

Oracle Browser 21 1113 39 25 19 Azure Browser MS SQL SMS HeidiSQL für AWS RDS

10

6

7

200

400

Quelle: Eigene Darstellung

21 Abbildung 7: Dauer Updates in "ms"
10000 1698 1000 238 Zeit in ms 100 15 4 5 7 27 1517 Oracle Browser 50 33 25 Azure Browser MS SQL SMS HeidiSQL für AWS RDS 878 452

10

9

9

1 50 100 Updates Quelle: Eigene Darstellung 200 400

Es lässt sich erkennen, dass sich die verschiedenen Programme und Anbieter bei den Leseabfragen bis auf die Abfragen über HeidiSQL bei AWS RDS kaum unterscheiden und extrem schnell sind. Bei den Schreibvorgängen lässt sich feststellen, dass AWS RDS über HeidiSQL im Vergleich zu den übrigen Anbietern extrem langsam ist (über 30 Sekunden für das Schreiben von 200 Zeilen). Oracle schneidet im Vergleich zu den beiden Microsoft Produkten etwas schlechter ab. Aktualisierungen lassen sich mit allen vier Probanden im Vergleich zu den Inserts sehr schnell durchführen (ca. 1,3 fache Dauer von Selects). Heidi SQL schneidet hier wiederum mit Abstand am schlechtesten ab.

4.7

Vergleich 7: Verfügbarkeit, Replizierung und Backup

Bei relationalen Datenbanken spielt die Verfügbarkeit der gespeicherten Informationen eine essentielle Rolle. Es muss untersucht werden, wie mit einem Ausfall umgegangen wird und welche Verfügbarkeiten zugesichert werden.

Microsoft Azure bietet unabhängig von der Version zwei integrierte Rechenzentrumsreplikate für jede SQL-Datenbank und ein Service Level Agreement mit

22 99,9% Verfügbarkeit. 41 Das Azure Backup speichert automatisch und dezentral wichtige Serverdaten, welche vor der Übertragung verschlüsselt und in verschlüsselter Form in Azure gespeichert werden. Nach der Datensicherung in der Cloud können berechtigte Benutzer Sicherungen auf einem beliebigen Server problemlos wiederherstellen. Bei inkrementellen Sicherungen werden nur Änderungen an Dateien in die Cloud übertragen. Dadurch wird der Speicher effizient genutzt, die Bandbreitenauslastung reduziert und eine Zeitpunktwiederherstellung mehrerer Datenversionen ist möglich. 42 Microsoft macht keine Angaben darüber, was passiert, wenn die versprochene Verfügbarkeit von 99,9% unterschritten wird.

Amazon RDS bietet mit automatischen Backups, DB-Snapshots, automatischer Host-Erzeugung und Multi-AZ-Bereitstellung mehrere Funktionen an, um die Zuverlässigkeit von Datenbanken zu verbessern 43 und bietet dem Nutzer mehr Handlungsspielraum als Microsoft. Die automatischen Backups sind standardmäßig aktiviert und ermöglichen eine zeitpunktbezogene Wiederherstellung der Datenbankinstanz. Amazon RDS sichert bis zu 35 Tage die Datenbank und Transaktionsprotokolle für einen benutzerdefinierten Zeitraum. So ist eine Wiederherstellung innerhalb dieses Zeitraumes, ausgeschlossen der letzten fünf Minuten, möglich. DB-Snapshots sind vom Benutzer initiierte Backups der Datenbankinstanz, die zu jedem beliebigen Zeitpunkt erstellt werden können. Diese werden so lange gespeichert, bis sie vom Benutzer gelöscht werden. Mit Hilfe der automatischen Host-Erzeugung wird im Falle eines Hardwareausfalls die Datenverarbeitungsinstanz automatisch ersetzt. Durch die Multi-AZ-Bereitstellung wird automatisch eine primäre Datenbankinstanz erstellt und repliziert die Daten synchron in einer Standby-Instanz in einer anderen Availability Zone (AZ) und wird dort in ihrer eigenen physisch unabhängigen Infrastruktur ausgeführt. Kommt es zu einem Ausfall von Infrastruktur (z.B. Instanz-Absturz, Speicherausfall oder Netzwerkunterbrechung) führt Amazon RDS automatisch ein Failover auf die Standby-Instanz aus, sodass der Datenbankbetrieb nach Abschluss des Failovers fortgesetzt werden kann. Der Endpunkt der DB-Instanz bleibt nach einem Failover gleich und der Datenbankbetrieb kann ohne manuelle Eingriffe fortgesetzt werden. 44 Amazon

41 42

Vgl. Microsoft (URL4). Vgl. Microsoft (URL5). 43 Vgl. Amazon (URL2). 44 Vgl. Amazon (URL3).

23 RDS bietet in seinem Service Level Agreement eine 99,95% Verfügbarkeit für Multi-AZ-Datenbankinstanzen an. Wird die Verfügbarkeit unterschritten, erhält der Kunde einen Preisnachlass 45 (weniger als 99,95% aber mehr als 99,0%: 10% und bei weniger als 99%: 25% 46).

Im Gegensatz zu Microsoft und Amazon macht Oracle keine prozentualen Angaben, wie hoch die Verfügbarkeitsrate der Datenbank ist. Folglich gibt es keine Angaben dazu, welche Konsequenzen sich bei einer „nicht Verfügbarkeit“ ergeben. Oracle bietet für alle erdenklichen Fehler Lösungen an, die wie folgt beschrieben werden. Zum Schutz bei einem Festplattenfehler spiegelt Oracle die Daten dreifach. Es werden automatisch Kopien der Daten erstellt, auch wenn zwei Festplattenfehler gleichzeitig auftreten sollten. Um den Zugriff der Daten auch bei Serverfehlern zu schützen wird eine Standby-Datenbank in einer separaten physischen Maschine benutzt.

Ein Knoten- oder Instanz Fehler wird durch Oracle Application Cluster (RAC) umgangen, da durch Oracle RAC beim Ausfall eines Knotens/Instanz automatisch über eine andere Instanz auf die Daten zugegriffen wird. Auch ist es möglich die Daten in den Zustand eines früheren Zeitpunktes zurück zu setzen. 47 In nachfolgender Tabelle 10 werden die wichtigsten Erkenntnisse aller drei Anbieter im direkten Vergleich zusammengefasst.

45 46

Vgl. Amazon (URL4). Vgl. Amazon (URL5). 47 Vgl. Oracle (2013).

24 Tabelle 10: Gesamtvergleich – Replikation, Verfügbarkeit und Backup SQL Azure
Garantierte Verfügbarkeit (in %) Transparente Definition eines Ausfalls Replikation der Daten Automatisch zwei integrierte Rechenzentrumsreplikate für jede SQLDatenbank Keine Angaben (99,0%: 10% und bei weniger als 99% 25% ). Automatische Backups DB-Snapshots Automatische HostErzeugung Multi-AZBereitstellung Automatisch 3 Fache Spiegelung der Daten
50

Amazon RDS
99.95% 49

Oracle DB
Keine Angaben

99,9% 48

keine Angaben

4.8

Vergleich 8: Sicherheit

Um die Daten in der Azure SQL-Datenbank zu schützen verhindert die Firewall sämtliche Zugriffe auf den Azure SQL-Datenbank-Server bis vom Benutzer angegeben wird, welche Computer zugriffsberechtigt sind. Zur Konfiguration können Firewallregeln erstellt werden, die Bereiche zulässiger IP-Adressen angeben. Firewallregeln können auf Server- und Datenbankebene erstellt werden. Auf Serverebene regelt die Firewall auf welche Server zugegriffen werden darf während die Firewallregeln auf Datenbankebene den Zugriff auf einzelne Datenbanken steuern. 51 Die Kommunikation zwischen Microsoft Azure SQL-Datenbank und der Anwendung muss per SSL verschlüsselt werden. Werden Zertifikate von der Clientanwendung bei der Verbindungsherstellung nicht überprüft ist die Verbindung für Man-in-the-Middle-Angriffe anfällig. 52 Von Microsoft Azure SQLDatenbank wird ausschließlich die SQL Server-Authentifizierung unterstützt. Eine

48 49

Vgl. Microsoft (URL6). Vgl. Amazon (URL3). 50 Vgl. Amazon (URL5). 51 Vgl. Microsoft (URL 7). 52 Vgl. Microsoft (URL 8).

25 Windows-Authentifizierung ist nicht möglich. Bei jeder Verbindung müssen Benutzer Anmeldeinformationen (Anmeldung und Kennwort) angeben werden. 53

Bei Microsoft Azure SQL-Datenbanken werden dieselben Datenbankrollen unterstützt wie bei einer lokalen Instanz von SQL Server. 54 SQL Server bietet verschiedene Methoden und Tools zum Konfigurieren der Sicherheit für Benutzer, Dienste und andere Konten für den Zugriff auf das System. 55 SQL Server unterstützt vier Typen von Rollen: Feste und Benutzerdefinierte Server- bzw. Datenbankrollen. 56

Auch Amazon stellt zur Sicherung der Datenbankinstanz eine Reihe von Mechanismen bereit. Die Konfiguration der Firewall-Einstellungen steuert die Netzwerkzugriffe auf die Datenbank. 57 Die Datenbankinstanz kann in der Amazon Virtual Private Cloud (Amazon VPC) ausgeführt werden. Mit Amazon VPC kann eine virtuelle Netzwerkumgebung in einer privaten und isolierten Umgebung der Amazon Web Service (AWS)-Cloud erstellt werden. In diesem Bereich hat der Anwender die vollständige Kontrolle über private IP-Adressbereiche, Subnetze, Routing-Tabellen und Netzwerk-Gateways. 58 Mit Amazon RDS kann gesteuert werden, welche Berechtigungen Benutzer und -Benutzergruppen für bestimmte Amazon RDS-Ressourcen (z.B. Instances, DB Snapshots, DB Parameter Groups, DB Event Subscriptions, DB Options Groups) haben.

Alle Daten, welche in der Oracle Cloud gespeichert sind profitieren von der Transparent Data Encryption (TDE). TDE verschlüsselt gespeicherte Daten zum Schutz vor unerlaubten Datenzugriffen. Die Ver- und Entschlüsselung der Daten erfolgt automatisch und erfordert keine programmatischen Schritte des Nutzers. Um die Cloud Datenbank vor schädlichem Code zu schützen werden die Daten zu einem „Secure FTP Server“ geschickt, wo sie vor dem Laden in die Datenbank auf Viren überprüft werden. Dieser Prozess komprimiert gleichzeitig die Daten,

53 54

Vgl. Microsoft (URL 9). Vgl. Microsoft (URL10). 55 Vgl. Microsoft (URL11). 56 Vgl. Microsoft (URL12). 57 Vgl. Amazon (URL2). 58 Vgl. Amazon (URL1).

26 um die benötigte Zeit zum hochladen zu reduzieren. Der Oracle Application Express unterstützt mehrere Authentifizierungs-Schemata, um einen Benutzer richtig zu identifizieren. Es können Berechtigungs-Schemata auf Ebene der Benutzerkennung verwendet werden, welche Zugriffe zu speziellen Bereichen erlauben oder verbieten. 59 Nachfolgende Tabelle 11 fasst noch einmal die wichtigsten Funktionen aller drei Anbieter im Vergleich zusammen.

Tabelle 11: Gesamtvergleich – Sicherheit Leistung/Service
Firewall Sicherung des Datenzugriffs Authentifizierung ausschließlich die SQL ServerAuthentifizierung (WindowsAuthentifizierung wir nicht unterstützt) Rollenbasierter Zugriff Ja. Standardmäßige SQL-Datenbank/Anwendungsrollen. Ja AWS-IAMBenutzer / Gruppen Ja. Standardmäßige SQL-Datenbank/Anwendungsrollen Benutzername / Kennwort Ja SSL-Verschlüsselt

SQL Azure

Amazon RDS
Ja Amazon VPC

Oracle DB
Keine Angaben Transparent Data Encryption (TDE) Mehrere Authentifizierungs-Schemata (nicht näher beschrieben)

5 Zusammenfassende Bewertung
Es lässt sich festhalten, dass in puncto der Benutzerfreundlichkeit (Usability) und Nutzungsmöglichkeiten Amazon mit seinem RDS Dienst Vorteile gegenüber den anderen zwei Diensten besitzt. Zwar kann Microsoft mit seinen bereitgestellten Tools zur Verwaltung der Datenbanken Amazon hinreichend das „Wasser reichen“, jedoch bietet es wie beschrieben, diese Möglichkeiten nur auf Basis des MS SQL Server ab Version 2008 R2. Das könnte für Inkompatibilitäten bei der Migration sorgen und höhere Aufwände erzeugen, da viele manuelle Anpassungen getätigt werden müssen. Oracle hingegen bietet mit seinem Oracle Database

59

Vgl. Oracle (2013), S. 7 ff.

27 Cloud Service aktuell nur ein Datenbank-Schema an, dass jedoch die Migration auf alle von Oracle Database unterstützen Systeme unterstützt. Ein Kritikpunkt für Amazon könnte die nicht vorhandene online-Bearbeitungsmöglichkeit der Datenbanken sein, allerdings wird diese bei professioneller Verwendung eher selten genutzt werden und man hat die freie Wahl des Tools bei Amazon.

Unterschiede lassen sich weiterhin bei der Skalierbarkeit feststellen: Amazon bietet eine vertikale Skalierung an, die jedoch vom Kunden manuell durchgeführt werden muss (durch Instanz-Klassenveränderung). Microsoft und Oracle hingegen bietet eine horizontale Skalierung an, bei der die Lastspitzen durch die Verteilung und Partitionierung der Datenbanken gesenkt werden (automatisch). Aus Sicht der Flexibilität stellt die vertikale Skalierung der Amazon RDS einen Vorteil, da der Kunde selbst entscheiden kann, welche zusätzliche Hardware- und Speicherressourcen er benötigt. Aus Kostensicht unterscheiden sich alle drei Anbieter in vielen Punkten. Bei Amazon wird je nach gewählter DB-InstanzLeistungsklasse, dem benötigten Speicherplatz und nach ausgehendem Datenverkehr berechnet. Jedoch können sehr viele Kosten durch Zusatzfunktionen wie beispielsweise der Multi-AZ-Replikation entstehen. Die Lösungen von Oracle und Microsoft hingegen berechnen jeweils nach einer sehr hohen Pauschale oder nach dem tatsächlich genutzten Datenbankspeicher und dem ausgehenden Verkehr. Jedes Unternehmen muss selbst abwägen, welche Lösung für ihre Anforderungen am meisten Sinn macht.

Beim Vergleich der Performance zeigt sich, dass Amazon um einiges längere Reaktionszeiten, vor allem beim Schreiben, hat. Ist die Datenbank erst einmal angelegt und mit Daten gefüllt unterscheiden sich die Reaktionszeiten der Anbieter nur noch geringfügig. Möglicherweise kann die Reaktionszeit durch Verwendung eines anderen Verwaltungstools auch für Amazon noch gesteigert werden, dies wurde jedoch an dieser Stelle nicht evaluiert.

Hinsichtlich der Replikation, Verfügbarkeit und Backup setzen die drei Anbieterhohe Maßstäbe. Windows verspricht eine Verfügbarkeit von 99,9%. Die Daten werden für den Benutzer voll automatisch zweifach vorgehalten und die Wiederherstellung von Datenversionen ist problemlos. Amazon RDS verspricht eine Ver-

28 fügbarkeit von 99,95% und bietet gestaffelten Preisnachlass bei Unterschreitung der Verfügbarkeit. Neben einem vollautomatischen Backup kann der Benutzer bei Amazon eigenständig Backups (DB Snapshots) initiieren, welche beliebig lang gespeichert werden. Somit hat der User hier mehr Eingriffsmöglichkeiten als bei den anderen beiden Anbietern. Oracle DB verspricht für jedes mögliche Problem eine Lösung, so dass ein Datenverlust unmöglich scheint. Eine Prozentuale Angabe zur Verfügbarkeit und eine Konsequenz bei nicht Verfügbarkeit kommuniziert Oracle jedoch nicht.

Auch zum Thema Sicherheit geben die Anbieter auf externe sowie interne Zugriffe auf Basis verschiedener Technologien eine Antwort. Bei Microsoft Azure kann ohne die Konfiguration der Firewall keine Verbindung zur Datenbank hergestellt werden. Erst durch das Freischalten werden entsprechende IP-Adressen freigegeben. Ähnlich ist dies bei Amazon RDS. In den sogenannten Security Groups müssen die jeweiligen IP Adressen zur Freischaltung angegeben werden. Bei Oracle DB muss der Anwender zunächst keine Einstellungen vornehmen erläutert aber in einer Dokumentation, dass Daten über TDE verschlüsselt sind und somit vor unerlaubten zugriffen geschützt wird. Zusätzlich werden die Daten von einem Secure FTP Server auf Viren gecheckt. Alle drei Anbieter haben AuthentifizierungsSchemata, so muss sich der Benutzer vor dem Zugriff auf die Datenbank mit Benutzername und Kennwort einloggen. Ebenso unterstützen alle drei Benutzerrollen, damit die Berechtigungen der Benutzer gesteuert werden können.

29

Literaturverzeichnis
Amazon (URL1): RDS Faqs http://aws.amazon.com/de/rds/faqs/. (Abgerufen am 27.07.2014)

Amazon (URL2): Amazon Relational Database Service http://aws.amazon.com/de/rds/. (Abgerufen am 25.07.2014)

Amazon (URL3): Amazon RDS Details http://aws.amazon.com/de/rds/details. (Abgerufen am 28.07.2014)

Amazon (URL4): Amazon announces RDS General Availability and Service Level Agreement. http://aws.amazon.com/de/rds/faqs/. (Abgerufen am 28.07.2014)

Amazon (URL5): Amazon RDS Service Level Agreement https://aws.amazon.com/rds/sla/. (Abgerufen am 28.07.2014)

BSI – Bundesamt für Sicherheit in der Informationstechnik (URL): Cloud Computing Grundlagen. https://www.bsi.bund.de/DE/Themen/CloudComputing/Grundlagen/Gru ndlagen_node.html (Abgerufen am 25.06.2014)

Dimovski, Dime (2013): Database management as a cloud-based service for small and medium organizations. Masaryk University. Masterthesis 2013.

30 Groenewald, Thomas und Christian Küwen (2013): Datenbanken in der Cloud. http://winfwiki.wi-fom.de/index.php/Datenbanken_in_der_Cloud (Abgerufen am 24.06.2014)

Marinescu, Dan C.: Cloud Computing Theory and Practice. 1. Boston : Morgan Kaufmann, 2013. Bd. 1. Auflage.

Microsoft (URL1): SQL-Datenbank http://azure.microsoft.com/de-de/services/sql-database/. (Abgerufen am 27.06.2014)

Microsoft (URL2): Erste Schritte bei der Entwicklung für SQL Azure http://msdn.microsoft.com/de-de/magazine/gg309175.aspx (Abgerufen am 28.06.2014)

Microsoft (URL3): Horizontales Skalieren von Azure SQL-Datenbanken http://msdn.microsoft.com/de-de/library/azure/dn495641.aspx (Abgerufen am 28.06.2014)

Microsoft (URL4): SQL-Database http://azure.microsoft.com/en-us/services/sql-database (Abgerufen am 29.06.2014)

Microsoft (URL5): Azure Backup http://azure.microsoft.com/de-de/services/backup/ (Abgerufen am 29.06.2014)

Microsoft (URL6): Microsoft Service Level Agreement http://azure.microsoft.com/de-de/support/legal/sla/ (Abgerufen am 29.06.2014)

Microsoft (URL7): Firewall für die Azure SQL-Datenbank http://msdn.microsoft.com/de-de/library/azure/ee621782.aspx (Abgerufen am 30.06.2014)

31 Microsoft (URL8): Sicherheitsrichtlinien für und Einschränkungen von Azure SQL-Datenbanken. http://msdn.microsoft.com/de-de/library/azure/ff394108.aspx (Abgerufen am 30.06.2014)

Oracle (2013): Oracle Cloud Database Service. Whitepaper 2012. www.oracle.com%2Fus%2Fdatabase-cloud-service-wp-1844123.pdf (Abgerufen am 29.06.2014)

Oracle (URL): Oracle Cloud Database Service Pricing https://cloud.oracle.com/database?tabID=1383678929090 (Abgerufen am 30.06.2014)

O. Verf. Quantum (Hrsg.) (URL): BIG DATA: Beherrschung von explosivem Datenwachstum http://whitepaper.computerwoche.de/whitepaper/big-data-beherrschungvon-explosivem-datenwachstum (Abgerufen am 26.06.2014).

pineheadtv. How To Use Amazon RDS (Relation Database Service) To Host MySQL. https://www.youtube.com/watch?v=FLY87sQtEts. (Abgerufen am 23.05.2014)

Schaffner, Jan: Multi Tenancy for Cloud-Based In-Memory Column Databases. Heidelberg, New York, Dordrecht, London : Springer, 2014.

Steiner, René: Grundkurs Relationale Datenbanken. Wiesbaden : Springer, 2014. Bde. 8., erweiterte und überarbeitete Auflage.

Zühlke (URL): Datenbanken für die Cloud. http://blog.zuehlke.com/datenbanken-fur-die-cloud/ (Abgerufen am 29.06.2014)

32

Anhang

Anhang 1: SQL Azure Datenbankinstanz

Anhang 2: SQL Azure Firewall Konfiguration

33 Anhang 3: SQL Azure Entwicklungsumgebung

Anhang 4: SQL Azure – manuell Tabellen erstellen

Anhang 5: SQL Azure - Tabellen mit SQL Anweisung erstellen

34 Anhang 6: SQL Azure - Importfunktion Excel

Anhang 7: Amazon RDS - Datenbankinstanz

Anhang 8: Amazon RDS - Entwicklungsumgebung mit HEIDI SQL

35 Anhang 9: Amazon RDS – Konfiguration der Security Groups

Anhang 10: Oracle Database Cloud Service - Datenbankinstanz

36 Anhang 11: Oracle Database Cloud Service - Entwicklungsumgebung

Anhang 12: Oracle Database Cloud Service - Tabellen anlegen

Anhang 13: Oracle Database Cloud Service - Team Development

Similar Documents

Premium Essay

Dt2503 Unit 3 Assignment

...SCHOOL OF COMPUTING AND IT Diploma in Information Technology March 2014 Semester Assignment Introduction to Database (DIT2503) Assignment Topic Task 1: Knowledge Discovery – Individual (100 Marks) – SUBMISSION WEEK 8 Name: Kevin Yeap Kong Shien Nie Justin Ling Student ID: 0319297 0319226 0319826 No. Title Page 1 Cover Page 1 2 Table Content 2 3 Question 1 3-7 4 Question 2 8 5 Question 3 9 6 Question 4 10-11 7 References 12 Database Question 1: Data Model/Database Model Flat file Flat file data model is model where data was store as a plain text file in a single table. Each line of the table hold each record with field and it is separated by commas or tabs. It cannot contain multiple tables like relational database. All the data stored by flat file, a computer file system will be store in a single...

Words: 2185 - Pages: 9

Free Essay

Cloud Computing

...Cloud Computing Introduction Information technology has been infiltrated into our daily life due to the advent of technology. In business setting, the usage of information technology is omnipresent and information system is widely used among entities. For information system, cloud computing is one of the popular applications for businesses because it can reduce IT cost at the same time facilitating a company in various perspectives. In this essay, a fast-growing company called Airbnb, adopting concept of collaborative consumption, will be analyzed to demonstrate the use of cloud computing. Background Airbnb is an American company founded in 2008, an online platform for people to rent out, list, discover, and book lodging, including private rooms, entire apartments, castles, boats, private islands and other properties around the world. Through online or mobile phone, a transaction can be done conveniently (Airbnb, Inc., 2014). Airbnb has expanded to host more than 500,000 listings across 192 countries since launched in 2008 (King, 2013) and has now served 9 million guests in the fifth year (Lawler, 2013). However, one year after launched, It experienced service administration challenges because of its original cloud computing provider, therefore, Airbnb decided to migrate nearly all of its cloud computing functions to Amazon Web Services (AWS) (Amazon, 2014). Benefits for adopting cloud computing Definition Cloud computing is a type of computing...

Words: 1317 - Pages: 6

Premium Essay

Cloud Database Management System

...Cloud Database Management System IS508E group NO.6 project Group NO.6 members: PENG Yu KALAI Kumaraguru KUTTIKKAT VENUGOPAL Sreehari Contents General business case ............................................................................................................... 1 Introduction and problems ....................................................................................................... 1 The existing technology ............................................................................................................ 2 Challenges of Implementation: ................................................................................................. 9 Reference: ............................................................................................................................... 10 General business case Thanks to the successful management, the business of the company expands very fast. However, the database management system cannot withstand the quickly and greatly increased work load, the break-down frequency increases, which make the decision-making efficiency and customer experience drop. The company tries to turn around this bad trend and poses two solutions: one is to update the present DBMS including hardware, software and human resource; the other one is to make use of SQL Azure from Microsoft to set up cloud environment and transfer the DBMS there. After cost analysis, we find that to reach the same efficiency standard, the cost of...

Words: 3594 - Pages: 15

Premium Essay

Itrust Database Software Security Assessment

...iTrust Database Software Security Assessment Security Champions Corporation (fictitious) Assessment for client Urgent Care Clinic (fictitious) Amy Wees, Brooks Rogalski, Kevin Zhang, Stephen Scaramuzzino and Timothy Root University of Maryland University College Author Note Amy Wees, Brooks Rogalski, Kevin Zhang, Stephen Scaramuzzino and Timothy Root, Department of Information and Technology Systems, University of Maryland University College. This research was not supported by any grants. Correspondence concerning this research paper should be sent to Amy Wees, Brooks Rogalski, Kevin Zhang, Stephen Scaramuzzino and Timothy Root, Department of Information and Technology Systems, University of Maryland University College, 3501 University Blvd. East, Adelphi, MD 20783. E-mail: acnwgirl@yahoo.com, rogalskibf@gmail.com, kzhang23@gmail.com, sscaramuzzino86@hotmail.com and Chad.Root@gmail.com Abstract The healthcare industry, taking in over $1.7 trillion dollars a year, has begun bringing itself into the technological era. Healthcare and the healthcare industry make up one of the most critical infrastructures in the world today and one of the most grandiose factors is the storage of information and data. Having to be the forerunner of technological advances, there are many changes taking place to streamline the copious amounts of information and data into something more manageable. One major change in the healthcare industry has been the implementation...

Words: 7637 - Pages: 31

Premium Essay

Cloud Computin

...Cloud Computing: A Taxonomy of Platform and Infrastructure-level Offerings David Hilley College of Computing Georgia Institute of Technology April 2009 Cloud Computing: A Taxonomy of Platform and Infrastructure-level Offerings David Hilley 1 Introduction Cloud computing is a buzzword and umbrella term applied to several nascent trends in the turbulent landscape of information technology. Computing in the “cloud” alludes to ubiquitous and inexhaustible on-demand IT resources accessible through the Internet. Practically every new Internet-based service from Gmail [1] to Amazon Web Services [2] to Microsoft Online Services [3] to even Facebook [4] have been labeled “cloud” offerings, either officially or externally. Although cloud computing has garnered significant interest, factors such as unclear terminology, non-existent product “paper launches”, and opportunistic marketing have led to a significant lack of clarity surrounding discussions of cloud computing technology and products. The need for clarity is well-recognized within the industry [5] and by industry observers [6]. Perhaps more importantly, due to the relative infancy of the industry, currently-available product offerings are not standardized. Neither providers nor potential consumers really know what a “good” cloud computing product offering should look like and what classes of products are appropriate. Consequently, products are not easily comparable. The scope of various product offerings differ and overlap...

Words: 19454 - Pages: 78

Premium Essay

Big Data (Mongodb, Hbase and Casandra)

...Big Data [Name of Writer] [Name of Institution] Introduction The term Big Data is gaining more followers and popularity. However, despite this trend, not all organizations are clear about how to face the challenge to store, organize, display and analyze large volumes of data. The term Big Data is gaining more followers and popularity. However, despite this trend so evident, not all organizations are clear about how to face the challenge to store, organize, display and analyze large volumes of data. There are multiple techniques in terms of huge database storing approaches that can store petabytes, exabytes and may be zetabytes data. These options are Cassendara, Mongodb and HBase. We will discuss about them one by one and in a proper research method and will compare them in order to contrast their difference and efficiency. Research Background One problem in understanding the phenomenon is that the size of these data sets the volume greatly exceeds the Data warehouse. A plane collects 10 terabytes of information from sensors every 30 minutes flight, while the Stock Exchange of New York collects structured information 1 TB per day. In the context of Big Data, volumes are reaching peta bytes, exa bytes and then soon to zeta bytes. For instance, Apple has just announced that 7 trillion send daily notifications to iOS devices. The explosion of information in social networks, blogs, and emails is characterized the presence of data key...

Words: 3463 - Pages: 14

Free Essay

Nosql Database

...: Abstract NoSQL databases offer a noteworthy change to how venture applications are manufactured, testing to two-decade authority of social databases. The inquiry individuals face is whether NoSQL databases are a fitting decision, either for new extends or to acquaint with existing undertakings. Where they originated from, the nature of the information models they utilize, and the diverse way you need ought to consider utilizing them, why they won't make social databases old, and the essential outcome of bilingual ingenuity. Versatile Search consolidates the force of Apache Lucene (NoSQL since 2001) and the simple to utilize composition free web index that can serve full-content hunt appeal, key-esteem lookups, pattern free investigation demands. The key highlights of Elastic Search with live cases. The discussion won't be a thorough highlight presentation yet rather a review of what and how Elastic Search can accomplish for you. Table of Contents 1. Introduction 2. What is Nosql Database Systems? 3. Relational Database Systems 4. Comparison 5. Conclusions 6. REFERENCES 1. Introduction NoSQL stays for Not Only SQL in like manner declared as noseequel. NoSQL is used for securing epic measure of data made by various source, for instance, facebook(audio, highlight and consistently posts). NoSQL is a non-social database organization structure and speedy information recuperation database. NoSQL databases are passed on and adaptable...

Words: 6247 - Pages: 25

Free Essay

Computer 200 Management

...BIT 200 FINAL STUDY GUIDE • What is the difference between data and information: o Data is a set of discrete, objective facts about events. In an organizational context, data is most usefully described as structured records of transactions. o Information is a message to change the way the receiver perceives something to have an impact on his or her judgment or behavior. • Ex. Your doctor tells you are on the verge of being obese. If you do not want to increase your risk of heart disease or diabetes, then you need to change your eating habits. • What are the reference disciplines in information systems: o Computer Science- Computer Science is the discipline that seeks to build a scientific foundation for topics like computer design, computer programming, information processing, algorithmic solutions or problems, and the algorithmic process itself. o Management Science-The discipline using math and other analyzed methods to help make better decisions in business. Field includes- decision analysis, probability, and math modeling. • Management Science body of knowledge – uses quantitative approaches to decision making and is referred to as management science, operations research, and decisions science. • What do processors do: o A processor interprets computer program instructions and processes data. • Moore’s Law- Moore’s Law state that processor speeds will double every 18 months • The different kinds of storage memory are: kilobyte, megabyte, gugabyte, terabyte...

Words: 6356 - Pages: 26

Free Essay

Information Technology

...Chapter One: Information Systems in Global Business Today -Information system: A set of interrelated components that collect, retrieve, process, store, and distribute info to support decision making and control in an organization –Six building blocks of computers: input, output, memory, arithmetic/logic unit, control unit and files. Control unit and arithmetic/logical unit together known as CPU (central processing unit). –Arithmetic/Logic Unit: carries out mathematical operations and logical comparisons, consist of very large scale integrated circuits, can perform billion operations per second, numbers taking from memories as input and results stored in memory as output. -Control Unit: controls the other five compo of the comp system, enables the comp to take advantage of speed and capacity of its other compo, list of operations called a program, these operations read from memory, interpreted and carried out one at a time (stored program concept). –Cache memory: high speed, high cost storage, used as intermediary between control unit and main memory, compensates for speed mismatches built into the comp system. –Multiple processor configurations: a comp system usually contains more than one processor, dual processor contain two physical separate processors as two separate chips, dual core contain two complete processors manufactured as a single chip, dual processor are better and faster. –Input: devices allow users to enter data into the comp for processing, common devices: keyboard...

Words: 3433 - Pages: 14

Free Essay

No Sql Databases

...INSY 5337 Data Warehousing – Term Paper NoSQL Databases: An Introduction and Comparison between Dynamo, MongoDB and Cassandra Authored ByNitin Shewale Aditya Kashyap Akshay Vadnere Vivek Adithya Aditya Trilok Abstract Data volumes have been growing exponentially in recent years, this increase in data across all the business domains have played a significant part in the analysis and structuring of data. NoSQL databases are becoming popular as more organizations consider it as a feasible option because of its schema-less structure along with its capability of handling BIG Data. In this paper, we talk about various types of NoSQL databases based on implementation perspective like key store, columnar and document oriented. This research paper covers the consolidated applied interpretation of NoSQL system, depending on the various database features like security, concurrency control, partitioning, replication, Read/Write implementation. We also would draw out comparisons among the popular products and recommend a particular NoSQL solution on the above mentioned factors. 1. Introduction Until recently, Relational database systems have been on the forefront of data storage and management operations. The advent of mobile applications that requires real time analysis like GPS based services, banking and social media has led to huge unstructured data being produced every second. Traditional RDBMS systems have found it difficult to cater to these huge chunks of unstructured...

Words: 4246 - Pages: 17

Free Essay

How Data Mining Can Help a Business

...in large relational databases” (N.D.). Oracle helps refine this definition, as this method “provides a way to get at the information buried in the data” (Oracle, N.D.). Oracle goes on to state how data mining helps find “patterns that sometimes elude traditional statistical approaches to analysis because of the large number of attributes, the complexity of patterns, or the difficulty in performing the analysis” (N.D.). There is petabytes of data for many companies and agencies to sort though. Many turn to cloud systems, or run programs that extract the data for them from their sources. UCLA goes on to define data as including operational data, nonoperational data, and Meta data. They use this information to help find associations, relationships, and/or patterns with in the data. They use this to develop knowledge about historical data. Companies like Volvo started to leverage cloud computing. They felt that each car could provide information that improved each car as it was built and driven. They also felt that the information provided by each car could improve the consumer experience while driving one of their cars. To support this, Volvo developed a sensor suite that contained hundreds of sensors and CPU’s within the car itself. This allowed Volvo to use 1.7 terabytes of data and use the information to ensure that their cars evolved. Even the police force uses data mining to assist in solving crimes or preventing crimes. They use Computer Comparison Statistics...

Words: 1503 - Pages: 7

Premium Essay

Res 371 Final Exam

...please read and sign this Final Exam Certificate of Originality before starting. FINAL EXAM CERTIFICATE OF ORIGINALITY I certify that the attached final exam is my original work. I am familiar with, and acknowledge my responsibilities, which are part of, the University of Phoenix Student Code of Academic Integrity. * I will complete the final exam with my own work and only my own work. * I will not submit the work of any other person. * I will not collaborate with any other person. * I will not engage in any activity that would dishonestly improve my results, or improve or hurt the results of others. This includes searching the Internet for exam answers. * I will not post answers to problems that are being used to assess student performance. * You may use materials available in UOPX eCampus classroom, course notes, and the textbook(s) for the final exam. All answers are in the textbook. * You may use any calculator that you are comfortable with using. I further agree that my name typed on the line below is intended to have, and shall have, the same validity as my handwritten signature. Student's signature (name typed here is equivalent to a signature): Name: | | INSTRUCTIONS Allow yourself plenty of time. Best results have come from students who worked on this a little each day. Students have indicated that it took much longer than two hours. Read each question carefully. Primarily use the textbook and course materials to help...

Words: 1584 - Pages: 7

Free Essay

Literature Review

...International Journal of Scientific and Research Publications, Volume 4, Issue 10, October 2014 ISSN 2250-3153 1 A Review Paper on Big Data and Hadoop Harshawardhan S. Bhosale1, Prof. Devendra P. Gadekar2 1 Department of Computer Engineering, JSPM’s Imperial College of Engineering & Research, Wagholi, Pune Bhosale.harshawardhan186@gmail.com 2 Department of Computer Engineering, JSPM’s Imperial College of Engineering & Research, Wagholi, Pune devendraagadekar84@gmail.com Abstract: The term ‘Big Data’ describes innovative techniques and technologies to capture, store, distribute, manage and analyze petabyte- or larger-sized datasets with high-velocity and different structures. Big data can be structured, unstructured or semi-structured, resulting in incapability of conventional data management methods. Data is generated from various different sources and can arrive in the system at various rates. In order to process these large amounts of data in an inexpensive and efficient way, parallelism is used. Big Data is a data whose scale, diversity, and complexity require new architecture, techniques, algorithms, and analytics to manage it and extract value and hidden knowledge from it. Hadoop is the core platform for structuring Big Data, and solves the problem of making it useful for analytics purposes. Hadoop is an open source software project that enables the distributed processing of large data sets across clusters of commodity servers. It is designed to...

Words: 5034 - Pages: 21

Free Essay

Syllabus

...SCHEME OF EXAMINATION FOR MASTER OF COMPUTER APPLICATIONS (MCA) (SIX-SEMESTER Programme) |Semester – I | |Paper |Title of the Paper |Duration |Maximum Marks |Total | |No. | |Of Exam | | | | | | |Theory |Sessional* | | |MCA-101 |Computer Fundamentals and Problem Solving Using C |3 Hours |80 |20 |100 | |MCA-102 |Computer Organisation |3 Hours |80 |20 |100 | |MCA-103 |Discrete Mathematical Structures |3 Hours |80 |20 |100 | |MCA-104 |Software Engineering |3 Hours |80 |20 |100 | |MCA-105 |Computer Oriented Numerical and Statistical Methods |3 Hours |80 |20 |100 | |MCA-106 |Software Laboratory - I |3 Hours | | |100 | | |C (Based on MCA-101) |...

Words: 13848 - Pages: 56

Free Essay

Oracle's Acquisition Strategy

...It has made its name in the software industry as the pioneer of relational database software, which lets businesses store and manage large amounts of data. Oracle began making software to organize data in the 1970s with their focus on relational database software. This software is used for storing data and relating different pieces to one another. The company's operations are separated into three divisions: software, hardware and services. Oracle's software licenses and software support have consistently brought in around 80% of their total revenue. The key segments Oracle operates in are as follows: ORACLE REVENUE-37BILLION$ SOFTWARE 77% OF TOTAL REVENUES NEW SOFTWARE LICENSES 37% OF TOTAL REVENUES SOFTWARE LICENSE UPDATES 40% OF TOTAL REVENUES HARDWARE 13% OF TOTAL REVENUES HARDWARE SYSTEMS PRODUCTS 8% OF TOTAL REVENUES HARDWARE SYSTEMS SUPPORT 5% OF TOTAL REVENUES SERVICES 10% OF TOTAL REVENUES CONSULTING SERVICES MANAGED CLOUD SERVICES EDUCATION SERVICES ORACLE REVENUE-37BILLION$ SOFTWARE 77% OF TOTAL REVENUES NEW SOFTWARE LICENSES 37% OF TOTAL REVENUES SOFTWARE LICENSE UPDATES 40% OF TOTAL REVENUES HARDWARE 13% OF TOTAL REVENUES HARDWARE SYSTEMS PRODUCTS 8% OF TOTAL REVENUES HARDWARE SYSTEMS SUPPORT 5% OF TOTAL REVENUES SERVICES 10% OF TOTAL REVENUES CONSULTING SERVICES MANAGED CLOUD SERVICES EDUCATION SERVICES Oracle develops and sells database and middleware as well as business application software and offers...

Words: 6241 - Pages: 25