Mindblowing N.V.
Interactieve sessie: technologie
De databases achter MySpace
Casestudyvragen (blz 182)
1. Wat voor databases en databaseservers gebruikt MySpace?
MySpace heeft een 20 terabyte database van Isilon IQ 1920i servers. De database slaat geüploade media-bestanden van gebruikers (afbeeldingen, video's , muziek) op. Het draait op 3,2 GHz Intel Xeon-processors en heeft 10 server knooppunten met elk een opslagruimte van 1,92 TB. De knooppunten communiceren op het InfiniBand, die serieverbindingen legt tussen elk serverknooppunt. Data-overdracht snelheden zijn in de buurt van 3 GB/s.
(Bron: http://computer.howstuffworks.com/internet/social-networking/networks/myspace2.htm)
2. Waarom is een databasetechnologie zo belangrijk voor een bedrijf zoals MySpace?
Omdat op MySpace tientallen miljoenen gebruikers voortdurend bezig zijn met het bijwerken van hun content en dus ook die op de website. De databasetechnologie moet een stevig fundament bieden om dit zo probleemloos mogelijk te kunnen laten gebeuren.
3. Hoe effectief is MySpace in het ordenen en opslaan van gegevens op zijn site?
Effectiviteit gaat samen met nauwkeurige, tijdige en relevante informatie. Met name op het gebied van tijdige informatie zijn er voor MySpace nog stappen te maken. De website krijgt relatief bekeken veel klachten die betrekking hebben op overbelasting van de website. Deze overbelasting zorgt er in sommige gevallen voor dat inloggen onmogelijk wordt voor een bepaalde periode. Dit heeft ten gevolge dat informatie niet tijdig kan worden geleverd. Oftewel: op het gebied van effectiviteit ligt er voor MySpace ruimte voor verbetering.
4. Welke gegevensbeheerproblemen zijn er ontstaan? Hoe heeft MySpace deze problemen opgelost of geprobeerd op te lossen?
Problemen die voornamelijk voortkomen uit de stormachtige groei van de website. De databasetechnologie moest telkens aangepast worden door het groeiende aantal bezoekers. De website heeft dit proberen op te lossen door webservers en databaseservers toe te voegen. Daarnaast werd de structuur dusdanig aangepast zodat verschillende functies van de website worden ondersteund door afzonderlijke databases. Dit leidde echter tot problemen, doordat sommige functies te groot werden voor één database. Een aantal problemen en oplossingen later is de website overgegaan op een gevirtualiseerde opslagarchitectuur met één opslagruimte voor alle toepassingen, waarbij databases gegevens kunnen schrijven naar elke beschikbare schijf. Dit zorgt ervoor dat de kans op een overbelaste schijf afneemt.
Tevens werd in 2005 de infrastructuur versterkt door het installeren van een laag servers tussen de web- en de databaseservers voor het opslaan en leveren van kopieën van regelmatig geopende dataobjecten.
MIS in actie (blz. 182)
1. Wat zijn, op basis van wat je zonder registratie kunt zien, de entiteiten in de MySpace-database?
Voorbeelden van entiteiten zijn Beyonce, Enrique Iglesias en Taylor Swift, maar eigenlijk alle personen waarover gegevens worden verzameld op de website zijn entiteiten.
2. Welke van deze entiteiten hebben gegevens over individuele leden?
Eigenlijk hebben al deze entiteiten gegevens onder individuele leden. Iedere entiteit is een verzameling gegevens over een persoon.
3. Selecteer enkele van deze entiteiten en beschrijf de attributen voor die entiteiten?
Entiteit: Beyonce, attributen: zangeres, website, muziek, woonplaats etc.
Entiteit: Enrique Iglesias, attributen: zanger, woonplaats, model, muziek etc.
Deze opdracht past bij de theorie omdat het hoofdstuk onder meer gaat over databases en databaseservers en het belang van een effectieve database(technologie) voor een website/bedrijf. Daarnaast komen in het hoofdstuk de begrippen ‘entiteiten’ en ‘attributen’ aan bod. Over al deze zaken worden vragen gesteld in deze opdracht aan de hand van een actuele casus.