En översikt över Big Data

En översikt över Big Data

Under senare år har en ny term har blivit vardagsmat i samtal bland affärsmän och IT och programvaruleverantörer: "big data". Denna artikel innehåller en översikt över vilka stora data betyder.

Vad är Big Data

Enkelt uttryckt avser big data allt som gör det möjligt för en organisation att skapa, manipulera och hantera mycket stora datauppsättningar (mätt i terabyte, petabytes, exabytes, etc.) och de anläggningar där de lagras. Distribuerade datacenter, datalager och moln-baserad lagring är gemensamma aspekter av dagens företagsnätverk. Många faktorer har bidragit till en sammanslagning av "big data" och företagsnätverk inklusive fortsatt nedgång i lagringskostnader, mognaden av datautvinning och business intelligence (BI)-verktyg och statliga regleringar och rättsfall som har orsakat organisationer att lagra stora massor av strukturerade och ostrukturerade data inklusive dokument, e-postmeddelanden, röstmeddelanden, textmeddelanden och sociala mediedata. Andra datakällor som fångas, överförs och lagras webbloggar, Internet dokument, Internet söka katalogiserande, samtal detaljposter, vetenskaplig forskningsdata och resultat, militär övervakning, medicinska journaler, videoarkiv och e-handelstransaktioner. Datauppsättningar fortsätter att växa med fler och fler samlas av fjärrsensorer, mobiltelefoner, kameror, mikrofoner, radio frequency identification (RFID) läsare och liknande tekniker. Vissa experter uppskattar att mer än 2.5 quintiljoner byte data skapas varje dag och de flesta industriexperter är överens om att data sort, volym och hastighet (tre "V's") kommer att fortsätta att växa.

Big Data infrastruktur överväganden

Traditionella verksamhet lagring och hantering teknik inkluderar relationsdatabas ledningssystem (RDBMS), nätverken knytet lagring (NAS), storage area network (SAN), informationslager (DW) och business intelligence (BI) analytics. Traditionella datalager och BI analytics system tenderar att centraliseras starkt inom en verksamhetsomfattande infrastruktur. Dessa inkluderar ofta ett centralt datalager med en RDBMS, högpresterande lagring och analysprogram, såsom analytisk online-bearbetning (OLAP) verktyg för gruvdrift och visualisera data. Big data kan omfatta dessa tekniker men ofta kräver andra också. För att bearbeta stora mängder data inom acceptabel tidsperioder, kan stora data behöver distribuerade filsystem, distribuerade databaser, molnberäkning plattformar, Internet lagring och annan skalbar lagringsteknik. Storleken på datauppsättningarna gör det ofta utmanande att lita enbart på relationsdatabaser, och delad lagringssystem som NAS och SAN kan vara för långsam för stora applikationer. Den stationära statistik och data visualisering programvara som används i stora data analytics är lekande nya former av massivt parallell bearbetning som möjliggör snabbare sökning, dela, analysera och visualisera. Verkliga eller nära-real tid information leverans är ett av målen för stora data analytics och denna ökande business intresse i minnet processystem som gör analyser i realtid genom att föra stora datamängder i minnet.

Se: Business datalagring och teknik är byggstenar för Big Data

Slutsats

Allt mer big dataapplikationer blir en källa till konkurrenskraftiga värde för företag, särskilt de som strävar efter att bygga dataprodukter och tjänster för att dra nytta av de enorma volymerna av datavolymer som de fånga och lagra. Det finns allt tyder på att utnyttjandet av data kommer att bli allt betydelse till företag under år framåt som allt fler företag dra nytta av stora dataapplikationer. För en lista över alla mina artiklar, gå till williamstallings.com/Articles