icon blogAltijd iets te leren

Big Intelligence seminar 2013

24-06-2013 door Dennis in 't Groen & Rogier Wessel

30 mei was in Eindhoven een landelijk seminar over Business intelligence met als thema “Big data” of ook wel Big intelligence seminar.

Big Intelligence seminar 2013

Big data kent vele definities, wikipedia zegt hierover: “een dataset zo groot en complex dat deze met moeite, of helemaal niet meer door een traditioneel database management systeem verwerkt kan worden”.

Big data of beter gezegd het MapReduce paradigma is in 2004 in het artikel “MapReduce: Simplified Data Processing on Large Clusters" beschreven. In het artikel beschrijven de onderzoekers een alternatieve manier om een belangrijk probleem van hun werkgevers op technisch elegante manier op te lossen: hoe krijg je terabytes of zelfs petabytes aan data in acceptabele tijden verwerkt. Het antwoord is simpel en complex tegelijkertijd en heeft in de jaren na deze publicatie tot de Big data software ecosfeer geleidt. Big data is een groeimarkt en tijdens dit seminar werd verder ingegaan op de kansen, valkuilen en onontgonnen gebieden in dit dynamische vakgebied.

 

Big Data, de hype voorbij

Erik van Tol

Als organisator van de dag gaat Erik in op het begrip Big data, de markt en de potentie. Een belangrijk punt is de groei die de markt op dit moment meemaakt, alles is in een stroomversnelling en niet alleen de bekende grote spelers (Google, Amazon, Yahoo, Facebook, etc) weten Big data te benutten, maar ook veel kleinere use-cases beginnen hun voordeel hiermee te doen. 

Belangrijkste vehikel in Big data is Hadoop, een heel actief Apache project die het mogelijk maakt om parallel met MapReduce enorme hoeveelheden (on) gestructureerde data te verzamelen en te analyseren. Hadoop is het platform en hieronder vallen verschillende tools en systemen, voor opslag, verwerking analyses en ontsluiting. 

Big data, veel informatie, geeft aan de analyse een nieuwe dimensie, hoe kan je immers zoveel verschillende parameters verwerken en tegelijkertijd relaties visueel presenteren? Erik liet een een tool zien van een bedrijf (Synerscope) die hier oplossingen voor probeert te zoeken: 

Erik sluit af met de stelling dat we een kritisch omslagpunt bereikt hebben, een moment waarop Big data echt zal doorbreken en ook op veel meer vlakken inzetbaar zal zijn. 

Bekijk hier de presentatie (pdf)

 

Big data verzamelen en dan…

Anja van der Lans (Incentro) & Pim Nauts

Big data is veel data, veel diepte, gestructureerde en ongestructureerd data, een combinatie van kanalen en data met veel complexiteit, complexiteit die vraagt om andere analyse technieken.

Anja geeft een korte marktanalyse: zo wordt op dit moment Big data gebruikt bij 5% van de Nederlandse bedrijven, heeft 25 % van de bedrijven een lopend project, en geeft 90% aan dat ze er mee aan de slag willen.

Anja gaf ook verschillende praktijk voorbeelden, een energie maatschappij die thermostaat data wil analyseren, een supermarkt keten die transacties van klanten wil analyseren en de business case van Wolters Kluwer.

Bij de laatste ging het over het detecteren van trending topics in de advocatuur, relevantie bepaling t.o.v. bestaande offerings van Kluwer en de content te scrapen om op te kunnen slaan in interne systemen. 

Bekijk hier de presentatie (pdf)

 

Getting value from Data & Analytics

Martin Heijnsbroek (MIcompany)

De mogelijkheden rondom Big Data lijken oneindig voor het bedrijfsleven. In dat opzicht lijkt Big Data op een alles-in-1 medicijn. Klantcontact kan gerichter en interactiever uitgevoerd worden, operationele systemen verder geoptimaliseerd en nieuwe inzichten kunnen leiden tot betere strategie. Helaas loopt de realiteit een enorm stuk achter op deze potentie, wat interessant genoeg geldt voor de afgelopen 20 jaar.

Willen we waarde creëren uit Big Data, moeten we een stapje terugdoen en beter begrijpen wat de handicaps zijn en welke ‘behandeling’ per handicap noodzakelijk is. Betere BI & Technologie komt hier zeker om de hoek kijken, maar is tegelijkertijd onvoldoende om het gat te dichten. Nog meer data en inzichten zal het bedrijfsleven niet helpen en mogelijk serieuze risico’s met zich meebrengen als bedrijven hun cultuur, competenties, en besturing niet aanpassen. 

In deze presentatie werd nader in de uitdagingen van grote bedrijven gedoken en besproken wat er nodig is om verandering te realiseren. Onder meer lijkt het ontwikkelen van een analytische cultuur en competentie bij top management een van de grootste uitdagingen. Het overtuigen van management over de superioriteit van inzichten uit data boven de vaak geprezen ‘business sense’ van ervaren managers is hierin een belangrijke stap.  Het veranderen van managementstijl  door het stellen van vragen in plaats van het delen van opinies is een andere cruciale stap.

Het gaat dus niet om het creëren van Big Data, maar om de waarde van deze data te ontsluiten in de dagelijkse bedrijfsvoering. 


Data Scientist 101: How to become a super cruncher?

Jos van Dongen (SAS)

Een aanhoudende trend in de BI-wereld is 'Analytics', met een nieuwe storm aan belangstelling veroorzaakt door het baanbrekende werk 'Competing on Analytics' en soortgelijke boeken als Moneyball en Super Crunchers.

Analytics wordt tegenwoordig gebruikt als een overkoepelende term voor activiteiten, variërend van visuele analyse tot NoSQL database implementatie en alles daartussen.

De mensen die de analyses doen worden 'Data Scientists' genoemd, de meest sexy job van de 21e eeuw volgens velen.

De volgende onderwerpen kwamen aan bod:

  • Categorisering van 'Analytics': Visualisatie, predictive analytics, big data, tekst en data
  • Technologie versus functionaliteit, of waarom zilveren kogels niet bestaan (A fool with a tool is still a fool...)
  • Data mining & statistiek        
  • Evolutie van bestaande BI-architectuur om Analytics te ondersteunen
  •  Uitbreiding van  vaardigheden: zelfstudie en onderwijs scenario's.

 

Deze sessie was om te leren begrijpen wat data science is en, wie weet, mensen te stimuleren zelf data scientist te worden. Daarnaast heeft Jos waarschijnlijk een aandeeltje Amazon zoals blijkt uit zijn presentatie.

Bekijk hier de presentatie (pdf)


Information 2020: Beyond Big Data

Frank Buytendijk (Gartner) 

De impact van Big Data is moeilijk te overschatten en het tempo en omvang waarin de innovatie in informatiemanagement plaatsvindt, is ongekend. Met name voor informatiespecialisten met een business intelligence en data warehousing achtergrond is het wel even omschakelen.

 Hoe zal informatiemanagement zich ontwikkelen, ook na de big data hype? Welke kansen biedt big data in termen van innovatie in technologie en business? Maar met welke risico's moet je rekening houden?

Bron: http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation