Google Cloud Summit 2018: een nieuw begin

Vincent Huysmans, 7 jan 2019

Op Woensdag 28 oktober, in het Taets Gallery te Amsterdam, vond de Google Cloud Summit 2018 plaats. Dit was dé gelegenheid om nieuwe ideeën op te doen en de toekomst van de cloud te ontdekken. Met Infofarm zijn we nu ook volop aan het inzetten op nieuwe ideeën die de cloud ons te bieden heeft. Dus was het voor ons de kans om iemand op ontdekking te sturen. Die gelukkige mocht ikzelf zijn! Dit zou voor mij ook meteen mijn eerste keer zijn op dit soort evenementen.

Daar aanwezig probeerde ik zoveel mogelijk machine learning en AI talks bij te wonen. Ondanks het feit dat ik over deze technologieën al aardig wat kennis had, waren al deze talks nog interessant genoeg om mij gemotiveerd te houden doorheen de hele dag.

In totaal heb ik vijf talks bijgewoond, de ene al wat boeiender als de ander. Maar het doel was zeker bereikt: het klaarstomen om aan de slag gaan met al de technologieën met betrekking tot AI en machine learning in de Cloud. Om u als lezer een klein beetje te laten meegenieten heb ik hieronder een korte samenvatting voorzien van de talks die voor mij het meest interessant waren.

Talk 1:  Going Beyond the Traditional Enterprise Data Warehouse with BigQuery (Speaker: Robert Saxby, Google)

Dit was de eerste talk van de dag. Na een, toch wel lange keynote, kon het echte werk beginnen. De presentatie behandelde BigQuery, de serverless cloud-native data warehouse service van Google. We kregen een zeer korte introductie, de spreker ging er vanuit dat de meeste in de zaal al een basiskennis hadden. Dit was niet het geval voor mij, maar desondanks werd dit gaandeweg de presentatie wel duidelijk.

Na de introductie ging hij over naar de werking en architectuur van BigQuery. Het was al snel duidelijk dat het hier ging over een relatief technische voordracht. Het ging van het gebruik van gepartitioneerde tabellen tot allerlei andere best practices. Als demo werd BigQuery Web UI getoond en een vrij complexe query uitgevoerd, die dan uiteraard door het gebruik van deze best practices in enkele seconde een paar terabyte aan data verwerkt had. Het gaat hier duidelijk over een zeer krachtige tool om aan dataverwerking te doen zonder dat men zich zorgen moet maken over infrastructuur. Upload je data en laat de rest aan Google over.

Op het einde van de talk werd BigQuery ML behandeld. Had ik wederom nog nooit van gehoord. In het kort, BigQuery ML staat toe dat gebruikers modellen maken, trainen en uitvoeren door het gebruik van ‘simpele’ SQL queries. De modellen zelf worden opgeslagen als BigQuery datasets. Ook hier werd een demo van gegeven.

Voor mij is het vooral duidelijk geworden dat BigQuery en BigQuery ML twee technologieën zijn die een mooie aanvulling kunnen zijn voor een big data of een machine learning pipeline. Het is zeker iets waarmee we vanuit Infofarm meer gaan experimenteren. We trachten steeds voor onze klanten te kijken naar de meest efficiënte en kostenbesparende oplossingen, en BigQuery past zeker in dat plaatje!

Talk 3: Atos: How Cloud is fundamental for your AI (Speakers: Wim Los en Robin Zondag, Atos)

Er waren ook een tal van partners aanwezig. Enkele van deze partners kregen hun eigen slots. Deze maakten hiermee van de gelegenheid gebruik om hun ervaringen met Google Cloud voor te stellen. Elk van deze bedrijven gebruiken de Google Cloud services op hun eigen manier. Daarom is het interessant om te kijken hoe zij deze services gebruiken voor hun dagdagelijkse bedrijfsprocessen. 

Ik heb de talk gevolgd van Wim Los (Senior Vice President Google Alliance) en Robin Zondag (Global Head of Atos AI Labs) van Atos. Atos is een Frans IT-bedrijf dat zich bezighoudt met systeemontwikkeling en consultancy. Wim en Robin staan samen in voor alles wat met machine learning en AI in de cloud te maken heeft. 

Het eerste deel van de presentatie ging vooral over hoe Atos als bedrijf omgaat met grote machine learning en AI projecten. Ze hebben sinds kort hun eerste AI-lab opgericht. Dit lab biedt experimenten en oplossingen aan voor andere bedrijven. Ze legden uit hoe ze met dit lab te werk gaan en hoe Google Cloud daar een belangrijke rol in speelt.

Het tweede deel van de presentatie was iets technischer. Er werd dieper ingegaan op architectuur en welke services er door Atos gebruikt worden.

In grote lijnen kwam het er op neer dat men met het gebruik van de Google Cloud services een veel grotere business impact kan creëren. En dat Atos daar volop op aan het inzetten is. 

Uit de succesverhalen van Atos kan ik enkel maar concluderen dat wij met Infofarm niet achter kunnen blijven, en een grote shift moeten maken richting de cloud. Hopelijk staan wij dan binnen een paar jaar zelf onze ervaringen te delen op podium.

Talk 4: Hassle-free Machine Learning for Business Workshop (Speaker: Hussein Mehanna, Google)

Ik blijf het nog steeds merken dat bij grote AI projecten, de kloof tussen data scientists, engineers en developers te groot blijft. Wat zou het mooi zijn moest de cloud daar een oplossing voor hebben. Of nog beter moest Google daar een oplossing voor hebben. En ja hoor! Tijdens deze talk werd Kubeflow Pipelines en de AI Hub voorgesteld.

Persoonlijk vond ik dit de meest interessante talk van al degene die ik bijgewoond heb. Beide technologieën zijn relatief nieuw dus weten dat ze bestonden was vrijwel het enigste wat ik er over wist.

De presentatie zelf bestond dus uit twee delen. Ik vat ze kort even samen voor u:

Part I: Kubeflow Pipelines

Kubeflow Pipelines is een nieuwe component van Kubeflow, het populaire open source project van Google.  Met Kubeflow Pipelines wordt er een tool aangeboden waarbij end-to-end machine learning workflows kunnen worden beheerd, gedeployed en belangrijker, worden hergebruikt. Het doel is iedereen binnen de organisatie nauwer te laten samenwerken aan hetzelfde AI project. Ook wordt het mogelijk sneller en veiliger te experimenteren met verschillende algoritmes, zodat gebruikers de verschillende technieken kunnen uitproberen om te bepalen wat voor hun applicatie het beste is. Zo kan een data scientist zijn of haar ML-model uit de pipeline halen, aanpassen en hertrainen zonder dat er iets geïmpacteerd wordt. 

Part II: AI Hub

De AI Hub op zijn beurt is dan weer een catalogus met voorgebouwde pipelines, notebooks, TensorFlow-modules en meer. Deze middelen kunnen dan over gans de organisatie gedeeld worden. Er wordt zowel een publieke als een private catalogus voorzien. In de publieke zitten middelen gemaakt door Google zelf en zijn partners. In de private zitten middelen, zoals pipelines, ontwikkelt door de organisatie zelf. Ook hier ligt de focus dus weer op het nauwer samenwerken van developers, engineers en data scientists.

Beide zijn nog in bèta of alpha versie. We zullen zeer nauw opvolgen en spoedig mee aan de slag gaan. Hierdoor zullen we de nodige expertise en ervaring opdoen om dan zo dit te gebruiken in onze oplossingen voor onze klant.

Met alle talks achter de rug zijn we aan het einde gekomen in het Taets Gallery. We hebben kunnen kennis maken met de nieuwste technologieën en services van Google Cloud. We hebben samen gedachten en ideeën kunnen uitwisselen, en vooral hebben we ontdekt wat Google Cloud eventueel kan betekenen voor ons. 

Het is duidelijk dat Google Cloud bezig is met een ambitieuze opmars op het gebied van machine learning en AI. Met services zoals AutoML, Kubeflow Pipelines en AI Hub, moet het zeker niet meer onderdoen voor de andere grote spelers zoals Azure, en de dominante AWS. Met deze conclusie kan ik enkel maar zeggen dat we ook vanuit Infofarm meer gaan inzetten op de cloud. Google Cloud zal, mede dankzij deze summit, hierin een grote rol gaan spelen. Nu dat de motivatie en het enthousiasme er is, zal er gekeken worden hoe we deze kennis kunnen delen en verruimen binnen het team. Daarnaast zullen we ook kijken naar het uitwerken van een eerste use case volledig met Google Cloud. 

We zullen u als lezer hier ongetwijfeld nog van op de hoogte houden.

To be continued…

Over Infofarm

Data is goud en bij infofarm willen ze dit goud tastbaar maken. Infofarm wil zijn klanten ondersteunen bij het verwerken van hun data door gerichte analyses, voorspellingen en aanbevelingen te doen. Het gedreven en getalenteerd team van data scientists, data developers en project managers, zorgen samen met de allernieuwste technologieën, dagelijks voor een significante meerwaarde aan hun projecten, elkaar en hun klanten. 

www.infofarm.be