ADFv2 – Data Integration in Azure Just Got Awesome

Azure Data Factory version 2 (ADFv2) arrived in Sept17 with a bunch of new concepts and features to support our Azure data integration pipelines. In this session, we’ll update your ADFv1 knowledge and start to understand the true nature of scale out control flows and data flows. What’s the integration runtime? Can we easily lift…

Are You Optimistic About Concurrency?

What exactly does it mean to have optimistic concurrency? What is the alternative? Is SQL Server 2012’s SNAPSHOT Isolation optimistic? How can SQL Server 2016’s In-Memory OLTP provide truly optimistic concurrency? In this session, we’ll look at what guarantees the various isolation levels provide, the difference between pessimistic and optimistic concurrency, and the new technology…

Azure CosmosDB – jak używać, kiedy i gdzie. A kiedy nie!

W czasie tej sesji będę chciał pokazać kilka przykładów wykorzystania bazy CosmosDB przez klientów w Polsce i przy okazji opowiedzieć kiedy warto wykorzystywać tę bazę a kiedy nie. Bazy NoSQL posiadają wiele zalet ale źle użyte, powodują więcej strat niż zysków.

Azure Databricks: big data made easy

Databricks is to Spark as PaaS is to IaaS. If you’ve ever wanted to explore big data world but shied away because of its complexity, worry no more! During this session we will not only focus on Spark basics, but also cover practical examples of batch, interactive and streaming processing.

Azure IoT Solution Architecture Best Practices

The Internet of Things is becoming reality at a rapid pace. Many objects in the real world can be connected to the Internet. Cloud computing is the best option for the IoT backend. Microsoft Azure offers the offers a wide range of services, used in the Internet of Things solutions This presentation provides a deeper…

Azure Machine Learning Workbench

Microsoft do bogatej oferty rozwiązań służących do budowy modeli uczenia maszynowego dołączył nowe – Azure Machine Learning Workbench. Poznajmy w czasie sesji możliwości tego rozwiązania, przechodząc przez typową ścieżkę uczenia maszynowego. Zobaczymy różnorodne scenariusze począwszy od lokalnej pracy, kontenerów, jak i pracy z serwerem Spark w chmurze.

Azure SQL Database – wczoraj, dziś, jutro

Od dłuższego czasu obserwujemy dynamiczny rozwój usługi SQL Database – coraz więcej korzyści wynikających z przenoszenia rozwiązania do modelu PaaS, nowe możliwości w Data Platform, dostępne najpierw w chmurze. Podczas sesji przedstawię najnowsze zmiany i kierunki w których następuje ewolucja SQL Database w zakresie wydajności, bezpieczeństwa czy zarządzania usługą.

Azure SQL Datawarehouse – The Complete Introduction

Azure SQL Datawarehouse is not really the standard SQL Server that you could point your existing SSIS packages and reporting queries at and expect the same behaviour and performance. So why is that? And what should you do different to get the most out of Azure SQL DB? In this session I will explain what…

Challenges on GDPR from a database perspective

GDPR is the European Regulation that gives directives about data protection from an individual level. Every person in Europe is entitled to the some data rights which, at the organizational side, cause some major changes in how the information is managed and, consequently, affects the design and implementation of any applications that utilizes data. DBAs,…

Choosing the Right Database for Microservices Solutions

The past years have seen the explosive growth of large-scale distributed systems. This trend has changed the database world that is arguably without precedent in the history of the software industry. The result is a ompetitive database marketplace with a huge variety of platforms for us to choose from. But how do we go about…

Ciemna strona mocy czyli antywzorce

Czasem spotyka się rozwiązania problemów prowadzące do innych problemów. Jeżeli wielu ludzi wpada na ten sam pomysł lub zaczyna powielać nienajlepsze rozwiązania to pojawia się antywzorzec. Niektóre nawet mają już swoje nazwy. Przyjrzyjmy się kilku powszechnym i ciekawym.

Classifying support tickets using text analysis and machine learning

Machine learning is a very rapidly evolving branch of IT and you can find examples of companies using it almost in every industry. In my presentation I would like to talk about one particular company I collaborated with to build a solution for automatic classification of support tickets. I will discuss different tools and technics…

Cloud Data Wars: Przebudzenie mocy

Każda chmura ma własną armię w obszarze usług danych. Każdy dostawca twierdzi, że jego usługi są najlepsze i wyjątkowe. Zobaczmy, czy to naprawdę przebudzenie mocy i kto jest po jasnej, a kto po ciemnej stronie mocy. Niech siła usług w obszarze danych będzie z wami …

Co jest (NIE) możliwe z Microsoft SQL Server 2017 na systemie Linux (na Azure)

Sesja demo na temat tego co jest możliwe oraz przegląd tego, co nie jest możliwe kiedy decydujemy się na wdrożenie Microsoft SQL Server 2017 na systemie Linux (na platformie Azure).

Columnstore Clustered vs Nonclustered, when to choose what

The incredible Columnstore Indexes can increase your analytical query processing speed multiple times, they are updatable (Clustered from SQL Server 2014 and Nonclustered from SQL Server 2016 respectively), but they keep on supporting different sets of the functionalities – such as CDC (Nonclustered Columnstore) and LOBs (Clustered Columnstore), and this brings a great confusion. This…

Comparing Predictive Mining Models from R, Python, SSAS, and Azure ML

There is a lot of overlapping in Microsoft BI suite. For advanced analytics, like data mining, you can use SQL Server Analysis Services (SSAS), or R, or Python, or Azure ML. The question arises which tool to use. The answer is simple, through another question. Why not all of them? In data mining, you typically…

CosmosDB for (scary) developers

Sesja poświęcona chmurowej bazie dokumentowej i podejściu deweloperskim do niej. Jeśli nie boisz się Java Scriptu a i JSON Ci nie obcy, to koniecznie zawitaj na tej sesji. Jeśli Java Script wywołuje jednak u Ciebie gęsią skórkę, to też się nie wahaj i przyjdź. Spróbuję Cię przekonać, że nie taki diabeł straszny.

Data Lake praktycznie, czyli nie ważne jak zaczynasz, ważne jak kończysz

Wraz z upływem czasu rośnie wolumen danych w systemach sprzedażowych, a nie każda hurtownia danych jest gotowa dziesiątek terabajtów danych. Z pomocą przychodzi Data Lake, który jest w stanie przetworzyć takie wolumeny dzięki „nieograniczonej” możliwości skalowania. Jak podejść do tematu od A do Z, od źródeł danych po pierwsze analizy? Pokażemy jak w łatwy sposób…

Data Science w praktyce

Nurtują Cię pytania: Czym jest nauka o danych (data science)? Jak zastosować jej koncepcje, metody i narzędzia  do rozwiązywania problemów biznesowych? Jak wygląda proces wdrażania rozwiązań data science? Trzech doświadczonych ekspertów postara się odpowiedzieć na te pytania w trakcie trwania sesji. Łukasz Grala Krzysztof Odasz Jakub Wawrzyniak

dbachecks – The PowerShell Module to validate your SQL Estate

As a SQL DBA you want to know that your SQL Server Estate is compliant with the rules that you have set up. Now there is a simple method to set this up using PowerShell and you can get the results in PowerBi or a report emailed to you on a schedule. Details such as…

Design Myths

Prepare for a surprising, intriguing, and even controversial session. 45 years after Codd defined the Relational Model, there are still so many parts misunderstood. For sure there are points where you will be surprised and change your view, even though you might have been convinced for years that your view is the correct one, and…

Dont’t Use Cursors – or Why You Maybe Should Use a Cursor After All

You might have heard „don’t use cursors, they are slow!”. In this presentation, you will learn that normally you should write set-based statements instead, and I will explain why they generally are faster. But I will also look at situations where using a loop for one reason or another is preferrable, and you will learn…

Examples of using Spark in Azure for data processing

Spark is a great technology for parallel computing and processing data. It was designed to be fast! And Azure could be a great way to try it. In this session we will look through the capabilities of Spark using a couple of real-world examples to ensure, that it is a great technology and really worth…

Get data insights faster with Data Wrangling

Self-Service Data Preparation aka Data Wrangling is becoming more and more popular in BigData and Enterprise world. Data Lake stores tons of different data and it is not easy to get value from it. Traditional approach doesn’t work here, data analysts and data scientists have to wait until IT guys gather requirements and prepare a…

Identity, Sequence and ROW_NUMBER

This session is about tools in T-SQL that allow you to generate a sequence of values, often used as surrogate keys, but sometimes for other purposes. The session covers the identity column property and the limitations it imposes. It covers the sequence object, and compares and contrasts it with the identity property, including a performance…

Impreza wieczorna

Integracja wieloźródłowych heterogenicznych danych przy użyciu języka Python

Analityk często potrzebuje informacji z wielu źródeł o uporządkowanych i nieustrukturyzowanych danych, stojąc często w obliczu ich niespójności i sprzeczności. Celem prezentacji jest przegląd narzędzi udostępnianych przez środowisko Python, które umożliwiają dostęp, transformacje i łączenie danych z wielu źródeł tworząc spójne informacje.

Klasyfikacja obrazów przez modele uczenia maszynowego

Sztuczna inteligencja nazywana jest elektrycznością XXI wieku. Sto lat temu upowszechnienie energii elektrycznej zmieniło sposoby w jaki pracujemy, podróżujemy, odpoczywamy — choć tego nie zauważamy, wynalezienie elektryczności zmieniło cały nasz świat. Dzisiaj, dzięki sztucznej inteligencji, jesteśmy świadkami rewolucji na podobną skalę. Przełomem okazało się zastosowanie głębokich modeli uczenia maszynowego do takich zadań, jak klasyfikacja obrazów…

Kostki SSAS – zoptymalizowane dla dużych hurtowni danych

Pracując z modelem wielowymiarowym, który oparty był na ogromnej hurtowni danych natknąłem się na wiele problemów, które nigdy wcześniej nie pojawiły się w małych projektach. Podczas sesji podzielę się technikami optymalizacji zarówno samych kostek jak i ich administrowania jak i dalszego rozwijania. Porozmawiamy zarówno o konfiguracji serwera, błędach developerów, procesowaniu jak, publikacji zmian i wiele…

Kubernetes for data scientist

TBD

Laying the Foundations for GDPR Compliance

GDPR, no matter where you are if you are handling data on European data subjects. Laying a solid foundation of data security practices is vital to avoid the potential fines and damage to reputation that being non-compliant can bring. Practicing good data hygiene is vital to meeting compliance requirements, whether it is GDPR, PCI-DSS, HIPAA…

Level Up Your Biml: Best Practices and Coding Techniques

Is your Biml solution starting to remind you of a bowl of tangled spaghetti code? Good! That means you are solving real problems while saving a lot of time. The next step is to make sure that your solution does not grow too complex and confusing – you do not want to waste all that…

Lunch break, networking

Lunch break, networking

Lunch break, networking

Microsoft Azure for the DBA

Although Microsoft Azure and the concept of Cloud Computing has been around for a number of years it is still a mystery to many. This talk takes offers an introduction to Microsoft Azure and the many services it has to offer. We will then go onto look in depth at SQL Azure Database; creating, configuring,…

Microsoft R-Evolution – Przegląd dystrybucji Microsoft R oraz zarządzanie rozwiązaniem bazującym na R

Po przejęciu przez Microsoft firmy Revolution Analytics w 2015 r. powstało wiele produktów R, rozszerzeń oraz dostępnych narzędzi. Ich ilość spowodowała, że użytkownicy mogą mieć trudności z wyborem i dostosowaniem najbardziej odpowiedniego rozwiązania z dystrybucji Microsoft by później uczynić całe rozwiązanie produkcyjne. Podczas sesji dowiesz się: – Jakie są różnice między dystrybucjami R w Microsoft…

Miejsce architektury Data Vault 2.0 w hurtowniach danych

Inne spojrzenie czy dodatek do istniejącej architektury naszych hurtowni danych? Przedstawię koncepcję architektury Data Vault 2.0 oraz jej miejsce we współpracy z innymi architekturami. Porozmawiamy o wadach i zaletach istniejących rozwiązań oraz odpowiemy sobie na pytanie czy nowa architektura to odpowiedź na wszelkie dotychczasowe problemy w hurtowniach danych.

Move part of your body to Azure Data Warehouse

Azure jest tańszy, Azure jest szybszy, Azure jest bardziej bezpieczny. Azure… wszędzie rozwiązania w chmurze. Dane, duże ilości danych. Nawet jeśli nie dzisiaj – z pewnością w najbliższej przyszłości (uwierz) staniesz przed dylamentem: jak przenieść nasze środowisko, a tym dane, ze hurtowni danych On-Premise do Azure. Podczas sesji przyjrzymy się sposobom takiej migracji i porównaniem…

Nietrywialne podejście do partycjonowania tabel

Masz bardzo duże tabele w swojej bazie danych, a może chcesz archiwizować swoje starsze dane w efektywny sposób? Tu z pomocą przychodzi nam partycjonowanie. W czasie sesji na wstępie przedstawię teorię, dlaczego korzystanie z partycjonowania może być korzystne dla naszej bazy danych. Następnie pokażę praktyczne metody zastosowania partycjonowania w tabelach, jakie korzyści niesie to za…

Odloty w T-SQL vol. 2

Sesja będzie kontynuacją mojej sesji sprzed blisko dekady, gdzie pokazywałem dziwaczne, choć efektywnie działające konstrukcje kodu Transact SQL. Tym razem również pokażę parę nietypowych zastosowań, często na granicy poprawności, które mogą przydać się w życiu codziennym. Wspomnę też, które ze starych odlotów zostały po cichu przez Microsoft załatane, a które wciąż mają się dobrze. Zapraszam…

Power BI Report Server (PBIRS) – What / Why & How?

powerbi.com – as a cloud-based SaaS solution for self-service busines intelligence (BI) – is available since two years. Succeeding the Microsoft reporting roadmap announcements and it’s proposed cloud and on-premises feature parity the community had to wait for more than 1 year for news. With the release of the Power BI Report Server (PBIRS) in…

Power BI w praktyce

TBA

Przełącz swoją bazę OLTP na In-Memory

Decyzja o zastosowaniu tabel typu memory-optimized stawia silnik SQL Server w nieco odmienny sposób korzystania z zasobów. Nasza sesja pokaże jak podejść do takich kwestii jak durability, natywnie kompilowane procedury, ich ograniczenia (wraz z obejściami), różnice pomiędzy wersjami SQL Server, porównanie z tradycyjnymi tabelami i procedurami, itd. Po tej sesji będziesz wiedzieć czy warto w…

Query Store without SQL 2016 = Open Query Store

When SQL Server 2016 was released, it offered a fantastic new feature with the Query Store. Long term, statistics based, query tuning became a reality. But what about the thousands of servers that aren’t upgrading to SQL 2016 or newer? The open source project Open Query Store is designed to fulfill that need. This session…

Rejestracja, poranna kawa

Reporting Services – zaawansowane wizualizacje danych z użyciem R i Python

Jeden obraz przemawia mocniej niż tysiąc słów. Efektywny raport potrzebuje dobrze wyglądających i przemawiających wizualizacji danych. Standardowe możliwości Reporting Services są duże i mocne, ale czasem potrzebujemy więcej. Wtedy przychodzi czas na sięgnięcie po bardziej rozbudowane możliwości jakie oferują biblioteki graficzne używane w językach R i Python. W trakcie sesji zaprezentowane zostaną najciekawsze możliwości ggplot2,…

Security Intelligence in Azure Sql PaaS

How to design secure solutions that use Azure Sql Database and Datawarehouse. Session covers security assessment and risk management of public cloud and specifically focuses on Azure Sql PaaS. That includes common network topologies with their strengths and weaknesses, blueprints and recommendations for hybrid and cloud-only solutions. In addition it talks about cloud-first, and in…

Solve daily indexing problems

Have you ever been in the situation that an application performed well the last day and – suddenly – you run into problems? Although you have Index Maintenance jobs and statistics up to date you will monitor a big degrade of performance! This session will demonstrate in a over 80 percent demo based presentation the…

SQL Server & Containers

This session aims to take attendees through what containers are and what benefits they bring. After this demo based session, attendees will be able to go back to their respective companies and be able to evaluate container technology to determine whether or not it will be of benefit. Attendees will be taken through the following:…

SQL Server vs. Windows Server – how to configure Windows for better SQL Server performance

Microsoft SQL Server is running on Windows Server Operating system, however, most of the OS Administrators treat SQL Server just like another basic application. On the session, I will show how steps taken before actual installation of SQL Server can impact performance. The session is a walkthrough on all of the layers starting on hardware,…

Stream Analytics i Machine Learning – czy to dobrze dobrana para na współczesne wyzwania?

Współczesne rozwiązania w obszarze zaawansowanej analityki danych muszą być gotowe na nowego typu wyzwanie: analizę danych pochodzących z różnych źródeł w czasie bliskim rzeczywistemu. Jednym z celów może być reagowanie na zdarzenia w social media czy dostarczanie spersonalizowanych ofert klientom dokładnie wtedy, kiedy tego rzeczywiście potrzebują. W trakcie prezentacji przedstawimy przykład implementacji takiego rozwiązania w…

The Smart Way to Troubleshoot SQL Server Cluster and Availability Group Outages

SQL Server Failover Clustered Instances (FCI) and Availability Groups (AG) depend a lot on Windows Server Failover Clustering (WSFC). But when mission-critical databases go offline, bringing them back online could be a nerve-wracking experience. This session will look at understanding how the underlying WSFC platform works to help us maintain availability of our databases. This…

Transformuj swoje dane w Power BI

Dla większości użytkowników biznesowych i deweloperów Power BI to przede wszystkim świetne narzędzie do wizualizacji danych, posiadające „pod spodem” wydajny silnik tabelaryczny. Jeszcze większa grupa twierdzi, że Power BI to niezastąpione narzędzie służące do wizualizacji już przetworzonych danych czy to w Analysis Services czy też w hurtowni danych. To jednak nie wszystko! Power BI daje…

Tworzenie wydajnej i niezawodnej platformy raportowej klasy Enterprise z Microsoft Power BI

Jak tworzyć i publikować raporty Power BI, aby działały szybko i niezawodnie? Podczas sesji poznasz tajniki tworzenia dużych, bezpiecznych i skalowalnych rozwiązań raportowych na platformie Microsoft Power BI. Omówimy powszechne wzorce wykorzystania technologii Power BI, najlepsze praktyki w zakresie wdrażania, monitorowania i optymalizacji wydajności, konfiguracji źródeł danych, publikowania raportów i bezpieczeństwa. Pokażemy wiele przykładów z…

Warsztaty, część 1

Warsztaty, część 2

What are Azure SQL Database Managed Instances?

The range of options for storing data in Microsoft Azure keeps growing, the most notable recent addition is the Managed Instance. But what is it, and why is it there? Join John as he walks through what they are and how you might start using them. Managed Instances add a new option for running workloads…

What Happened? Exploring the Plan Cache

Being pro-active, and using one of the various tracing capabilities of SQL Server, is one of the best ways to keep track of what is going on in your SQL Server and what might be causing performance problems. But does that mean if you haven’t set up any tracing, there is nothing you can do…

Why should I care about SQL, if I have ORM?

Ok, we are starting a new project. Platform – .Net. Programming language – C#. Database – SQL Server. How will we work with the database? ORM. Most likely Entity Framework. Time to start! Unfortunately, this set is already enough to start the project 🙂 but not enough for its efficient and painless work in the…

Window Functions

T-SQL window functions allow you to perform data analysis calculations like aggregates, ranking, offset and more. When compared with alternative tools like grouping, joins and subqueries, window functions have several advantages that enable solving tasks more elegantly and efficiently. Furthermore, window functions can be used to solve a wide variety of T-SQL querying tasks well…

Wprowadzenie do planów wykonania zapytań

Celem sesji jest zaprezentowanie, czym są plany wykonania zapytań oraz jak są tworzone. Uczestnicy dowiedzą się, w jaki sposób można je pozyskać, jak należy je czytać, oraz jakich najistotniejszych informacji nam one dostarczają. Dodatkowo Marek Maśko omówi również kilka podstawowych operatorów i ich istotnych właściwości. To wiedza jest bardzo przydatna przy rozwiązywaniu problemów z wydajnością…

Zacznij wreszcie testować swoje pakiety SSIS

Nie testujesz swoich pakietów SSIS, prawda? Bardzo dobrze Cię rozumiem – to nudna, ręczna praca która często sprowadza się do częstego klikania w SSDT połączonego z okazjonalną podmianą danych na jakieś testowe. Przygotowanie dobrego testu to dość skomplikowana sprawa. SSIS jest bardzo wrażliwy na zmianę metadanych, co nie pomaga przy parametryzacji nazw tabel czy baz…

Zakończenie konferencji

“Lift and shift” SQL, .Net, Python oraz R kod do rozwiązań Big Data

Przetwarzanie Big Data w coraz większym stopniu nie ogranicza się tylko do wyszukiwania danych, ale wiąże się również z wykorzystaniem zaawanasowanych algorytmów przetwarzania tekstu czy obrazu oraz zastosowaniem modeli uczenia maszynowego. Usługa Azure Data Lake Analytics nie tylko rozwiązuje wiele z problemów związanych z efektywnością i skalowalnością procesu analizy danych, ale daje on również możliwość…