2 Fast 2 Furious – designing for speed, concurrency, and correctness

With the multitude of isolation levels, concurrency models, and specialist technologies available in SQL Server, it is no surprise that transaction throughput and correctness can be directly correlated to the ability and knowledge of the person that wrote the code. In this session, we will reveal how SQL Server concurrency and correctness often goes wrong,…

A Masters view on Locking and blocking

How do the wait stats show you that you have a locking issue?This session will show you how to detect and view blocking and lock waits, and understand the cause of it.An extensive walkthrough of the different isolation levels and their respective benefits and drawbacks.And finally a real-world quick list of suggestions on what you…

ADFv2 – Data Integration in Azure Just Got Awesome

Azure Data Factory version 2 (ADFv2) arrived in Sept17 with a bunch of new concepts and features to support our Azure data integration pipelines. In this session, we’ll update your ADFv1 knowledge and start to understand the true nature of scale out control flows and data flows. What’s the integration runtime? Can we easily lift…

Advanced Data Visualisations for Your Reports with R and Python libraries

One picture tells more than thousand words. Effective report needs informative and good looking visuals. Standard Reporting Services capabilities are huge and strong but sometimes you feel you need more. And you can have more, much more with graphic libraries used in R and Python. Come and see what can you do with ggplot2, seaborn…

AI and Data Science in industry

In today’s world, AI and Data Science are gaining popularity. This happens not only because they offer technologically advanced and interesting solutions, but mainly because they find a very wide application in solving real problems. The session aims to inspire people working in industry and broadly understood business to use the capabilities of artificial intelligence…

Anomaly Detection in Predictive Maintenance for Sql Server

The amount of data we collect, store and process is rapidly growing and goes hand in hand with growing amount of work related to managing it. Automation is a key if we want to stay in control and AIOps represents its next major level with potential to revolutionise IT operations. This session explains what AIOps…

AQP czy IQP?

SQL Server 2017 rewolucyjnie rozpoczął wsparcie dla automatycznego tuningu zapytań. Początkowo nieśmiało wykorzystano informacje przechowywane w plan cache oraz query store. Nadchodzi jednak SQL Server 2019, a w nim już cała plejada całkiem przydatnych nowości: batch mode on rowstore, memory grant feedback, interleaved execution, adaptative joins, deferred compilation oraz approximate query processing. Owe nowości tworzą…

Are You Optimistic About Concurrency?

What exactly does it mean to have optimistic concurrency? What is the alternative? Is SQL Server 2012’s SNAPSHOT Isolation optimistic? How can SQL Server 2016’s In-Memory OLTP provide truly optimistic concurrency? In this session, we’ll look at what guarantees the various isolation levels provide, the difference between pessimistic and optimistic concurrency, and the new technology…

Attention Contention!!!

In this session we will discuss about tempdb contention in SQL Server on-premises, Azure SQL Managed Instance and Azure SQL Database.We will analyze both, Allocation Contention and Metadata contention, describing in detail WHEN and HOW it occurs, How to diagnose it, Best Practices and how to prevent it.The session will have both approaches in on-premisses…

Automating the testing of your BI solutions with NBi

If you want to accelerate the testing of your BI solution, the best strategy is to automate your tests with the help of a dedicated framework. During this session, we’ll take a look to the features of the open-source framework named “NBi” (nbi.codeplex.com). This framework is providing support for automated tests on the fields of…

Avoid report limitations with advanced Power BI and DAX

The most of you are familiar with Power BI and had already created a lot o reports. But what to do when limitations disallow you to satisfy business needs? During this session we’ll face with this issue. Having number of different business requirements we’d walk around limitations and provide fully useful solutions. We’d play with…

Azure CosmosDB – how to use it, when and where! Cases from the field

During this short session I will show you how some customers in Poland are using CosmosDB and what are prefered scenarios for it. As the NoSQL databases have a lot tempting features, they should not be used for all the scenarios. During the session we will review couple of them.

Azure Data Factory i proces CI/CD w Azure DevOps

Pracując nad przepływami w Azure Data Factory pojawia się naturalna potrzeba, mądrego i w miarę możliwości zautomatyzowanego wdrażania naszych zmian na kolejne środowiska. Dobrze, gdybyśmy mieli również możliwość porównania zmian pomiędzy wersjami oraz w razie potrzeby cofnięcia się do wcześniejszej wersji naszych przepływów. Na sesji zaprezentuję w jaki sposób możemy wykonać automatyczny proces CI/CD (Continuous…

Azure Databricks 101

Many sources? Various format? Unstructured data? Big Data? You might think that these only a buzz words. Not really. These days it’s a part of modern data flow architecture. No matter what do you use – SQL Server, Cosmos DB, Azure SQL DW, Azure Data Factory, Data Lake… somewhere there you can find Databricks. So,…

Azure Databricks: big data made easy

Databricks is to Spark as PaaS is to IaaS. If you’ve ever wanted to explore big data world but shied away because of its complexity, worry no more! During this session we will not only focus on Spark basics, but also cover practical examples of batch, interactive and streaming processing.

Azure IoT Solution Architecture Best Practices

The Internet of Things is becoming reality at a rapid pace. Many objects in the real world can be connected to the Internet. Cloud computing is the best option for the IoT backend. Microsoft Azure offers the offers a wide range of services, used in the Internet of Things solutions This presentation provides a deeper…

Azure Machine Learning Workbench

Microsoft has added a new Azure Machine Learning Workbench to a rich offer of solutions for building machine learning models. Let’s get to know the possibilities of this solution during the session, going through the typical machine learning path. We will see a variety of scenarios ranging from local work, containers, as well as working…

Azure Orchestration – Applying Data Factory in Production

If you have already mastered the basics of Azure Data Factory (ADF) and you are now looking to advance your knowledge of the tool, this is the session for you. Yes, Data Factory can handle the orchestration of our ETL pipelines. But what about our wider Azure environment? In this session we will take a…

Azure SQL Data Warehouse – raport z pola walki

SQL Data Warehouse jest jedną z tych usług PaaS w Azure, których można użyć, jeśli elementem rozwiązania analitycznego powinna być hurtownia danych przez duże “hurt” (czytaj – ilość danych taka, że aż boli). W teorii usługa ta przypomina platformę SQL Server albo – może bardziej – rozwiązanie sprzętowo-programowe Analytics Platform System (dawniejsze Parallel Data Warehouse).…

Azure SQL Database – yesterday, today and tommorow

Od dłuższego czasu obserwujemy dynamiczny rozwój usługi SQL Database – coraz więcej korzyści wynikających z przenoszenia rozwiązania do modelu PaaS, nowe możliwości w Data Platform, dostępne najpierw w chmurze. Podczas sesji przedstawię najnowsze zmiany i kierunki w których następuje ewolucja SQL Database w zakresie wydajności, bezpieczeństwa czy zarządzania usługą.

Azure SQL Datawarehouse – The Complete Introduction

Azure SQL Datawarehouse is not really the standard SQL Server that you could point your existing SSIS packages and reporting queries at and expect the same behaviour and performance. So why is that? And what should you do different to get the most out of Azure SQL DB? In this session I will explain what…

Back to the Future: Accelerating the Cloud Migration of Legacy SSIS with Azure Data Factory

This session focuses on the new features to unblock/accelerate cloud migration of legacy SSIS, such as 2008 or earlier versions, with Azure Data Factory (ADF). We will first show you how to provision Azure-SSIS Integration Runtime (IR) – dedicated ADF servers for running SSIS – and extend it with custom/Open Source/3rd party components. We will…

Bazy danych w SSDT (cz.1): Praca z projektem oraz praktyczne wskazówki

Zadanie wydaje się proste: utrzymywać projekt bazy danych w repozytorium, traktować go jako master-version oraz wykonywać wdrożenia w regularnych i niezbyt długich odstępach czasu. Proste? Pozornie. Sprawy się komplikują gdy ilość obiektów w bazie rośnie. Gdy zamiast jednej bazy, mamy kilkanaście. Kiedy bazy danych posiadają referencje do siebie nawzajem. A co z tabelami słownikowymi? Gdzie…

Bazy danych w SSDT (cz.2): Wdrażanie w procesie CI/CD z Azure DevOps

Pracując nad bazą danych w SSDT pojawia się potrzeba wdrożenia naszych zmian na kolejne środowiska i jednocześne utrzymanie spójności baz pomiędzy środowiskami. Na sesji zaprezentujemy jak możemy wykonać wdrożenia ręcznie a nastepnie przejść do procesu Continuous Integration oraz Continuous Deployment z zastosowaniem środowiska Azure DevOps (dawniej VSTS).Ponadto popracujemy nad wpleceniem w nasz proces unit testów…

Brief introduction into SQL Server Execution Plans

The goal for this session is to present what Query Execution Plans are and how they are created. Attendees will learn how to get them, how to read them, and what is the most valuable information they deliver us. In addition, Marek Maśko will discuss few most popular operators and their important properties. This knowledge…

Building efficient and reliable Enterprise Reporting Platform with Microsoft Power BI

How to create and deploy Power BI reports that are fast and reliable? Join us and learn how to build serious, secure, and scalable reporting solutions with Power BI. We’ll cover the common patterns for Power BI usage, performance implications and best practices in deployment, monitoring, data source configurations, reports publishing and security aspects. You…

Call for action – Raporty motywujące do działania z wykorzystaniem Power BI

Czy raport ma po prostu ładnie wyglądać i pokazywać liczby? Nie! Ma angażować użytkownika końcowego, wzbudzać w nim emocje, prowokować do działania a przez to maksymalizować wartość z jego utrzymywania. O tym sobie poopowiadamy na sesji z wykorzystaniem przykładów biznesowych i narzędzia Power BI.

Case study: Wdrożenie mechanizmu klasy Transactional Analytics w Straży Granicznej

Czasami od systemu oczekujemy zarówno wydajności hurtowni danych, jak i wysokiej współbieżności w przetwarzaniu transakcji. Choć są ich setki milionów, każda jest potencjalnie tak samo ważna i musi być dostępna w najdrobniejszych szczegółach. Na sesji opowiemy, dlaczego system obsługi odpraw granicznych ma wszystkie te cechy, w jaki sposób poradziliśmy sobie z potrzebami analitycznymi na danych…

Challenges on GDPR from a database perspective

GDPR is the European Regulation that gives directives about data protection from an individual level. Every person in Europe is entitled to the some data rights which, at the organizational side, cause some major changes in how the information is managed and, consequently, affects the design and implementation of any applications that utilizes data. DBAs,…

Choosing the Right Database for Microservices Solutions

The past years have seen the explosive growth of large-scale distributed systems. This trend has changed the database world that is arguably without precedent in the history of the software industry. The result is a ompetitive database marketplace with a huge variety of platforms for us to choose from. But how do we go about…

Classifying support tickets using text analysis and machine learning

Machine learning is a very rapidly evolving branch of IT and you can find examples of companies using it almost in every industry. In my presentation I would like to talk about one particular company I collaborated with to build a solution for automatic classification of support tickets. I will discuss different tools and technics…

Cloud Data Wars: The Force Awakens

Each cloud has its own army of data services. Each one claims they are the best and unique. Let’s see if this is really the force awakens and who followed the light and who followed the dark side of the Force. May the Force of data services be with you…

Co powinieneś wiedzieć o Databricksach, a o czym prawdopodobnie nie masz pojęcia

Azure Databricks to usługa szybko adaptowana przez wiele firm. Pozwala na wykonywanie zapytań potrzebujących dużej mocy obliczeniowej. Sama może się skalować w celu przyspieszenia obliczeń. Do tego pozwala na używanie kilku języków programowania. Można pokusić się o stwierdzenie, że rozwiąże wszystkie problemy… ale tylko i wyłącznie świadomych użytkowników. W trakcie sesji pokażemy o czym należy…

Columnstore Clustered vs Nonclustered, when to choose what

The incredible Columnstore Indexes can increase your analytical query processing speed multiple times, they are updatable (Clustered from SQL Server 2014 and Nonclustered from SQL Server 2016 respectively), but they keep on supporting different sets of the functionalities – such as CDC (Nonclustered Columnstore) and LOBs (Clustered Columnstore), and this brings a great confusion. This…

Common Data Model – hurtownia danych z pudełka?

Jedno narzędzie by wszystkimi danymi rządzić… Czy możliwe jest wykorzystanie jednej platformy jako bazy dla różnych aplikacji biznesowych i raportowych, łącząc tym samym świat danych transakcyjnych i analitycznych? Opowiemy czym jest Common Data Model oraz zaprezentujemy przykłady jego wykorzystania jako substytutu hurtowni danych oraz integrację z Power BI.

Common Enterprise Analytics Architectures with Azure Data Services and Power BI

This session will tie together the components of the modern data warehouse stack including Azure Data Factory, Azure Data Lake Storage Gen2, Azure Databricks, Azure SQL Data Warehouse, Azure Analysis Services and Power BI. Learn how to operationalize end-to-end BI architectures covering everything from data ingestion, preparation to reporting and analytics. Join us and learn…

Comparing Predictive Mining Models from R, Python, SSAS, and Azure ML

There is a lot of overlapping in Microsoft BI suite. For advanced analytics, like data mining, you can use SQL Server Analysis Services (SSAS), or R, or Python, or Azure ML. The question arises which tool to use. The answer is simple, through another question. Why not all of them? In data mining, you typically…

Complex Azure Orchestration with Dynamic Data Factory Pipelines

If you have already mastered the basics of Azure Data Factory (ADF) and are now looking to advance your knowledge of the tool this is the session for you. Yes, Data Factory can handle the orchestration of our ETL pipelines. But what about our wider Azure environment? In this session we’ll go beyond the basics…

CosmosDB for (scary) developers

TBD

Creating Custom Visuals in Power BI with TypeScript and D3.js

This presentation is about how to create custom visuals (components) for your PowerBI reports. Power BI reporting features could be extended with custom components, that developers can implement and BI specialist can include in their dashboards. Many visuals are also availabe in the Power BI Visuals Gallery. Power BI is flexible with which graphical API…

Data Driven Decision Making with Azure Machine Learning

Azure Machine Learning [ML] is a great tool for providing deep analytical data analysis and can provide a great learning environment to those people who are just getting started with learning machine learning concepts as well as those who want to deploy complex models created in R or Python. This session will introduce how to…

Data Lake praktycznie, czyli nie ważne jak zaczynasz, ważne jak kończysz

Wraz z upływem czasu rośnie wolumen danych w systemach sprzedażowych, a nie każda hurtownia danych jest gotowa dziesiątek terabajtów danych. Z pomocą przychodzi Data Lake, który jest w stanie przetworzyć takie wolumeny dzięki “nieograniczonej” możliwości skalowania. Jak podejść do tematu od A do Z, od źródeł danych po pierwsze analizy? Pokażemy jak w łatwy sposób…

Data Overview and Manipulation – T-SQL, R, Python

In a real data mining or machine learning project, you spend more than half of the time on data preparation and data understanding. The R language is extremely powerful in this area. The Python language is a match. Of course, you do work with data by using T-SQL. You will learn in this session how…

Data Science in practice

Always wondering: What is data science? How can you apply its concepts, methods and tools to particular business cases? How does the implementation process look in practice? Our experts will try to answer all those questions during this session. Łukasz Grala Krzysztof Odasz Jakub Wawrzyniak

Database as a Service offering in Azure – Architect Perspective

Cloud offers number of database options – starting from simple Tables within Azure Storage, through number of PaaS offerings, finishing with complicated IaaS clusters based on Casandra, SQL Server oraz Oracle with RAC option. Choosing between them is not easy and I often see customers struggling to decide which option is the best for them.…

dbachecks – The PowerShell Module to validate your SQL Estate

As a SQL DBA you want to know that your SQL Server Estate is compliant with the rules that you have set up. Now there is a simple method to set this up using PowerShell and you can get the results in PowerBi or a report emailed to you on a schedule. Details such as…

Design Myths

Prepare for a surprising, intriguing, and even controversial session. 45 years after Codd defined the Relational Model, there are still so many parts misunderstood. For sure there are points where you will be surprised and change your view, even though you might have been convinced for years that your view is the correct one, and…

Docker dla amatora danych

Docker nie jest niczym nowym, ale wydaje się, że właśnie teraz bije rekordy popularności. Jakiś czas temu postanowiłem, że ja również poznam tę technologię i sprawdzę w jaki sposób może pomóc komuś takiemu jak ja. Mimo, iż póki co w bieżących projektach nie mogę korzystać z kontenerów, to okazuje się, że jego znajomość już jest…

Dont’t Use Cursors – or Why You Maybe Should Use a Cursor After All

You might have heard “don’t use cursors, they are slow!”. In this presentation, you will learn that normally you should write set-based statements instead, and I will explain why they generally are faster. But I will also look at situations where using a loop for one reason or another is preferrable, and you will learn…

Ethereum proof-of-authority consortium on Azure cloud platform

Omówiona zostanie zaawansowana koncepcja proof-of-authority w rozwiązaniu blockchain Ethereum. Przedstawiona zostanie idea węzła walidatora. Podstawy wydobycia (mining) oraz metoda generowania kosztów i zużycia energii (PoW) w komputerach oraz generowania transakcji będą omówione zarówno z zaletami, jak i wadami. Opowiem o przykładzie użycia prywatnych bloków w przemyśle. Całe wdrożenie sieci prywatnej/konsorcjum Ethereum będzie prezentowane na platformie…

Examples of using Spark in Azure for data processing

Spark is a great technology for parallel computing and processing data. It was designed to be fast! And Azure could be a great way to try it. In this session we will look through the capabilities of Spark using a couple of real-world examples to ensure, that it is a great technology and really worth…

Failure prediction for manufacturing industry with SQL Server & R

Working in manufacturing industry means that you must deal with product failures. As a BI and/or Data Scientist developer, your task is not only monitor and report product’s health state during its lifecycle, but also predict the likelihood of a fail in the production phase or when product has been delivered to the customer. Machine…

Fast & Furious – czyli sesja o tych najbardziej wydajnych bazach danych w chmurze

Niezależnie od tego czy wdrażasz aplikację web, planujesz budowę hurtowni danych, czy eksperymentujesz ze strumieniami danych – baza danych to podstawa Twojej architektury. W trakcie tej sesji omówimy i pokażemy jak funkcjonują najbardziej wydajne silniki bazodanowe…oczywiście w chmurze.

From Big Data to the knowledge contained in the data, 2h live demo – part 1

Huge amounts of diverse data surround us on each side. However, both, this magnitude and variety are primarily a source of confusion, not benefits. Only proper data processing allows to reveal valuable information and knowledge contained in the data. And only this digested knowledge can bring real business benefits. During the session, our team of…

From Big Data to the knowledge contained in the data, 2h live demo – part 2

Huge amounts of diverse data surround us on each side. However, both, this magnitude and variety are primarily a source of confusion, not benefits. Only proper data processing allows to reveal valuable information and knowledge contained in the data. And only this digested knowledge can bring real business benefits. During the session, our team of…

From failure to international conference speaker

Life really is like a box of chocolates. You never know what you’re going to get. In only a handful of years, my life has changed drastically in a very positive way. I used to be almost out of a job, now I’m a consultant working for a firm that has over 2500 employees. I…

Get data insights faster with Data Wrangling

Self-Service Data Preparation aka Data Wrangling is becoming more and more popular in BigData and Enterprise world. Data Lake stores tons of different data and it is not easy to get value from it. Traditional approach doesn’t work here, data analysts and data scientists have to wait until IT guys gather requirements and prepare a…

Getting Started with Azure Databricks

Azure Databricks provides the ability to use massive scale to read and stream data to create machine learning solutions to provide insight for large data stores. In this session you will learn how to get started in Databricks, and when it is the right tool for your data science project. We will also walk through…

Getting Started with Linux for the SQL Server DBA

With the introduction of SQL Server 2017 for Linux, there is no escaping the fact that SQL Server DBAs need to be familiar with the Linux operating system. So, how do you start? In this session, you will learn the most important fundamentals and commands that are important to the DBA when managing a database…

Hacking SQL Server

You have been working with SQL Server for several years and you feel quite comfortable with most of the available features. Even you have a checklist for installation/configuration of SQL Server to be compliant with corporate standards. However, somewhere on the back of the head you have a feeling that there is something more that…

Identity, Sequence i ROW_NUMBER

TBD

Image classification with Microsoft Cognitive Toolkit

Artificial intelligence is called electricity of the 21st century. One hundred years ago the popularization of electricity changed the ways in which we work, travel and rest – invention of electricity changed our whole world. Today, thanks to artificial intelligence, we are facing a revolution on a similar scale. The breakthrough was possible due to…

Integration of multi-source heterogeneous data using Python

Analyst often needs information from multiple sources with structured and unstructured data, often facing the data inconsistency and contradiction. The goal of the presentation is to give an overview of tools provided by Python environment to access, transform and combine data from multiple sources to obtain consistent information.

Intelligent Query Processing w SQL Server 2019

TBA

Jak BIML ułatwił moje życie

W swojej codziennej pracy często spotykałem się z niechęcią do tworzenia powtarzalnych pakietów SSIS. Sposoby rozwiązań tego problemu były różne: od zatrudniania osób, które będą to robiły do automatyzacji swojej pracy. Tu z pomocą przyszedł BIML, który pozwolił znacznie ułatwić swoją pracę. W czasie sesji opowiem o możliwościach BIML, jak zidentyfikować idealne pakiety do przeniesienia…

Jak się nie bać failovera?

Mechanizm SQL Server Always on Availability Groups oferuje wysoką dostęność dla baz użytkownika, jednak zupełnie nie jest pomocny dla baz systemowych. Te zawierają sporo danych niezbędnych dla prawidłowego funkcjonowania instancji SQL Serwera jako całości. Na sesji opowiem, jak w StepStone Services wraz z moim zespołem poradziliśmy sobie z problemem, aby po failover nie lądować w…

Kilka uwag o projektowaniu baz danych

Zebrane doświadczenia związane z projektowaniem baz danych.

Kubernetes 101

SQL Server 2019 zaczyna wykorzystywać Kubernetes, Spark może być uruchamiany na Kubernetes, Kubernetes to naturalne środowisko dla tensorflow. Jeśli zajmujesz się tak zwaną Modern Data to istnieje duże prawdopodobieństwo, że w ciągu najbliższych miesięcy spotkasz się z Kubernetes. Przyjdź na sesję i dowiedz się czym jest Pod, Node, Container, Deployment, Service, Job czy Persistent Volumes…

Kubernetes for data scientist

TBD

Lambda Architecture with Azure Data Services

Podczas sesji zaprezentowane zostaną komponenty Azure dedykowane do odpowiednich warstw architektury Lambda. Sesja będzie miała charakter warsztatowy podczas której zostanie zbudowana architektura pozwalająca na strumieniową analizę danych. Będą opisane komponenty takie jak Azure Databricks, CosmosDB, Power BI, Azure Time Series Insight oraz inne..

Laying the Foundations for GDPR Compliance

GDPR, no matter where you are if you are handling data on European data subjects. Laying a solid foundation of data security practices is vital to avoid the potential fines and damage to reputation that being non-compliant can bring. Practicing good data hygiene is vital to meeting compliance requirements, whether it is GDPR, PCI-DSS, HIPAA…

Level Up Your Biml: Best Practices and Coding Techniques

Is your Biml solution starting to remind you of a bowl of tangled spaghetti code? Good! That means you are solving real problems while saving a lot of time. The next step is to make sure that your solution does not grow too complex and confusing – you do not want to waste all that…

Lift and shift SQL, .Net, Python, R code into Big Data solutions

Big Data processing is not only limited to data search, but is also strongly connected with use of text analysis or image processing algorithms, where machine learning models can be applied. Azure Data Lake Analytics solves many of the problems related to the efficiency and scalability of the data analysis process, but also gives the…

Log Management w stylu Big Data

Sesja wprowadzająca do zagadnienia budowy centralnego systemu zarządzania i analizy logów, bazującego na Azure Data Lake Store Gen2 (HDFS), Azure Databricks (Apache Spark, Python), Red Hat oraz syslog-ng. Dobry początek dla każdej organizacji, która gromadzi dużą ilość logów i ma potrzebę ich analizowania.

Małe dane duży kłopot, duże dane….

No właśnie…setki usług w Azure, w tym te dedykowane do przetwarzania danych. Czy aby na pewno wiesz o nich wszystko co potrzeba,by dokonać odpowiedniego wyboru i nie narazić się na poważne problemy z wydajnością? Sesja z cyklu “notatki i doświadczenia” z placu boju okiem architekta danych i CTO. Sesja z Pawłem Potasińskim 🙂 

Microsoft Azure for the DBA

Although Microsoft Azure and the concept of Cloud Computing has been around for a number of years it is still a mystery to many. This talk takes offers an introduction to Microsoft Azure and the many services it has to offer. We will then go onto look in depth at SQL Azure Database; creating, configuring,…

Microsoft R-Evolution – Operationalization with Microsoft R distribution

After Microsoft took over Revolution Analytics in 2015, they created a lot of R implementations, usage applications and extensions of available tools. The amount of them means that users may struggle to select and adapt the most appropriate of R distributions and make entire solution in production usage. During the session, you will get to…

Move part of your body to Azure Data Warehouse

Azure is cheaper, azure is faster, azure is more secure. Azure… everywhere is azure. Everywhere is data. Even if not today, certainly in the future (yes, believe me) you will face a case: how to move my data from premise Data Warehouse to Azure. This session will reveal the ideas how to do that and…

Multidimensional wiecznie żywy

Decydując się na budowę analitycznej bazy wielowymiarowej na platformie SQL Server od razu natykamy się na fundamentalne pytanie: Multidimensional czy Tabular? Ta decyzja musi zostać podjęta szybko i to zaraz na początku bitwy. Potem koszty błędnego wyboru (inaczej: zmiany narzędzia) szybują pod niebiosa. Spróbujmy więc krótko porównać oba podejścia wskazując ich wady oraz zalety, koncentrując…

Navigate Bill of Materials with SQL Server 2019 shortest path

SQL Server 2019 introduced the missing key feature for using graph databases features in a production environment; shortest path. The Shortest Path algorithm calculates the shortest (weighted) path between nodes. Define a starting node and navigate through relationships until the destination has been reached, retrieving all components along the way. In this session, I show…

New T-SQL Features in SQL Server 2016, 2017, and Beyond

Discover the ins and outs of some of the newest capabilities of our favorite data language. From SESSION_CONTEXT() to DROP IF EXISTS to CREATE OR ALTER to new query-level hints, you’ll walk away with a long list of reasons to consider upgrading to the latest version.

Non-trivial approach to table partitioning

Do you have very large tables in your database or do you want to effectively back up older data? Partitioning is the answer. At the beginning of the session, I will present a theory on why partitioning can be helpful for your database. Then, I will show practical methods concerning the application of partitioning in…

Nowoczesne hurtownie danych

Microsoft zaproponował dwa nowe podejścia do budowy nowoczesnych hurtowni danych. Jednym z nich jest SQL Server Big Data Cluster, drugim Azure Synapse Analytics. W czasie sesji przyjrzymy się ich zastosowaniom oraz różnicom pomiędzy tymi dwoma podejściami. Poznamy także wady i zalety rozwiązań opartych o chmurę na podstawie przykładów polskich klientów, w których wraz z moim…

Odloty w T-SQL vol. 2

TBD

Opening, Keynote

Opowiedz mi swoją historię czyli dynamiczne raportowanie w Power BI

Posiadanie danych to za mało. Przygotowanie statycznego raportu pokazującego te dane – to znacznie za mało. Dziś na równi z informacją liczy się sposób jej podania. Na nudne wykresy i kilometrowe tabelki nie ma już miejsca. Chcesz zachwycić? Musisz pokazać historię, wprawić wszystko w ruch, dać odbiorcy swobodę w kreowaniu widoku. Możliwości oferowane przez platformę…

Optymalizacja dużych modeli Azure Analysis Services

Na sesji zaprezentuję w jaki sposób należy obchodzić się z naprawdę dużymi modelami w Azure Analysis Services. Zacznę od redukcji rozmiaru poprzez włączenie opcji, które normalnie nie są widoczne w Visual Studio. Przedstawię strategie partycjonowania dostosowane do potrzeb biznesowych. Na końcu pokażę jak optymalizować miary, aby działały wydajnie na dużych zbiorach danych. W skrócie –…

Partycjonowanie danych w rozwiązaniach Big Data

Partycjonowanie danych to jedna technik, pozwalająca znacząco poprawić wydajność naszych zapytań. Znajduje ona zastosowanie nie tylko w relacyjnych bazach danych, ale również jest powszechnie używana w przypadku przechowywania i przetwarzania dużych zbiorów danych nazywanych powszechnie Big Data. Na sesji przyjrzymy się mechanizmom partycjonowania i dystrybucji danych dostępnych w usługach Azure Data Lake Analytics, Apache Hive…

Performance Tuning dla Specialistów Business Intelligence

W świecie Business Intelligence i hurtowni danych wydajność jest niezwykle ważnym aspektem. Skończony czas potrzebny na dokonanie wszelkiego rodzaju transformacji i ograniczone zasoby sprzętowe mogą stanowić poważną przeszkodę dla wielu projektów. Podczas sesji przedstawione zostaną praktyki pozwalające uzyskać dobrą wydajność i bardziej stabilne rozwiązanie. Powiemy zarówno o technikach optymalizacyjnych użytecznych przy ładowaniu danych jak i…

Place of Data Vault 2.0 Architecture in data warehouses

Another look or addition to the existing architecture of our data warehouses? I will present the concept of Data Vault 2.0 architecture and its place in cooperation with other architectures. We will talk about the pros and cons of existing solutions and we will answer the question whether the new architecture is the answer to…

Power BI i Report Server Power BI w korporacji, średniej oraz małej firmie. Największe wątpliwości klientów. 

Liczne spotkania architektoniczne z klientami różnej wielkości i poziomie rozwoju obszaru danych, sprowadzają się m.in do następujących wniosków: doceniamy wartość Self-Service, ale martwimy się potencjalnym chaosem danych, Power BI jako cudowne rozwiązanie wszelakich problemów, mamy już hurtownię, to po co nam Power BI czy jak udostępnić Power BI kilku tysiącom użytkowników jednocześnie mając go pod…

Power BI Report Server (PBIRS) – What / Why & How?

powerbi.com – as a cloud-based SaaS solution for self-service busines intelligence (BI) – is available since two years. Succeeding the Microsoft reporting roadmap announcements and it’s proposed cloud and on-premises feature parity the community had to wait for more than 1 year for news. With the release of the Power BI Report Server (PBIRS) in…

Power BI w praktyce

TBA

Power BI, a Mapa Polski powiatowej

Większość wizualizacji w Power BI wykorzystuje globalne analityki danych – kontynent, kraj, kluczowe miasta. Albo: Stany Zjednoczone, stan, hrabstwo. Do tego AdventureWorks, rzadziej Contoso, Wide World Importers. O Northwind mało kto pamięta. Globalna wioska jest przepełniona takimi właśnie danymi. Jednak kiedy analityk, deweloper chce tą myśl technologiczną przenieść na krajowe podwórko, to rzeczywistość może niemiło…

Power of Azure ML with Power BI

Azure Machine Learning is in very high demand and is been used by almost every digital organization. Come and learn Azure ML to customize Power BI reports to predict results and mainly for Power BI Developers and Data Scientists and analysts. We are not leaving top management people alone and without the need of customizing…

Power Platform w służbie działom HR

Procesy HR-owe obsłużone przy użyciu Power Platform: PowerApps, Power BI, Power Automate, ale nie tylko – również Sharepoint Online, ale także embedowanie Power BI w ISV apps.

Praca z bazą daną – czyli jak okiełznać starego potwora

Trafiłeś do projektu, który nigdy wcześniej nie miał Administratora Baz Danych?Twój manager oznajmił Ci, że od teraz Ty jesteś odpowiedzialny za utrzymanie Bazy? Baza ma tysiące obiektów, ale wiekszość z nich nie jest już używana?Lubisz wyzwania… ale w tej sytuacji nie wiesz od czego zacząć?Wbrew pozorom to nie jest to odosobniony przypadek. Na tej sesji…

Praktyczne utrzymanie dużych baz danych działających 24/7

Sesja poświęcona jest utrzymaniu dużych baz danych w kontekście defragmentacji indeksów bez przerw technicznych z wykorzystaniem współbieżności.

Projektowanie dla LUDZI – projektowanie wizualizacji w Power BI zgodne z ludzką percepcją

Według najnowszych badań rozumny człowiek pojawił się 300 tysięcy lat temu na ziemi. Około 10 tysięcy lat temu zaczął się ucywilizować przez wprowadzenie uprawy zbóż. Ewolucja ludzkiego układu poznawczego miała na celu maksymalizacje przetrwania gatunku. Sposób w jakim żyjemy obecnie jest mgnieniem oka z punku widzenia czasu a nasze zmysły ciągle tkwią w jaskini w…

Python i uczenie maszynowe na dużą skalę w Apache Spark

Databricks, który jest w portfelu usług większości chmurowych potentatów, to w dużej mierze Apache Spark. Język Python jest wszędzie i wykorzystywany jest bardzo często także w procesie uczenia maszynowego. Połączenie tych technologii pozwala czerpać doświadczenie z najlepszych wzorców, a niniejsza prezentacja ma na celu pokazanie sposobów przejścia od analizy “małych” zbiorów danych do wielkich zestawów…