2 Fast 2 Furious – designing for speed, concurrency, and correctness

With the multitude of isolation levels, concurrency models, and specialist technologies available in SQL Server, it is no surprise that transaction throughput and correctness can be directly correlated to the ability and knowledge of the person that wrote the code. In this session, we will reveal how SQL Server concurrency and correctness often goes wrong,…

A Masters view on Locking and blocking

How do the wait stats show you that you have a locking issue?This session will show you how to detect and view blocking and lock waits, and understand the cause of it.An extensive walkthrough of the different isolation levels and their respective benefits and drawbacks.And finally a real-world quick list of suggestions on what you…

ADFv2 – Data Integration in Azure Just Got Awesome

Azure Data Factory version 2 (ADFv2) arrived in Sept17 with a bunch of new concepts and features to support our Azure data integration pipelines. In this session, we’ll update your ADFv1 knowledge and start to understand the true nature of scale out control flows and data flows. What’s the integration runtime? Can we easily lift…

AI i Data Science w przemyśle

W dzisiejszym świecie AI i Data Science zyskują coraz bardziej na popularności. Dzieje się tak nie tylko dlatego, że oferują technologicznie zaawansowane i ciekawe rozwiązania, ale głównie dlatego, że znajdują bardzo szerokie zastosowanie w rozwiązywaniu rzeczywistych problemów. Sesja ma na celu zainspirowanie ludzi pracujących w przemyśle i szeroko rozumianym biznesie do wykorzystania możliwości sztucznej inteligencji…

Anomaly Detection in Predictive Maintenance for Sql Server

The amount of data we collect, store and process is rapidly growing and goes hand in hand with growing amount of work related to managing it. Automation is a key if we want to stay in control and AIOps represents its next major level with potential to revolutionise IT operations. This session explains what AIOps…

AQP czy IQP?

SQL Server 2017 rewolucyjnie rozpoczął wsparcie dla automatycznego tuningu zapytań. Początkowo nieśmiało wykorzystano informacje przechowywane w plan cache oraz query store. Nadchodzi jednak SQL Server 2019, a w nim już cała plejada całkiem przydatnych nowości: batch mode on rowstore, memory grant feedback, interleaved execution, adaptative joins, deferred compilation oraz approximate query processing. Owe nowości tworzą…

Are You Optimistic About Concurrency?

What exactly does it mean to have optimistic concurrency? What is the alternative? Is SQL Server 2012’s SNAPSHOT Isolation optimistic? How can SQL Server 2016’s In-Memory OLTP provide truly optimistic concurrency? In this session, we’ll look at what guarantees the various isolation levels provide, the difference between pessimistic and optimistic concurrency, and the new technology…

Attention Contention!!!

In this session we will discuss about tempdb contention in SQL Server on-premises, Azure SQL Managed Instance and Azure SQL Database.We will analyze both, Allocation Contention and Metadata contention, describing in detail WHEN and HOW it occurs, How to diagnose it, Best Practices and how to prevent it.The session will have both approaches in on-premisses…

Automating the testing of your BI solutions with NBi

If you want to accelerate the testing of your BI solution, the best strategy is to automate your tests with the help of a dedicated framework. During this session, we’ll take a look to the features of the open-source framework named “NBi” (nbi.codeplex.com). This framework is providing support for automated tests on the fields of…

Avoid report limitations with advanced Power BI and DAX

The most of you are familiar with Power BI and had already created a lot o reports. But what to do when limitations disallow you to satisfy business needs? During this session we’ll face with this issue. Having number of different business requirements we’d walk around limitations and provide fully useful solutions. We’d play with…

Azure CosmosDB – jak używać, kiedy i gdzie. A kiedy nie!

W czasie tej sesji będę chciał pokazać kilka przykładów wykorzystania bazy CosmosDB przez klientów w Polsce i przy okazji opowiedzieć kiedy warto wykorzystywać tę bazę a kiedy nie. Bazy NoSQL posiadają wiele zalet ale źle użyte, powodują więcej strat niż zysków.

Azure Data Factory i proces CI/CD w Azure DevOps

Pracując nad przepływami w Azure Data Factory pojawia się naturalna potrzeba, mądrego i w miarę możliwości zautomatyzowanego wdrażania naszych zmian na kolejne środowiska. Dobrze, gdybyśmy mieli również możliwość porównania zmian pomiędzy wersjami oraz w razie potrzeby cofnięcia się do wcześniejszej wersji naszych przepływów. Na sesji zaprezentuję w jaki sposób możemy wykonać automatyczny proces CI/CD (Continuous…

Azure Databricks 101

Many sources? Various format? Unstructured data? Big Data? You might think that these only a buzz words. Not really. These days it’s a part of modern data flow architecture. No matter what do you use – SQL Server, Cosmos DB, Azure SQL DW, Azure Data Factory, Data Lake… somewhere there you can find Databricks. So,…

Azure Databricks: big data made easy

Databricks is to Spark as PaaS is to IaaS. If you’ve ever wanted to explore big data world but shied away because of its complexity, worry no more! During this session we will not only focus on Spark basics, but also cover practical examples of batch, interactive and streaming processing.

Azure IoT Solution Architecture Best Practices

The Internet of Things is becoming reality at a rapid pace. Many objects in the real world can be connected to the Internet. Cloud computing is the best option for the IoT backend. Microsoft Azure offers the offers a wide range of services, used in the Internet of Things solutions This presentation provides a deeper…

Azure Machine Learning Workbench

Microsoft do bogatej oferty rozwiązań służących do budowy modeli uczenia maszynowego dołączył nowe – Azure Machine Learning Workbench. Poznajmy w czasie sesji możliwości tego rozwiązania, przechodząc przez typową ścieżkę uczenia maszynowego. Zobaczymy różnorodne scenariusze począwszy od lokalnej pracy, kontenerów, jak i pracy z serwerem Spark w chmurze.

Azure Orchestration – Applying Data Factory in Production

If you have already mastered the basics of Azure Data Factory (ADF) and you are now looking to advance your knowledge of the tool, this is the session for you. Yes, Data Factory can handle the orchestration of our ETL pipelines. But what about our wider Azure environment? In this session we will take a…

Azure SQL Data Warehouse – raport z pola walki

SQL Data Warehouse jest jedną z tych usług PaaS w Azure, których można użyć, jeśli elementem rozwiązania analitycznego powinna być hurtownia danych przez duże „hurt” (czytaj – ilość danych taka, że aż boli). W teorii usługa ta przypomina platformę SQL Server albo – może bardziej – rozwiązanie sprzętowo-programowe Analytics Platform System (dawniejsze Parallel Data Warehouse).…

Azure SQL Database – wczoraj, dziś, jutro

Od dłuższego czasu obserwujemy dynamiczny rozwój usługi SQL Database – coraz więcej korzyści wynikających z przenoszenia rozwiązania do modelu PaaS, nowe możliwości w Data Platform, dostępne najpierw w chmurze. Podczas sesji przedstawię najnowsze zmiany i kierunki w których następuje ewolucja SQL Database w zakresie wydajności, bezpieczeństwa czy zarządzania usługą.

Azure SQL Datawarehouse – The Complete Introduction

Azure SQL Datawarehouse is not really the standard SQL Server that you could point your existing SSIS packages and reporting queries at and expect the same behaviour and performance. So why is that? And what should you do different to get the most out of Azure SQL DB? In this session I will explain what…

Back to the Future: Accelerating the Cloud Migration of Legacy SSIS with Azure Data Factory

This session focuses on the new features to unblock/accelerate cloud migration of legacy SSIS, such as 2008 or earlier versions, with Azure Data Factory (ADF). We will first show you how to provision Azure-SSIS Integration Runtime (IR) – dedicated ADF servers for running SSIS – and extend it with custom/Open Source/3rd party components. We will…

Bazy danych w SSDT (cz.1): Praca z projektem oraz praktyczne wskazówki

Zadanie wydaje się proste: utrzymywać projekt bazy danych w repozytorium, traktować go jako master-version oraz wykonywać wdrożenia w regularnych i niezbyt długich odstępach czasu. Proste? Pozornie. Sprawy się komplikują gdy ilość obiektów w bazie rośnie. Gdy zamiast jednej bazy, mamy kilkanaście. Kiedy bazy danych posiadają referencje do siebie nawzajem. A co z tabelami słownikowymi? Gdzie…

Bazy danych w SSDT (cz.2): Wdrażanie w procesie CI/CD z Azure DevOps

Pracując nad bazą danych w SSDT pojawia się potrzeba wdrożenia naszych zmian na kolejne środowiska i jednocześne utrzymanie spójności baz pomiędzy środowiskami. Na sesji zaprezentujemy jak możemy wykonać wdrożenia ręcznie a nastepnie przejść do procesu Continuous Integration oraz Continuous Deployment z zastosowaniem środowiska Azure DevOps (dawniej VSTS).Ponadto popracujemy nad wpleceniem w nasz proces unit testów…

Call for action – Raporty motywujące do działania z wykorzystaniem Power BI

Czy raport ma po prostu ładnie wyglądać i pokazywać liczby? Nie! Ma angażować użytkownika końcowego, wzbudzać w nim emocje, prowokować do działania a przez to maksymalizować wartość z jego utrzymywania. O tym sobie poopowiadamy na sesji z wykorzystaniem przykładów biznesowych i narzędzia Power BI.

Case study: Wdrożenie mechanizmu klasy Transactional Analytics w Straży Granicznej

Czasami od systemu oczekujemy zarówno wydajności hurtowni danych, jak i wysokiej współbieżności w przetwarzaniu transakcji. Choć są ich setki milionów, każda jest potencjalnie tak samo ważna i musi być dostępna w najdrobniejszych szczegółach. Na sesji opowiemy, dlaczego system obsługi odpraw granicznych ma wszystkie te cechy, w jaki sposób poradziliśmy sobie z potrzebami analitycznymi na danych…

Challenges on GDPR from a database perspective

GDPR is the European Regulation that gives directives about data protection from an individual level. Every person in Europe is entitled to the some data rights which, at the organizational side, cause some major changes in how the information is managed and, consequently, affects the design and implementation of any applications that utilizes data. DBAs,…

Choosing the Right Database for Microservices Solutions

The past years have seen the explosive growth of large-scale distributed systems. This trend has changed the database world that is arguably without precedent in the history of the software industry. The result is a ompetitive database marketplace with a huge variety of platforms for us to choose from. But how do we go about…

Ciemna strona mocy czyli antywzorce

Czasem spotyka się rozwiązania problemów prowadzące do innych problemów. Jeżeli wielu ludzi wpada na ten sam pomysł lub zaczyna powielać nienajlepsze rozwiązania to pojawia się antywzorzec. Niektóre nawet mają już swoje nazwy. Przyjrzyjmy się kilku powszechnym i ciekawym.

Classifying support tickets using text analysis and machine learning

Machine learning is a very rapidly evolving branch of IT and you can find examples of companies using it almost in every industry. In my presentation I would like to talk about one particular company I collaborated with to build a solution for automatic classification of support tickets. I will discuss different tools and technics…

Cloud Data Wars: Przebudzenie mocy

Każda chmura ma własną armię w obszarze usług danych. Każdy dostawca twierdzi, że jego usługi są najlepsze i wyjątkowe. Zobaczmy, czy to naprawdę przebudzenie mocy i kto jest po jasnej, a kto po ciemnej stronie mocy. Niech siła usług w obszarze danych będzie z wami …

Co jest (NIE) możliwe z Microsoft SQL Server 2017 na systemie Linux (na Azure)

Sesja demo na temat tego co jest możliwe oraz przegląd tego, co nie jest możliwe kiedy decydujemy się na wdrożenie Microsoft SQL Server 2017 na systemie Linux (na platformie Azure).

Co powinieneś wiedzieć o Databricksach, a o czym prawdopodobnie nie masz pojęcia

Azure Databricks to usługa szybko adaptowana przez wiele firm. Pozwala na wykonywanie zapytań potrzebujących dużej mocy obliczeniowej. Sama może się skalować w celu przyspieszenia obliczeń. Do tego pozwala na używanie kilku języków programowania. Można pokusić się o stwierdzenie, że rozwiąże wszystkie problemy… ale tylko i wyłącznie świadomych użytkowników. W trakcie sesji pokażemy o czym należy…

Columnstore Clustered vs Nonclustered, when to choose what

The incredible Columnstore Indexes can increase your analytical query processing speed multiple times, they are updatable (Clustered from SQL Server 2014 and Nonclustered from SQL Server 2016 respectively), but they keep on supporting different sets of the functionalities – such as CDC (Nonclustered Columnstore) and LOBs (Clustered Columnstore), and this brings a great confusion. This…

Common Data Model – hurtownia danych z pudełka?

Jedno narzędzie by wszystkimi danymi rządzić… Czy możliwe jest wykorzystanie jednej platformy jako bazy dla różnych aplikacji biznesowych i raportowych, łącząc tym samym świat danych transakcyjnych i analitycznych? Opowiemy czym jest Common Data Model oraz zaprezentujemy przykłady jego wykorzystania jako substytutu hurtowni danych oraz integrację z Power BI.

Common Enterprise Analytics Architectures with Azure Data Services and Power BI

This session will tie together the components of the modern data warehouse stack including Azure Data Factory, Azure Data Lake Storage Gen2, Azure Databricks, Azure SQL Data Warehouse, Azure Analysis Services and Power BI. Learn how to operationalize end-to-end BI architectures covering everything from data ingestion, preparation to reporting and analytics. Join us and learn…

Comparing Predictive Mining Models from R, Python, SSAS, and Azure ML

There is a lot of overlapping in Microsoft BI suite. For advanced analytics, like data mining, you can use SQL Server Analysis Services (SSAS), or R, or Python, or Azure ML. The question arises which tool to use. The answer is simple, through another question. Why not all of them? In data mining, you typically…

Complex Azure Orchestration with Dynamic Data Factory Pipelines

If you have already mastered the basics of Azure Data Factory (ADF) and are now looking to advance your knowledge of the tool this is the session for you. Yes, Data Factory can handle the orchestration of our ETL pipelines. But what about our wider Azure environment? In this session we’ll go beyond the basics…

CosmosDB for (scary) developers

Sesja poświęcona chmurowej bazie dokumentowej i podejściu deweloperskim do niej. Jeśli nie boisz się Java Scriptu a i JSON Ci nie obcy, to koniecznie zawitaj na tej sesji. Jeśli Java Script wywołuje jednak u Ciebie gęsią skórkę, to też się nie wahaj i przyjdź. Spróbuję Cię przekonać, że nie taki diabeł straszny.

Creating Custom Visuals in Power BI with TypeScript and D3.js

This presentation is about how to create custom visuals (components) for your PowerBI reports. Power BI reporting features could be extended with custom components, that developers can implement and BI specialist can include in their dashboards. Many visuals are also availabe in the Power BI Visuals Gallery. Power BI is flexible with which graphical API…

Data Driven Decision Making with Azure Machine Learning

Azure Machine Learning [ML] is a great tool for providing deep analytical data analysis and can provide a great learning environment to those people who are just getting started with learning machine learning concepts as well as those who want to deploy complex models created in R or Python. This session will introduce how to…

Data Lake praktycznie, czyli nie ważne jak zaczynasz, ważne jak kończysz

Wraz z upływem czasu rośnie wolumen danych w systemach sprzedażowych, a nie każda hurtownia danych jest gotowa dziesiątek terabajtów danych. Z pomocą przychodzi Data Lake, który jest w stanie przetworzyć takie wolumeny dzięki „nieograniczonej” możliwości skalowania. Jak podejść do tematu od A do Z, od źródeł danych po pierwsze analizy? Pokażemy jak w łatwy sposób…

Data Overview and Manipulation – T-SQL, R, Python

In a real data mining or machine learning project, you spend more than half of the time on data preparation and data understanding. The R language is extremely powerful in this area. The Python language is a match. Of course, you do work with data by using T-SQL. You will learn in this session how…

Data Science w praktyce

Nurtują Cię pytania: Czym jest nauka o danych (data science)? Jak zastosować jej koncepcje, metody i narzędzia  do rozwiązywania problemów biznesowych? Jak wygląda proces wdrażania rozwiązań data science? Trzech doświadczonych ekspertów postara się odpowiedzieć na te pytania w trakcie trwania sesji. Łukasz Grala Krzysztof Odasz Jakub Wawrzyniak

Database as a Service offering in Azure – Architect Perspective

Cloud offers number of database options – starting from simple Tables within Azure Storage, through number of PaaS offerings, finishing with complicated IaaS clusters based on Casandra, SQL Server oraz Oracle with RAC option. Choosing between them is not easy and I often see customers struggling to decide which option is the best for them.…

dbachecks – The PowerShell Module to validate your SQL Estate

As a SQL DBA you want to know that your SQL Server Estate is compliant with the rules that you have set up. Now there is a simple method to set this up using PowerShell and you can get the results in PowerBi or a report emailed to you on a schedule. Details such as…

Design Myths

Prepare for a surprising, intriguing, and even controversial session. 45 years after Codd defined the Relational Model, there are still so many parts misunderstood. For sure there are points where you will be surprised and change your view, even though you might have been convinced for years that your view is the correct one, and…

Docker dla amatora danych

Docker nie jest niczym nowym, ale wydaje się, że właśnie teraz bije rekordy popularności. Jakiś czas temu postanowiłem, że ja również poznam tę technologię i sprawdzę w jaki sposób może pomóc komuś takiemu jak ja. Mimo, iż póki co w bieżących projektach nie mogę korzystać z kontenerów, to okazuje się, że jego znajomość już jest…

Dont’t Use Cursors – or Why You Maybe Should Use a Cursor After All

You might have heard „don’t use cursors, they are slow!”. In this presentation, you will learn that normally you should write set-based statements instead, and I will explain why they generally are faster. But I will also look at situations where using a loop for one reason or another is preferrable, and you will learn…

Ethereum proof-of-authority consortium on Azure cloud platform

Omówiona zostanie zaawansowana koncepcja proof-of-authority w rozwiązaniu blockchain Ethereum. Przedstawiona zostanie idea węzła walidatora. Podstawy wydobycia (mining) oraz metoda generowania kosztów i zużycia energii (PoW) w komputerach oraz generowania transakcji będą omówione zarówno z zaletami, jak i wadami. Opowiem o przykładzie użycia prywatnych bloków w przemyśle. Całe wdrożenie sieci prywatnej/konsorcjum Ethereum będzie prezentowane na platformie…

Examples of using Spark in Azure for data processing

Spark is a great technology for parallel computing and processing data. It was designed to be fast! And Azure could be a great way to try it. In this session we will look through the capabilities of Spark using a couple of real-world examples to ensure, that it is a great technology and really worth…

Failure prediction for manufacturing industry with SQL Server & R

Working in manufacturing industry means that you must deal with product failures. As a BI and/or Data Scientist developer, your task is not only monitor and report product’s health state during its lifecycle, but also predict the likelihood of a fail in the production phase or when product has been delivered to the customer. Machine…

Fast & Furious – czyli sesja o tych najbardziej wydajnych bazach danych w chmurze

Niezależnie od tego czy wdrażasz aplikację web, planujesz budowę hurtowni danych, czy eksperymentujesz ze strumieniami danych – baza danych to podstawa Twojej architektury. W trakcie tej sesji omówimy i pokażemy jak funkcjonują najbardziej wydajne silniki bazodanowe…oczywiście w chmurze.

From failure to international conference speaker

Life really is like a box of chocolates. You never know what you’re going to get. In only a handful of years, my life has changed drastically in a very positive way. I used to be almost out of a job, now I’m a consultant working for a firm that has over 2500 employees. I…

Get data insights faster with Data Wrangling

Self-Service Data Preparation aka Data Wrangling is becoming more and more popular in BigData and Enterprise world. Data Lake stores tons of different data and it is not easy to get value from it. Traditional approach doesn’t work here, data analysts and data scientists have to wait until IT guys gather requirements and prepare a…

Getting Started with Azure Databricks

Azure Databricks provides the ability to use massive scale to read and stream data to create machine learning solutions to provide insight for large data stores. In this session you will learn how to get started in Databricks, and when it is the right tool for your data science project. We will also walk through…

Getting Started with Linux for the SQL Server DBA

With the introduction of SQL Server 2017 for Linux, there is no escaping the fact that SQL Server DBAs need to be familiar with the Linux operating system. So, how do you start? In this session, you will learn the most important fundamentals and commands that are important to the DBA when managing a database…

Hacking SQL Server

You have been working with SQL Server for several years and you feel quite comfortable with most of the available features. Even you have a checklist for installation/configuration of SQL Server to be compliant with corporate standards. However, somewhere on the back of the head you have a feeling that there is something more that…

Identity, Sequence and ROW_NUMBER

This session is about tools in T-SQL that allow you to generate a sequence of values, often used as surrogate keys, but sometimes for other purposes. The session covers the identity column property and the limitations it imposes. It covers the sequence object, and compares and contrasts it with the identity property, including a performance…

Impreza wieczorna

Integracja wieloźródłowych heterogenicznych danych przy użyciu języka Python

Analityk często potrzebuje informacji z wielu źródeł o uporządkowanych i nieustrukturyzowanych danych, stojąc często w obliczu ich niespójności i sprzeczności. Celem prezentacji jest przegląd narzędzi udostępnianych przez środowisko Python, które umożliwiają dostęp, transformacje i łączenie danych z wielu źródeł tworząc spójne informacje.

Intelligent Query Processing w SQL Server 2019

TBA

Jak BIML ułatwił moje życie

W swojej codziennej pracy często spotykałem się z niechęcią do tworzenia powtarzalnych pakietów SSIS. Sposoby rozwiązań tego problemu były różne: od zatrudniania osób, które będą to robiły do automatyzacji swojej pracy. Tu z pomocą przyszedł BIML, który pozwolił znacznie ułatwić swoją pracę. W czasie sesji opowiem o możliwościach BIML, jak zidentyfikować idealne pakiety do przeniesienia…

Jak się nie bać failovera?

Mechanizm SQL Server Always on Availability Groups oferuje wysoką dostęność dla baz użytkownika, jednak zupełnie nie jest pomocny dla baz systemowych. Te zawierają sporo danych niezbędnych dla prawidłowego funkcjonowania instancji SQL Serwera jako całości. Na sesji opowiem, jak w StepStone Services wraz z moim zespołem poradziliśmy sobie z problemem, aby po failover nie lądować w…

Kilka uwag o projektowaniu baz danych

Zebrane doświadczenia związane z projektowaniem baz danych.

Klasyfikacja obrazów przez modele uczenia maszynowego

Sztuczna inteligencja nazywana jest elektrycznością XXI wieku. Sto lat temu upowszechnienie energii elektrycznej zmieniło sposoby w jaki pracujemy, podróżujemy, odpoczywamy — choć tego nie zauważamy, wynalezienie elektryczności zmieniło cały nasz świat. Dzisiaj, dzięki sztucznej inteligencji, jesteśmy świadkami rewolucji na podobną skalę. Przełomem okazało się zastosowanie głębokich modeli uczenia maszynowego do takich zadań, jak klasyfikacja obrazów…

Kostki SSAS – zoptymalizowane dla dużych hurtowni danych

Pracując z modelem wielowymiarowym, który oparty był na ogromnej hurtowni danych natknąłem się na wiele problemów, które nigdy wcześniej nie pojawiły się w małych projektach. Podczas sesji podzielę się technikami optymalizacji zarówno samych kostek jak i ich administrowania jak i dalszego rozwijania. Porozmawiamy zarówno o konfiguracji serwera, błędach developerów, procesowaniu jak, publikacji zmian i wiele…

Kubernetes 101

SQL Server 2019 zaczyna wykorzystywać Kubernetes, Spark może być uruchamiany na Kubernetes, Kubernetes to naturalne środowisko dla tensorflow. Jeśli zajmujesz się tak zwaną Modern Data to istnieje duże prawdopodobieństwo, że w ciągu najbliższych miesięcy spotkasz się z Kubernetes. Przyjdź na sesję i dowiedz się czym jest Pod, Node, Container, Deployment, Service, Job czy Persistent Volumes…

Kubernetes for data scientist

TBD

Lambda Architecture with Azure Data Services

Podczas sesji zaprezentowane zostaną komponenty Azure dedykowane do odpowiednich warstw architektury Lambda. Sesja będzie miała charakter warsztatowy podczas której zostanie zbudowana architektura pozwalająca na strumieniową analizę danych. Będą opisane komponenty takie jak Azure Databricks, CosmosDB, Power BI, Azure Time Series Insight oraz inne..

Laying the Foundations for GDPR Compliance

GDPR, no matter where you are if you are handling data on European data subjects. Laying a solid foundation of data security practices is vital to avoid the potential fines and damage to reputation that being non-compliant can bring. Practicing good data hygiene is vital to meeting compliance requirements, whether it is GDPR, PCI-DSS, HIPAA…

Level Up Your Biml: Best Practices and Coding Techniques

Is your Biml solution starting to remind you of a bowl of tangled spaghetti code? Good! That means you are solving real problems while saving a lot of time. The next step is to make sure that your solution does not grow too complex and confusing – you do not want to waste all that…

Log Management w stylu Big Data

Sesja wprowadzająca do zagadnienia budowy centralnego systemu zarządzania i analizy logów, bazującego na Azure Data Lake Store Gen2 (HDFS), Azure Databricks (Apache Spark, Python), Red Hat oraz syslog-ng. Dobry początek dla każdej organizacji, która gromadzi dużą ilość logów i ma potrzebę ich analizowania.

Lunch break, networking

Lunch break, networking

Lunch break, networking

Małe dane duży kłopot, duże dane….

No właśnie…setki usług w Azure, w tym te dedykowane do przetwarzania danych. Czy aby na pewno wiesz o nich wszystko co potrzeba,by dokonać odpowiedniego wyboru i nie narazić się na poważne problemy z wydajnością? Sesja z cyklu „notatki i doświadczenia” z placu boju okiem architekta danych i CTO. Sesja z Pawłem Potasińskim 🙂 

Microsoft Azure for the DBA

Although Microsoft Azure and the concept of Cloud Computing has been around for a number of years it is still a mystery to many. This talk takes offers an introduction to Microsoft Azure and the many services it has to offer. We will then go onto look in depth at SQL Azure Database; creating, configuring,…

Microsoft R-Evolution – Przegląd dystrybucji Microsoft R oraz zarządzanie rozwiązaniem bazującym na R

Po przejęciu przez Microsoft firmy Revolution Analytics w 2015 r. powstało wiele produktów R, rozszerzeń oraz dostępnych narzędzi. Ich ilość spowodowała, że użytkownicy mogą mieć trudności z wyborem i dostosowaniem najbardziej odpowiedniego rozwiązania z dystrybucji Microsoft by później uczynić całe rozwiązanie produkcyjne. Podczas sesji dowiesz się: – Jakie są różnice między dystrybucjami R w Microsoft…

Miejsce architektury Data Vault 2.0 w hurtowniach danych

Inne spojrzenie czy dodatek do istniejącej architektury naszych hurtowni danych? Przedstawię koncepcję architektury Data Vault 2.0 oraz jej miejsce we współpracy z innymi architekturami. Porozmawiamy o wadach i zaletach istniejących rozwiązań oraz odpowiemy sobie na pytanie czy nowa architektura to odpowiedź na wszelkie dotychczasowe problemy w hurtowniach danych.

Move part of your body to Azure Data Warehouse

Azure jest tańszy, Azure jest szybszy, Azure jest bardziej bezpieczny. Azure… wszędzie rozwiązania w chmurze. Dane, duże ilości danych. Nawet jeśli nie dzisiaj – z pewnością w najbliższej przyszłości (uwierz) staniesz przed dylamentem: jak przenieść nasze środowisko, a tym dane, ze hurtowni danych On-Premise do Azure. Podczas sesji przyjrzymy się sposobom takiej migracji i porównaniem…

Multidimensional wiecznie żywy

Decydując się na budowę analitycznej bazy wielowymiarowej na platformie SQL Server od razu natykamy się na fundamentalne pytanie: Multidimensional czy Tabular? Ta decyzja musi zostać podjęta szybko i to zaraz na początku bitwy. Potem koszty błędnego wyboru (inaczej: zmiany narzędzia) szybują pod niebiosa. Spróbujmy więc krótko porównać oba podejścia wskazując ich wady oraz zalety, koncentrując…

Navigate Bill of Materials with SQL Server 2019 shortest path

SQL Server 2019 introduced the missing key feature for using graph databases features in a production environment; shortest path. The Shortest Path algorithm calculates the shortest (weighted) path between nodes. Define a starting node and navigate through relationships until the destination has been reached, retrieving all components along the way. In this session, I show…

New T-SQL Features in SQL Server 2016, 2017, and Beyond

Discover the ins and outs of some of the newest capabilities of our favorite data language. From SESSION_CONTEXT() to DROP IF EXISTS to CREATE OR ALTER to new query-level hints, you’ll walk away with a long list of reasons to consider upgrading to the latest version.

Nietrywialne podejście do partycjonowania tabel

Masz bardzo duże tabele w swojej bazie danych, a może chcesz archiwizować swoje starsze dane w efektywny sposób? Tu z pomocą przychodzi nam partycjonowanie. W czasie sesji na wstępie przedstawię teorię, dlaczego korzystanie z partycjonowania może być korzystne dla naszej bazy danych. Następnie pokażę praktyczne metody zastosowania partycjonowania w tabelach, jakie korzyści niesie to za…

Nowoczesne hurtownie danych

Microsoft zaproponował dwa nowe podejścia do budowy nowoczesnych hurtowni danych. Jednym z nich jest SQL Server Big Data Cluster, drugim Azure Synapse Analytics. W czasie sesji przyjrzymy się ich zastosowaniom oraz różnicom pomiędzy tymi dwoma podejściami. Poznamy także wady i zalety rozwiązań opartych o chmurę na podstawie przykładów polskich klientów, w których wraz z moim…

Od Big Data do wiedzy zawartej w danych, czyli 2h live demo, część 1

Olbrzymie ilości różnorodnych danych otaczają nas z każdej strony, jednak zarówno ogrom ten, jak i rozmaitość są pierwotnie źródłem dezorientacji, a nie korzyści. Dopiero odpowiednia obróbka danych pozwala ujawnić wartościowe informacje i wiedzę w nich zawartą, które mogą przynieść realne korzyści biznesowe. W czasie sesji nasz zespół praktyków zaprezentuje, jak od danych dojść do celów…

Od Big Data do wiedzy zawartej w danych, czyli 2h live demo, część 2

Olbrzymie ilości różnorodnych danych otaczają nas z każdej strony, jednak zarówno ogrom ten, jak i rozmaitość są pierwotnie źródłem dezorientacji, a nie korzyści. Dopiero odpowiednia obróbka danych pozwala ujawnić wartościowe informacje i wiedzę w nich zawartą, które mogą przynieść realne korzyści biznesowe. W czasie sesji nasz zespół praktyków zaprezentuje, jak od danych dojść do celów…

Odloty w T-SQL vol. 2

Sesja będzie kontynuacją mojej sesji sprzed blisko dekady, gdzie pokazywałem dziwaczne, choć efektywnie działające konstrukcje kodu Transact SQL. Tym razem również pokażę parę nietypowych zastosowań, często na granicy poprawności, które mogą przydać się w życiu codziennym. Wspomnę też, które ze starych odlotów zostały po cichu przez Microsoft załatane, a które wciąż mają się dobrze. Zapraszam…

Opowiedz mi swoją historię czyli dynamiczne raportowanie w Power BI

Posiadanie danych to za mało. Przygotowanie statycznego raportu pokazującego te dane – to znacznie za mało. Dziś na równi z informacją liczy się sposób jej podania. Na nudne wykresy i kilometrowe tabelki nie ma już miejsca. Chcesz zachwycić? Musisz pokazać historię, wprawić wszystko w ruch, dać odbiorcy swobodę w kreowaniu widoku. Możliwości oferowane przez platformę…

Optymalizacja dużych modeli Azure Analysis Services

Na sesji zaprezentuję w jaki sposób należy obchodzić się z naprawdę dużymi modelami w Azure Analysis Services. Zacznę od redukcji rozmiaru poprzez włączenie opcji, które normalnie nie są widoczne w Visual Studio. Przedstawię strategie partycjonowania dostosowane do potrzeb biznesowych. Na końcu pokażę jak optymalizować miary, aby działały wydajnie na dużych zbiorach danych. W skrócie –…

Partycjonowanie danych w rozwiązaniach Big Data

Partycjonowanie danych to jedna technik, pozwalająca znacząco poprawić wydajność naszych zapytań. Znajduje ona zastosowanie nie tylko w relacyjnych bazach danych, ale również jest powszechnie używana w przypadku przechowywania i przetwarzania dużych zbiorów danych nazywanych powszechnie Big Data. Na sesji przyjrzymy się mechanizmom partycjonowania i dystrybucji danych dostępnych w usługach Azure Data Lake Analytics, Apache Hive…

Performance Tuning dla Specialistów Business Intelligence

W świecie Business Intelligence i hurtowni danych wydajność jest niezwykle ważnym aspektem. Skończony czas potrzebny na dokonanie wszelkiego rodzaju transformacji i ograniczone zasoby sprzętowe mogą stanowić poważną przeszkodę dla wielu projektów. Podczas sesji przedstawione zostaną praktyki pozwalające uzyskać dobrą wydajność i bardziej stabilne rozwiązanie. Powiemy zarówno o technikach optymalizacyjnych użytecznych przy ładowaniu danych jak i…

Power BI i Report Server Power BI w korporacji, średniej oraz małej firmie. Największe wątpliwości klientów. 

Liczne spotkania architektoniczne z klientami różnej wielkości i poziomie rozwoju obszaru danych, sprowadzają się m.in do następujących wniosków: doceniamy wartość Self-Service, ale martwimy się potencjalnym chaosem danych, Power BI jako cudowne rozwiązanie wszelakich problemów, mamy już hurtownię, to po co nam Power BI czy jak udostępnić Power BI kilku tysiącom użytkowników jednocześnie mając go pod…

Power BI Report Server (PBIRS) – What / Why & How?

powerbi.com – as a cloud-based SaaS solution for self-service busines intelligence (BI) – is available since two years. Succeeding the Microsoft reporting roadmap announcements and it’s proposed cloud and on-premises feature parity the community had to wait for more than 1 year for news. With the release of the Power BI Report Server (PBIRS) in…

Power BI w praktyce

TBA

Power BI, a Mapa Polski powiatowej

Większość wizualizacji w Power BI wykorzystuje globalne analityki danych – kontynent, kraj, kluczowe miasta. Albo: Stany Zjednoczone, stan, hrabstwo. Do tego AdventureWorks, rzadziej Contoso, Wide World Importers. O Northwind mało kto pamięta. Globalna wioska jest przepełniona takimi właśnie danymi. Jednak kiedy analityk, deweloper chce tą myśl technologiczną przenieść na krajowe podwórko, to rzeczywistość może niemiło…

Power of Azure ML with Power BI

Azure Machine Learning is in very high demand and is been used by almost every digital organization. Come and learn Azure ML to customize Power BI reports to predict results and mainly for Power BI Developers and Data Scientists and analysts. We are not leaving top management people alone and without the need of customizing…

Power Platform w służbie działom HR

Procesy HR-owe obsłużone przy użyciu Power Platform: PowerApps, Power BI, Power Automate, ale nie tylko – również Sharepoint Online, ale także embedowanie Power BI w ISV apps.

Praca z bazą daną – czyli jak okiełznać starego potwora

Trafiłeś do projektu, który nigdy wcześniej nie miał Administratora Baz Danych?Twój manager oznajmił Ci, że od teraz Ty jesteś odpowiedzialny za utrzymanie Bazy? Baza ma tysiące obiektów, ale wiekszość z nich nie jest już używana?Lubisz wyzwania… ale w tej sytuacji nie wiesz od czego zacząć?Wbrew pozorom to nie jest to odosobniony przypadek. Na tej sesji…

Praktyczne utrzymanie dużych baz danych działających 24/7

Sesja poświęcona jest utrzymaniu dużych baz danych w kontekście defragmentacji indeksów bez przerw technicznych z wykorzystaniem współbieżności.