Z zamiłowania statystyk i trochę programista. Od ponad pięciu lat mocno związany z R – przez co nigdy nie nauczył się Excela... Z tego powodu nie może sobie wpisać w CV – „Znajomość pakietu Office” (jak sam twierdzi, jest to raczej powód do dumy…). Czas wolny poświęca na działanie w ramach eRki (Entuzjastów R Krakowska Alternatywa) promując R gdzie tylko się da.
Nie taki C++ straszny jak go połączysz z R
Rcpp jest to pakiet który dosyć mocno ugruntował swoją pozycję w środowisku R (prawie 4 miliony pobrań wg. http://cranlogs.r-pkg.org/badges/grand-total/Rcpp i ponad 600 pakietów zależnych na CRAN). Sam Rcpp umożliwia w miarę bezbolesne włączenie kodu C++ do R - co jednak można zyskać na takim połączeniu? Kiedy opłaca się to zrobić? Co może pójść nie tak? Jakie mogą być skutki nieuważnego wykorzystywania pomostu pomiędzy R i C++? Jak się przed nimi chronić? Na te i inne pytania znajdzie się odpowiedź w czasie prezentacji. A wszystko to będzie okraszone przykładami z powstającego właśnie pakietu FSelectorRcpp (https://github.com/mi2-warsaw/FSelectorRcpp) - który jak sama nazwa wskazuje - wykorzystuje Rcpp.
Michał Janusz - data scientist – rozwiązuje problemy zwiększenia ciągłości produkcji papieru w Sappi Europe w oparciu o modele liniowe i metody maszynowe dostępne w środowisku R. Optymalizował rekalmę internetu w popularnym protalu internetowym. Pracował w pierwszym w Polsce projekcie BIG DATA z danymi systemów bankowych w Alior Bank SA. Z technologią przetwarzania dużych wolumentów danych spotkał się po raz pierwszy w fizyce cząstek elementarnych. Następnie w firmie COMARCH SA. Pracował z rozwiązaniami typu In Memory Data Grid wdrażając system maklerski.
Zastosowanie modelowania w R może przyczynić się do zrozumienia wpływu czynników na właściwości fizyczne produktu. Celem jest pokazanie problemów w ciągłości produkcji oraz pokazanie kroków analizy danych od kuchni. Okazuje się, że podstawowe modele są bardzo efektywne. Prelekcja pokazuje jak skonfigurować środowisko pracy aby poźniej ciekawie i łatwo prezentować wyniki.