ws Szkoła Z Piekła Rodem

"Standardowa edukacja zapewni Ci przeżycie. Samokształcenie - fortunę".   Jim Rohn

"Jeśli trwacie w nauce mojej, jesteście prawdziwie moimi uczniami i POZNACIE PRAWDĘ ,A PRAWDA WAS WYZWOLI"    - Jezus z Nazaretu


Data Science

Zaczynamy! Na początek proponujemy Intro do Nauki o Danych. Zanim zdecydujeszz się iść dalej, Drogi Czytelniku, dobrze wiedzieć z czym ma się do czynienia.

Data Science-Intro [PDF]

Data Science-Intro [EPUB]

Data Science-Intro [MOBI]


 Polecamy również [dostępne wkrótce] Pytania (i Odpowiedzi) o Data Science…:

Pytanie 1. Co to jest system polecający?

Odpowiedź: System rekomendacji jest obecnie szeroko stosowany w wielu dziedzinach, takich jak rekomendacje filmów, preferencje muzyczne, tagi społecznościowe, artykuły badawcze, zapytania wyszukiwania i tak dalej. Systemy rekomendujące działają na zasadzie filtrowania opartego na współpracy i treści lub poprzez wdrażanie podejścia opartego na osobowości. Ten typ systemu działa w oparciu o przeszłe zachowanie danej osoby w celu zbudowania modelu na przyszłość. Pozwoli to przewidzieć przyszły zakup produktu, oglądanie filmów lub czytanie książek przez ludzi. Tworzy również podejście filtrujące, wykorzystujące dyskretne cechy elementów, jednocześnie zalecając dodatkowe elementy.

Pytanie 2. Porównanie programowania Sas, R i Python?

Odpowiedź:

SAS: jest to jedno z najczęściej używanych narzędzi analitycznych używanych przez niektóre z największych firm na świecie. Ma jedne z najlepszych funkcji statystycznych, graficzny interfejs użytkownika, ale może mieć swoją cenę i dlatego nie może być łatwo przyjęty przez mniejsze przedsiębiorstwa
R: Najlepsze w R jest to, że jest to narzędzie Open Source i dlatego jest hojnie używane przez środowisko akademickie i społeczność naukową. Jest to solidne narzędzie do obliczeń statystycznych, reprezentacji graficznej i raportowania. Ze względu na swój charakter open source jest zawsze aktualizowany o najnowsze funkcje, a następnie łatwo dostępny dla każdego.
Python: Python to potężny język programowania open source, który jest łatwy do nauczenia, dobrze współpracuje z większością innych narzędzi i technologii. Najlepsze w Pythonie jest to, że ma niezliczone biblioteki i moduły stworzone przez społeczność, co czyni go bardzo niezawodnym. Posiada funkcje do operacji statystycznych, budowania modeli i nie tylko.

Pytanie 3. Wyjaśnij różne zalety języka R?

Odpowiedź: Język programowania R zawiera zestaw oprogramowania, który jest używany do reprezentacji graficznej, obliczeń statystycznych, manipulacji danymi i obliczeń. Oto niektóre z najważniejszych cech środowiska programowania języka R:

•  Obszerny zbiór narzędzi do analizy danych
•  Operatory do wykonywania obliczeń na macierzy i tablicy
•  Technika analizy danych do reprezentacji graficznej
•  Wysoce rozwinięty, ale prosty i skuteczny język programowania
•  Szeroko obsługuje aplikacje uczenia maszynowego
•  Działa jako łącznik między różnymi programami, narzędziami i zbiorami danych
•  Twórz wysokiej jakości powtarzalne analizy, które są elastyczne i wydajne
•  Zapewnia solidny ekosystem pakietów dla różnych potrzeb
•  Jest to przydatne, gdy musisz rozwiązać problem związany z danymi

Pytanie 4. W jaki sposób analitycy danych wykorzystują statystyki?

Odpowiedź: Statystyki pomagają naukowcom zajmującym się danymi analizować dane w poszukiwaniu wzorców, ukrytych spostrzeżeń i przekształcać Big Data w Big Insights. Pomaga lepiej zrozumieć, czego oczekują klienci. Naukowcy zajmujący się danymi mogą dowiedzieć się o zachowaniach konsumentów, zainteresowaniach, zaangażowaniu, utrzymaniu i wreszcie konwersji dzięki wnikliwym statystykom. Pomaga im budować potężne modele danych w celu walidacji pewnych wniosków i prognoz. Wszystko to można przekształcić w potężną propozycję biznesową, dając użytkownikom to, czego chcą, dokładnie wtedy, gdy tego chcą.

Pytanie 5. Co to jest regresja logistyczna?

Odpowiedź: Jest to technika statystyczna lub model służący do analizy zbioru danych i przewidywania wyniku binarnego. Wynik musi być wynikiem binarnym, który wynosi zero lub jeden albo tak lub nie.

Pytanie 6. Dlaczego czyszczenie danych jest ważne w analizie danych?

Odpowiedź: W przypadku danych pochodzących z wielu źródeł ważne jest, aby upewnić się, że są wystarczająco dobre do analizy. Tutaj właśnie czyszczenie danych staje się niezwykle istotne. Oczyszczanie danych szeroko obejmuje proces wykrywania i korygowania zapisów danych, zapewniając, że dane są kompletne i dokładne, a składniki danych, które nie mają znaczenia, są usuwane lub modyfikowane zgodnie z potrzebami. Ten proces można wdrożyć jednocześnie z poprawianiem danych lub przetwarzaniem wsadowym. Po wyczyszczeniu danych potwierdza się to z regułami zbiorów danych w systemie. Czyszczenie danych jest istotną częścią nauki o danych, ponieważ dane mogą być podatne na błędy wynikające między innymi z zaniedbań człowieka, uszkodzenia podczas przesyłania lub przechowywania. Oczyszczanie danych pochłania ogromną ilość czasu i wysiłku naukowca zajmującego się danymi ze względu na wiele źródeł, z których pochodzą dane oraz szybkość, z jaką one pochodzą.

Pytanie 7. Opisz analizę jednowymiarową, dwuwymiarową i wielowymiarową.

Odpowiedź : Jak sugeruje nazwa, są to metodologie analityczne z jedną, podwójną lub wieloma zmiennymi. Tak więc analiza jednoczynnikowa będzie miała jedną zmienną i przez to nie ma żadnych związków, przyczyn. Głównym aspektem analizy jednowymiarowej jest podsumowanie danych i znalezienie w nich wzorców w celu podjęcia decyzji umożliwiających podjęcie działań. Analiza dwuwymiarowa dotyczy relacji między dwoma zestawami danych. Te zestawy sparowanych danych pochodzą z powiązanych źródeł lub próbek. Istnieją różne narzędzia do analizy takich danych, w tym testy chi-kwadrat i testy t, gdy dane mają korelację. Jeśli dane można określić ilościowo, można je przeanalizować za pomocą wykresu lub wykresu rozrzutu. Siła korelacji między dwoma zestawami danych będzie wynosić przetestowane w analizie dwuwymiarowej.

Pytanie 8. W jaki sposób uczenie maszynowe jest wdrażane w rzeczywistych scenariuszach?

Odpowiedź: Oto kilka scenariuszy, w których uczenie maszynowe znajduje aplikacje w świecie rzeczywistym:

E-commerce: zrozumienie odpływu klientów, wdrażanie ukierunkowanych reklam, remarketing.
Wyszukiwarka: ranking stron w zależności od osobistych preferencji osoby wyszukującej
Finanse: ocena możliwości i ryzyka inwestycyjnego, wykrywanie nieuczciwych transakcji
Medicare: projektowanie leków w zależności od historii i potrzeb pacjenta
Robotyka: uczenie maszynowe do obsługi sytuacji, które są poza zwyczajowymi
Media społecznościowe: zrozumienie relacji i rekomendowanie połączeń
Wydobywanie informacji: formułowanie pytań w celu uzyskania odpowiedzi z baz danych w Internecie.




Drogi Czytelniku…

… tak , tak, do Ciebie się zwracam :)… Miło mi poinformować ,że we wspólpracy z  :  Magazynem "ZSF24"  ,  Magazynem "Chacker in ACT(A)ion"  oraz serwisem Artificial Intelligence Experts, NASZA Szkoła, Szkoła Z Piekła Rodem, ropoczyna Wielki Projekt, którego celem jest przygotowanie [zainteresowanych] do zawodów przyszlości [patrz poniżej]. Ponieważ nie mamy (jeszcze) ambicji na miarę Uniwersytetu Stanforda czy innego Oxfordu, dostarczymy Ci Drogi Przyjacielu wystarczająco solidne fundamenty, na któych będziesz mógł zbudować swoją przyszłość zawodową indywidualnie lub w firmie szukającej takich ludzi jak TY.

Od czego zaczniemy? Zaczniemy od Data Sience. Jak mówi nam Wikipedia:

Danologia (ang. Data Science) - interdyscyplinarne pole używające naukowych metod, procesów, algorytmów i systemów do wydobywania spostrzeżeń z wielu danych strukturalnych i nieustrukturyzowanych. Danologia jest powiązana z eksploracją danych (ang. data mining), uczeniem maszynowym (ang. machine learning) i analizą dużych zbiorów danych (ang. big data). Danologia wykorzystuje statystykę, analizę danych, uczenie maszynowe, wiedzę dziedzinową (ang. domain knowledge) i powiązane metody w celu zrozumienia i analizy danych

Jak już widać z samej definicji jest to dość duży obszar wiedzy… ale spokojnie, poradzimy sobie z nim wspólnie. Zaczniemy od wprowadzania "Data Science" stopnipowo rozszerzając Twoją wiedzę o kolejne składniki.

Jeśli byłbyś zaintersowany któymś z poniższych tematów, napisz : ela@szkolazpieklarodem.pl



Data Scientist

Big Data

Big data - termin odnoszący się do dużych, zmiennych i różnorodnych zbiorów danych, których przetwarzanie i analiza jest trudna, ale jednocześnie wartościowa, ponieważ może prowadzić do zdobycia nowej wiedzy

Machine Learning

Uczenie maszynowe to technologia, która - zamiast precyzyjnie programować komputery — uczy je wykonywania zadań na podstawie analizy danych.

Data Scientist

Data Mining

Eksploracja danych, pozyskiwanie danych, ekstrakcja danych, drążenie danych, wydobywanie danych – jeden z etapów procesu uzyskiwania wiedzy z baz danych. Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka prawidłowości w danych zgromadzonych w hurtowniach danych

Deep Learning

Deep learning - jest to podkategoria uczenia maszynowego i polega na tworzeniu sieci neuronowych, które mają za zadanie udoskonalić technikę rozpoznawania głosu, przetwarzania języka naturalnego. Znajduje również zastosowanie w bioinformatyce i projektowaniu leków.

Data Scientist

Marketing Cyfrowy

Marketing cyfrowy - marketing polegający na wykorzystaniu mediów cyfrowych w celu dotarcia do konsumentów. Wyróżnić można kanały komunikacji takie jak: poczta elektroniczna, media społecznościowe, treści, optymalizacja dla wyszukiwarek internetowych.

(Industrial)Internet of Things

Internet rzeczy, internet przedmiotów - koncepcja, wedle której jednoznacznie identyfikowalne przedmioty mogą pośrednio albo bezpośrednio gromadzić, przetwarzać lub wymieniać dane za pośrednictwem instalacji elektrycznej inteligentnej KNX lub sieci komputerowej.
Przemysłowy Internet rzeczy odnosi się do połączonych ze sobą czujników, instrumentów i innych urządzeń połączonych w sieć z przemysłowymi aplikacjami komputerowymi, w tym produkcją i zarządzaniem energią.

Narzędzia

Python

Python - język programowania wysokiego poziomu ogólnego przeznaczenia, o rozbudowanym pakiecie bibliotek standardowych, którego ideą przewodnią jest czytelność i klarowność kodu źródłowego. Jego składnia cechuje się przejrzystością i zwięzłością.

R

GNU R - interpretowany język programowania oraz środowisko do obliczeń statystycznych i wizualizacji wyników.


10 Pożądanych Zawodów Przyszłości

[według Employer Branding Book 2021]


• 01.Analityk Danych

• 02.Specjalisa ds. Sztucznej inteligencji i Machine Learning

• 03.Specjalista ds. Big Data

• 04.Specjalista ds. Marketingu Cyfrowego

• 05.Specjalista ds. Automatyzacji Procesów

• 06.Specjalista ds. Bezpieczeństwa Informacji

• 07.Specjalista ds. Transformacji Cyfrowej

• 08.Analityk ds. Bezpieczeństwa Informacji

• 09.Specjalista ds. Oprogramowania i Aplikacji

• 10.Specjalista ds. Internet of Things


…Już wkrótce w Szkole…


5G : ZABÓJCA CZY PRZYJACIEL?

[SPRAWDŹ SAM !]



SZTUCZNA INTELIGENCJA: OD ŚRODKA

[aie24.pl]



ZOSTAŃ ZAWODOWYM BLOGEREM

[fourblogs.pl]



JAK ZRÓWNOWAŻONE JEST TWOJE ŻYCIE?

[TEST]


Wesprzyj Szkołę, kliknij w Reklamę…Dziękujemy…





Tradycja zobowiązuje…


W 1967 roku, mój śp. Tata wybudował Szkołę, prawdziwą , fizyczną szkołę "z krwi i kości", której przez wiele lat był Dyrektorem…Minęły lata, czasy się zmieniły, pytanie tylko czy na lepsze, a zdobywanie Wiedzy nadal "jest w modzie".

Po trwającej wiele lat "burzy mózgów", a dokładnie od 2003 roku, korzystając z najnowszych zdobyczy techniki i technologii, obecnych i przyszłych, na bazie zdobytego w tzw. międzyczasie, doświadczenia i międzynarodowych znajomości, została podjęta decyzja o "zbudowaniu" Szkoły.

Będzie to intelektualne wyzwanie rzucone mojemu największemu Autorytetowi. Czy okażę się godnym następcą, czy "zginę" pośród innych , podobnych przedsięwzięć. Dlatego zwracam się do Was ,Drodzy Odwiedzający, starym, dobrze znanym hasłem:

POMOŻECIE !?


General Manager Szkoły Z Piekła Rodem  , Remigiusz



IV Rewolucja Przemysłowa

"Czwarta rewolucja przemysłowa : uogólniająca koncepcja odnosząca się do pojęcia "rewolucji przemysłowej" w związku ze współczesnym wzajemnym wykorzystywaniem automatyzacji, przetwarzania i wymiany danych oraz technik wytwórczych."  (Wikipedia)