*** Generowanie leadów ***
Dowiedz się, czego musisz się nauczyć
Nauka o danych może być przytłaczającą dziedziną. Wiele osób powie, że nie możesz zostać naukowcem danych, dopóki nie opanujesz następujących zagadnień : statystyka, algebra liniowa, rachunek różniczkowy, programowanie, bazy danych, przetwarzanie rozproszone, uczenie maszynowe, wizualizacja, projektowanie eksperymentalne, klastrowanie, głębokie uczenie, przetwarzanie języka naturalnego, i więcej. To po prostu nieprawda.
***
IT investments – projekty IT
***
Czym dokładnie jest nauka o danych? Jest to proces zadawania interesujących pytań, a następnie odpowiadania na nie przy użyciu danych. Ogólnie rzecz biorąc, przepływ pracy w analizie danych wygląda tak:
- Zadać pytanie
- Zbierz dane, które mogą pomóc Ci odpowiedzieć na to pytanie
- Wyczyść dane
- Eksploruj, analizuj i wizualizuj dane
- Zbuduj i oceń model uczenia maszynowego
- Przekaż wyniki
Ten przepływ pracy niekoniecznie wymaga zaawansowanej matematyki, opanowania głębokiego uczenia się lub wielu innych umiejętności wymienionych powyżej. Wymaga to jednak znajomości języka programowania i umiejętności pracy z danymi w tym języku . I chociaż potrzebujesz biegłości matematycznej, aby stać się naprawdę dobrym w nauce o danych, potrzebujesz tylko podstawowej wiedzy z matematyki, aby zacząć.
Przyzwyczaj się do Pythona
Zarówno Python, jak i R są doskonałym wyborem jako języki programowania do nauki o danych. R jest bardziej popularny w środowisku akademickim, a Python jest bardziej popularny w przemyśle, ale oba języki mają wiele pakietów obsługujących przepływ pracy w nauce o danych.
Nie musisz uczyć się zarówno Pythona, jak i R, aby zacząć. Zamiast tego powinieneś skupić się na nauce jednego języka i jego ekosystemu pakietów do nauki o danych . Jeśli wybrałeś Pythona (moja rekomendacja), możesz rozważyć instalację dystrybucji Anaconda, ponieważ upraszcza ona proces instalacji i zarządzania pakietami w systemach Windows, OSX i Linux.
Nie musisz też być ekspertem Pythona, aby przejść do kroku 2. Zamiast tego powinieneś skupić się na opanowaniu następujących elementów: typy danych, struktury danych, importy, funkcje, instrukcje warunkowe, porównania, pętle i wyrażenia. Wszystko inne może poczekać na później!
Dowiedz się więcej: Data science kariera