Jak rozpocząć karierę Data scientist? cz. 1

*** Generowanie leadów ***

Dowiedz się, czego musisz się nauczyć

Nauka o danych może być przytłaczającą dziedziną. Wiele osób powie, że nie możesz zostać naukowcem danych, dopóki nie opanujesz następujących zagadnień : statystyka, algebra liniowa, rachunek różniczkowy, programowanie, bazy danych, przetwarzanie rozproszone, uczenie maszynowe, wizualizacja, projektowanie eksperymentalne, klastrowanie, głębokie uczenie, przetwarzanie języka naturalnego, i więcej. To po prostu nieprawda.

***

IT investments – projekty IT

***

Czym dokładnie jest nauka o danych? Jest to proces zadawania interesujących pytań, a następnie odpowiadania na nie przy użyciu danych. Ogólnie rzecz biorąc, przepływ pracy w analizie danych wygląda tak:

  • Zadać pytanie
  • Zbierz dane, które mogą pomóc Ci odpowiedzieć na to pytanie
  • Wyczyść dane
  • Eksploruj, analizuj i wizualizuj dane
  • Zbuduj i oceń model uczenia maszynowego
  • Przekaż wyniki

Ten przepływ pracy niekoniecznie wymaga zaawansowanej matematyki, opanowania głębokiego uczenia się lub wielu innych umiejętności wymienionych powyżej. Wymaga to jednak znajomości języka programowania i umiejętności pracy z danymi w tym języku . I chociaż potrzebujesz biegłości matematycznej, aby stać się naprawdę dobrym w nauce o danych, potrzebujesz tylko podstawowej wiedzy z matematyki, aby zacząć.

Przyzwyczaj się do Pythona

Zarówno Python, jak i R są doskonałym wyborem jako języki programowania do nauki o danych. R jest bardziej popularny w środowisku akademickim, a Python jest bardziej popularny w przemyśle, ale oba języki mają wiele pakietów obsługujących przepływ pracy w nauce o danych. 

Nie musisz uczyć się zarówno Pythona, jak i R, aby zacząć. Zamiast tego powinieneś skupić się na nauce jednego języka i jego ekosystemu pakietów do nauki o danych . Jeśli wybrałeś Pythona (moja rekomendacja), możesz rozważyć instalację dystrybucji Anaconda, ponieważ upraszcza ona proces instalacji i zarządzania pakietami w systemach Windows, OSX i Linux.

Nie musisz też być ekspertem Pythona, aby przejść do kroku 2. Zamiast tego powinieneś skupić się na opanowaniu następujących elementów: typy danych, struktury danych, importy, funkcje, instrukcje warunkowe, porównania, pętle i wyrażenia. Wszystko inne może poczekać na później!

Dowiedz się więcej: Data science kariera

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *