Hvernig á að gerast gagnafræðingur
Ferilhandbók BrainStation Data Scientist getur hjálpað þér að taka fyrstu skrefin í átt að ábatasaman feril í gagnavísindum. Handbókin veitir ítarlegt yfirlit yfir gagnafærni sem þú ættir að læra, bestu gagnaþjálfunarmöguleikana, starfsferil í gagnavísindum, hvernig á að verða gagnafræðingur og fleira.
Gerast gagnafræðingur
Talaðu við námsráðgjafa til að læra meira um hvernig bootcamps okkar og námskeið geta hjálpað þér að verða gagnafræðingur.
Með því að smella á Senda samþykkir þú okkar Skilmálar .
Sendu inn
Gat ekki sent inn! Uppfæra síðuna og reyna aftur?
Lærðu meira um Data Science Bootcamp okkarÞakka þér fyrir!
Við munum hafa samband fljótlega.
Skoða Data Science Bootcamp síðuna
Það eru margar leiðir til að verða gagnafræðingur, en vegna þess að það er almennt háttsett staða hafa gagnafræðingar jafnan verið vel menntaðir, meðal annars með gráður í stærðfræði, tölfræði og tölvunarfræði. Þetta er hins vegar farið að breytast.
Hvernig á að verða gagnafræðingur í átta skrefum:
- Lærðu grundvallaratriði í gagnafræði
- Vinna að gagnavísindaverkefnum til að þróa hagnýta gagnafærni þína
- Þróaðu safn til að sýna gagnafræðikunnáttu þína
- Sæktu um viðeigandi störf gagnafræðinga
skref 1Þróaðu rétta gagnafærni
Ef þú hefur enga starfsreynslu í gögnum geturðu samt orðið Data Scientist, en þú verður að þróa réttan bakgrunn til að vinna í átt að gagnavísindaferli. Gagnafræðingur er háttsett staða; Áður en þú nærð þeirri sérhæfingu, muntu vilja þróa breiðan grunn þekkingar á tengdu sviði. Það gæti verið stærðfræði, verkfræði, tölfræði, gagnagreining, forritun eða upplýsingatækni - sumir gagnafræðingar hafa jafnvel byrjað í fjármálum og hafnaboltaskátastarfi.
En hvaða sviði sem þú byrjar á ætti það að innihalda grundvallaratriðin: Python, SQL og Excel. Þessi færni verður nauðsynleg til að vinna með og skipuleggja hrá gögn. Það sakar ekki að þekkja Tableau líka, tól sem þú munt nota oft til að búa til sjónmyndir. Fylgstu með tækifærum til að hjálpa þér að byrja að hugsa eins og gagnafræðingur; því meira sem þessi bakgrunnur gerir þér kleift að vinna með gögn, því meira mun það hjálpa þér með næsta skref.
Skref 2Lærðu grundvallaratriði gagnafræði
Gagnafræðinámskeið eða bootcamp getur verið tilvalin leið til að öðlast eða byggja á grundvallaratriðum í gagnavísindum. Búast við því að læra grundvallaratriði eins og hvernig á að safna og geyma gögn, greina og líkana gögn og sjá fyrir sér og kynna gögn með því að nota hvert verkfæri í gagnavísindatólinu, þar á meðal sérhæfð forrit eins og sjónræn forritin Tableau og PowerBI – meðal annarra.
Í lok þjálfunar þinnar ættir þú að vera fær um að nota Python og R til að smíða líkön sem greina hegðun og spá fyrir um óþekkt, og geta endurpakkað gögnum í notendavænt form.
Margar atvinnuauglýsingar sýna háþróaða gráður sem skilyrði fyrir gagnafræðistörf. Stundum er það ekki samningsatriði, en eftir því sem eftirspurn er meiri en framboð er sönnunin í auknum mæli í búðingnum. Það er að segja, sönnunargögn um nauðsynlega hæfileika vega oft þyngra en bara persónuskilríki. Það sem skiptir mestu máli fyrir ráðningu stjórnenda er hæfileikinn til að sýna vald á viðfangsefninu á einhvern hátt og það er sífellt ljóst að þessi sýning þarf ekki að fylgja hefðbundnum leiðum.
Skref 3Lærðu lykil forritunarmál fyrir gagnafræði
Gagnafræðingar treysta á fjölda sérhæfðra verkfæra og forrita sem þróuð eru sérstaklega fyrir gagnahreinsun, greiningu og líkanagerð. Til viðbótar við almennan Excel Excel þurfa gagnafræðingar að þekkja tölfræðilegt forritunarmál eins og Python, R eða Hive og fyrirspurnamál eins og SQL.
Eitt af mikilvægustu verkfærum gagnafræðings er RStudio Server, sem styður þróunarumhverfi til að vinna með R á netþjóni. Opinn uppspretta Jupyter Notebook er annað vinsælt forrit, sem samanstendur af tölfræðilíkönum, gögnum, þ.e. vélnámsaðgerðum og fleira.
Gagnafræði felur í auknum mæli einnig í sér vélanám – verkfæri sem beita gervigreind til að gefa kerfum getu til að læra og verða nákvæmari án þess að vera beinlínis forrituð. Verkfærin sem notuð eru til vélanáms eru að miklu leyti háð forritinu - það er hvort þú ert að þjálfa tölvuna til að bera kennsl á myndir, til dæmis, eða draga þróun úr færslum á samfélagsmiðlum. Það fer eftir markmiðum sínum, Gagnafræðingar gætu valið úr fjölmörgum verkfærum þar á meðal h2o.ai, TensorFlow, Apache Mahout og Accord.Net.
Skref 4Vinna að gagnavísindaverkefnum til að þróa hagnýta gagnafærni þína
Þegar þú hefur lært grunnatriðin í forritunarmálunum og stafrænu verkfærunum sem gagnafræðingar nota geturðu byrjað að nota þau, æft nýfengna færni þína og byggt hana upp enn frekar. Reyndu að takast á við verkefni sem byggja á fjölbreyttri kunnáttu – með því að nota Excel og SQL til að stjórna og spyrjast fyrir um gagnagrunna, og Python og R til að greina gögn með tölfræðilegum aðferðum, byggja líkön sem greina hegðun og gefa nýja innsýn og nota tölfræðilega greiningu til að spá fyrir um óþekkt.
Þegar þú æfir, reyndu að snerta mismunandi stig í ferlinu, byrjaðu á fyrstu rannsóknum á fyrirtæki eða markaðsgeira, skilgreindu síðan og safnaðu réttum gögnum fyrir verkefnið, hreinsaðu og prófaðu þessi gögn til að hámarka notagildi þeirra. Að lokum geturðu búið til og beitt eigin reikniritum til að greina og móta þessi gögn, að lokum pakka þeim inn í auðlesið myndefni eða mælaborð sem gerir notendum kleift að hafa samskipti við og spyrjast fyrir um gögnin þín á einfaldan hátt. Þú gætir jafnvel æft þig í að kynna niðurstöður þínar fyrir öðrum til að bæta samskiptahæfileika þína.
Þú munt líka vilja æfa þig í að vinna með mismunandi gerðir gagna - texta, skipulögð gögn, myndir, hljóð og jafnvel myndband. Sérhver iðnaður notar sínar eigin gerðir af gögnum til að hjálpa leiðtoga að taka betri og upplýstari ákvarðanir. Sem starfandi gagnafræðingur munt þú líklega vera sérhæfður í aðeins einum eða tveimur - en sem byrjandi að byggja upp hæfileika þína, muntu vilja kynnast grundvallaratriðum eins margra tegunda og mögulegt er.
Að takast á við flóknari verkefni mun gefa þér tækifæri til að kanna allar leiðir sem hægt er að nota gögn. Þegar þú hefur náð tökum á því að nota lýsandi greiningar til að skoða gögn fyrir mynstur muntu vera í sterkari stöðu til að reyna að nota flóknari tölfræðiaðferðir eins og gagnanám, forspárlíkön og vélanám til að spá fyrir um framtíðarútkomu eða jafnvel búa til ráðleggingar.
Skref 5Þróaðu sjónmyndir og æfðu þig í að kynna þær
Notaðu forrit eins og Tableau, PowerBI, Bokeh, Plotly eða Infogram, æfðu þig í að byggja upp þínar eigin sjónmyndir frá grunni og finndu bestu leiðina til að láta gögnin tala sínu máli. Excel kemur við sögu jafnvel meðan á þessu skrefi stendur: þó að grunnforsenda töflureikna sé einföld – að gera útreikninga eða línurit með því að tengja upplýsingarnar í frumunum þeirra – er Excel enn ótrúlega gagnlegt eftir meira en 30 ár og er nánast óumflýjanlegt á sviði gagnavísinda.
En að búa til fallegar sjónmyndir er bara byrjunin. Sem gagnafræðingur þarftu líka að geta notað þessar sjónmyndir til að kynna niðurstöður þínar fyrir lifandi áhorfendum. Þessi samskiptahæfni gæti komið þér af sjálfu sér, en ef ekki, vertu viss um að hver sem er getur bætt sig með æfingum. Byrjaðu smátt, ef nauðsyn krefur - fluttu kynningar fyrir einn vin, eða jafnvel gæludýrið þitt - áður en þú ferð yfir í hópastillingu.
skref 6Búðu til eignasafn til að sýna kunnáttu þína í gagnafræði
Þegar þú hefur gert forrannsóknir þínar, fengið þjálfunina og æft nýja færni þína með því að byggja upp glæsilegt úrval verkefna, er næsta skref þitt að sýna þessa færni með því að þróa fágað eignasafn sem mun landa þér í draumastarfinu þínu. Reyndar getur eignasafnið þitt verið mikilvægasti þátturinn í atvinnuleit þinni. Data Science Bootcamp BrainStation, til dæmis, er hannað til að bjóða upp á verkefnabyggða reynslu sem hjálpar nemendum að byggja upp glæsilegt safn af fullgerðum raunverulegum verkefnum. Það er ein besta leiðin til að skera sig úr á vinnumarkaði.
Þegar þú sækir um stöðu gagnafræðings skaltu íhuga að sýna verk þín með GitHub til viðbótar við (eða í stað) þinnar eigin vefsíðu. GitHub sýnir auðveldlega ferlið þitt, vinnu og niðurstöður á sama tíma og eykur prófílinn þinn á opinberu neti. En ekki hætta þar. Eignasafnið þitt er tækifærið þitt til að sýna samskiptahæfileika þína og sýna fram á að þú getur gert meira en bara að marra tölurnar. Það er gagnlegt að sýna ýmsar mismunandi aðferðir, þar sem gagnavísindi eru ansi breitt svið - sem þýðir að það eru margar leiðir til að nálgast vandamál og margvíslegar aðferðir sem þú getur komið með að borðinu.
Fylgdu gögnum þínum með sannfærandi frásögn og sýndu vandamálin sem þú ert að vinna í að leysa svo vinnuveitandinn skilji verðleika þinn. GitHub gerir þér kleift að sýna kóðann þinn í stærra samhengi, frekar en í einangrun, sem gerir framlag þitt auðveldara að skilja.
Þegar þú ert að sækja um tiltekið starf skaltu ekki taka með alla vinnu þína. Leggðu áherslu á örfá atriði sem tengjast best stöðunni sem þú ert að sækja um, og sem mun best sýna hæfileika þína í öllu gagnavísindaferlinu – byrja með grunngagnasetti, skilgreina vandamál, gera hreinsun, byggja upp fyrirmynd, og að lokum finna lausn.
Skref 7Hækkaðu prófílinn þinn
Vel útfært verkefni sem þú tekur upp á eigin spýtur getur verið frábær leið til að sýna fram á hæfileika þína og heilla mögulega ráðningarstjóra. Veldu eitthvað sem þú hefur virkilegan áhuga á, spurðu spurningar um það og reyndu að svara þeirri spurningu með gögnum. Eins og getið er hér að ofan ættir þú líka að íhuga að sýna verk þín á GitHub.
Skráðu ferð þína og kynntu niðurstöður þínar - fallega sýndar - með skýrri útskýringu á ferlinu þínu, undirstrika tæknilega færni þína og sköpunargáfu. Gögnunum þínum ætti að fylgja sannfærandi frásögn sem sýnir vandamálin sem þú hefur leyst - undirstrikar ferlið þitt og skapandi skref sem þú hefur tekið - til að tryggja að vinnuveitandi skilji verðleika þinn.
Að gerast meðlimur gagnavísindanets á netinu eins og Kaggle er önnur frábær leið til að sýna að þú ert tengdur samfélaginu, sýna kótelettur þínar sem upprennandi gagnavísindamaður og halda áfram að efla bæði þekkingu þína og útbreiðslu þína.
skref 8Sæktu um viðeigandi gagnafræðistörf
Það eru mörg hlutverk innan gagnavísindasviðsins. Eftir að hafa öðlast nauðsynlega færni heldur fólk oft áfram að sérhæfa sig á ýmsum undirsviðum, svo sem gagnaverkfræðingum, gagnafræðingum eða vélanámsverkfræðingum, meðal margra annarra. Finndu út hvað fyrirtæki setur í forgang, hvað það er að vinna að og staðfestu að það henti styrkleikum þínum, markmiðum og því sem þú sérð sjálfan þig gera í framhaldinu. Og vertu viss um að líta út fyrir Silicon Valley: borgir eins og Boston, Chicago og New York búa við skort á tæknilegum hæfileikum, svo tækifærin eru mikil!
Bestu gagnafræðistörfin
Vegna þess að verkið sem gagnafræðingar vinna snertir svo margar mismunandi atvinnugreinar og greinar, ganga hlutverkin sem gagnafræðingar geta gegnt undir mörgum mismunandi nöfnum, þar á meðal:
- Gagnafræðingur
- Gagnafræðingur
- Gagnaarkitekt
- Gagnaverkfræðingur
- Tölfræðimaður
- Gagnagrunnsstjóri
- Viðskiptafræðingur
- Gagna- og greiningarstjóri
- Rannsakandi
- Vélnámsverkfræðingur
- Magngreiningarfræðingur
Það eru mörg önnur afbrigði þarna úti og þau munu halda áfram að þróast eftir því sem gagnavísindi verða sífellt algengari. En þó listinn yfir starfsheiti í gagnafræði kann að virðast endalaus, þá eru fjórir meginflokkar sem lýsa mismunandi hlutverkum sem gagnafræðingar gegna oftast,
Gagnaverkfræðingar safna, geyma og skipuleggja gögn. Atvinnuauglýsingar fyrir gagnaverkfræðinga munu venjulega tilgreina margvíslegar skyldur, þar á meðal hæfni til að afla ytri gagna, byggja gagnageymslur og hanna gagnalíkön – þrjú verkefni sem byggja einnig grunn fyrir gagnagreiningar og vélanám. Gagnaverkfræðingur er tiltölulega háþróuð fagleg staða og krefst því venjulega bakgrunns í tölvunarfræði, stærðfræði eða verkfræði, sem og þekkingu á SQL, Python, Java eða Ruby, og getu til að stjórna og hanna gagnagrunna.
Gagnafræðingar nota gögnin sem eru skipulögð og gerð aðgengileg með vinnu gagnaverkfræðings, breyta þeim í innsýn sem getur leyst vandamál, fínstillt vörur og hjálpað til við að taka sannreyndar ákvarðanir. Gagnafræðingar geta tekið flóknar upplýsingar og breytt þeim í tölfræði sem yfirmenn fyrirtækja geta notað til að upplýsa stefnumótun og áætlanagerð, oft í formi auðskiljanlegra gagnamynda eins og grafa og grafa. Tengd starfsheiti eru meðal annars rekstrarrannsóknarsérfræðingar og viðskiptagreindir. SQL er grunnurinn fyrir feril í gagnagreiningu, ásamt þekkingu á Python eða R, og getu til að búa til gagnamyndanir með hugbúnaði eins og Tableau.
Það fer eftir fyrirtækinu, búast má við að fólk með starfsheitið Data Scientist vinni vinnu gagnaverkfræðings og gagnafræðings (söfnun, skipuleggja og greina gögn), auk stefnumótandi gagnavinnu. Þar sem hlutverk gagnafræðingsins er frábrugðið hlutverki gagnafræðingsins og verkfræðingsins er í getu gagnafræðingsins til að leiða stórgagnastefnu fyrirtækisins með því að spyrja réttu spurninganna og þróa nýjar hugmyndir, vörur og þjónustu. Hér er þekking á Python, SQL og Tableau lykilatriði, ásamt öðrum forritunarmálum, skilningur á því hvernig gagnagrunnar eru byggðir og viðhaldið, sterk samskiptafærni. og viðskiptaviti.
Það er talsverð skörun á milli gagnafræðinga og vélanámsverkfræðinga; bæði vinna með gögn til að framleiða innsýn. Munurinn er sá að gagnafræðingar afhjúpa innsýn til að kynna fyrir fólki (til dæmis forstjórum og öðrum leiðtogum fyrirtækja), á meðan vélanámsverkfræðingar hanna hugbúnaðinn sem getur afhjúpað innsýn og lært af niðurstöðum eftir því sem fleiri og fleiri gögnum er safnað. Vélarnámsverkfræðingar eru háðir háþróaðri stærðfræðikunnáttu, forritunarfærni (í Python, R og Java), þekkingu á Hadoop, reynslu af gagnalíkönum og reynslu af því að vinna í lipuru umhverfi.
Góðu fréttirnar eru þær að nánast allar þessar stöður eru í mikilli eftirspurn. Ef þú hefur kunnáttu og reynslu í gagnavísindum ertu nú þegar í frábærri stöðu þegar kemur að starfsþróun og framförum.
Er gagnafræði vaxandi svið?
Já, gagnavísindasviðið er eitt það ört vaxandi í tækni, með meira en 2,7 milljónir nýrra starfa í gagnaspá.
Þessi vöxtur lítur líka út fyrir að halda áfram þegar tekið er tillit til aukins mikilvægis gagnakunnáttu. Samkvæmt 2020 Digital Skills Survey, telja 89 prósent sérfræðinga að bætt gagnafærni muni bæta árangur hjá fyrirtækinu sínu og 78 prósent telja að gervigreind sé sú tækni sem muni hafa mest áhrif á næstu árum.
Hver eru laun gagnafræðings?
Árið 2020 greindi Glassdoor frá því að meðallaun gagnafræðinga væru $84,000 á ári í Kanada og yfir $113,000 í Bandaríkjunum.
Hvernig verð ég gagnafræðingur án reynslu?
Jafnvel þó þú hafir enga starfsreynslu í gögnum, þá er samt hægt að verða gagnafræðingur. En áður en þú byrjar að kanna sérhæfingarnar á sviði gagnavísinda þarftu að þróa breiðan grunn þekkingar á skyldu sviði. Það gæti verið stærðfræði, verkfræði, tölfræði, gagnagreining, forritun eða upplýsingatækni - sumir gagnafræðingar hafa jafnvel byrjað í fjármálum og hafnaboltaskátastarfi.
Hvaða sviði sem þú byrjar á ætti það að innihalda grundvallaratriði: Python, SQL og Excel. Þessi færni verður nauðsynleg til að vinna með og skipuleggja hrá gögn. Til að fara frá gagnavísindum aðliggjandi sviði yfir í sjálft gagnavísindin þarftu að öðlast ákveðna færni, og áhrifaríkasta leiðin til að gera þetta er með því að skrá þig í gagnafræðinámskeið eða bootcamp með skipulögðu námsáætlun. Gagnafræðimenntun tryggir að þú náir yfir öll grunnatriðin - án þess að villast í illgresi óviðkomandi eða úreltra námssviða.
Búast við því að læra grundvallaratriði í gagnavísindum eins og gagnasöfnun og greiningu, gagnalíkanagerð, gagnasýn og gagnasjónunarverkfærin sem oftast eru notuð af gagnafræðingum. Í lok gagnafræðinámskeiðsins þíns ættir þú að vita hvernig á að nota Python, R og Hadoop og hvernig á að búa til líkön sem greina hegðun, spá fyrir um óþekkt og geta endurpakkað gögnum í notendavænt form.
Með færniþjálfun og sterku eignasafni geturðu byrjað að vinna að því að koma á opinberum prófíl þínum sem gagnafræðingur. Vel útfært verkefni sem þú vinnur sjálfur er frábær leið til að gera einmitt það. Veldu efni sem þú hefur virkilegan áhuga á, spurðu spurningar um það og reyndu að svara þeirri spurningu með gögnum. Birtu síðan verk þitt á GitHub til að kynna ferlið þitt, vinnu og niðurstöður til að draga fram tæknilega færni þína og sköpunargáfu í sannfærandi frásögn.